看起来你是新来的。登录或注册开始。
然后,一旦确定了一个区域,使用更紧密的网格。这是正确的吗?
< ?xml version="1.0" encoding="UTF-8" standalone="no"?><过程version = " 5.0 " >> <上下文<输入/ ><输出/ ><宏/ >> < /上下文< /操作符>< /操作符>< /操作符>< /操作符>> < /过程<列出关键= " application_parameters " / >< /操作符>< /操作符>> < /过程< /操作符>> < /过程< /操作符>> < /过程
感谢您的回复,并祝贺您获得论文奖提名。
我认为我的问题是,似乎每个数据点都变成了一个支持向量,这让我相信模型记住了数据,而不是学习任何模式。我已经尝试添加一个优化参数操作符网格和进化来调整窗口大小,以及内核类型,c和epsilon值。
然后我计划添加输入,几篇论文建议使用不同长度的移动平均线和小波变换,Ralf Klinkenberg建议使用傅里叶变换。
答案
http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf
最好在C = 2^- 5,2 ^-3 ....上使用松散网格搜索2^15和= 2^-15 2^-13 ....2^3,然后一旦确定了一个区域,使用更紧的网格。这是正确的吗?
他们还推荐使用RBG内核的libSVM。
另一篇论文建议使用混合系统。
非线性支持向量机模型紧随其后
利用线性支持向量机预测残差的非线性数据模式
模式。”
这可以用“堆叠”算子来实现吗?
谢谢,
克莱奥。
关于先执行全局模型后用非线性模型预测残差:这有时会有帮助。Stefan r
欢呼,
Ingo
感谢您的回复,并祝贺您获得论文奖提名。2010年2月9日,我参加了Ralf Klinkenberg的“使用RapidMiner进行金融数据挖掘”课程,并试图复制他所呈现的结果,但没有成功。
Ralf Klinkenberg演示的第一个过程使用标准普尔500指数的收盘价作为唯一的输入,我在他的4.6版本的基础上制作了一个非常简单的5.0版本。
我认为我的问题是,似乎每个数据点都变成了一个支持向量,这让我相信模型记住了数据,而不是学习任何模式。我已经尝试添加一个优化参数操作符网格和进化来调整窗口大小,以及内核类型,c和epsilon值。
然后我计划添加输入,几篇论文建议使用不同长度的移动平均线和小波变换,Ralf Klinkenberg建议使用傅里叶变换。
你有什么改进这个型号的建议吗?
欢呼,
克莱奥。
数据
http://dl.dropbox.com/u/3978768/daily_sap.csv
一般来说,我建议也优化适当的核参数,例如,对于径向基函数核函数,使用gamma(或sigma)。这些参数与C的组合通常比其他所有SVM参数都重要得多。还建议考虑窗口大小。
这是很重要的一点:我还建议你把注意力转移到提取额外的特征上,并认为这比实际的学习方案重要得多。适当的特征加上简单的线性回归通常比高度优化的支持向量机或神经网络表现得更好。另一方面,使用那些更复杂的非线性学习方案通常不会在优化好的特征空间上增加更多的准确性。
所有提到的附加特征都有帮助,我还会考虑从频率空间甚至相位空间中提取的附加单个特征。
欢呼,
Ingo