对于Weka Explorer (GUI),当我们为任何给定的ARFF文件做10倍的简历时,Weka Explorer提供的(据我所见)是所有10倍的平均结果。
Q.有什么方法可以得到每个折叠的结果吗?例如,我需要每个折叠的错误率(错误标识的实例)。
帮助感激。
发布于 2012-06-03 10:44:13
我认为使用Weka的GUI是可能的。您需要使用的是实验者,而不是资源管理器。以下是几个步骤:
从GUI选择器打开top-right)
New按钮@输入一个文件名和在Results Destination中的位置,以便将结果保存到Number of (cross-validation) folds设置为您喜欢的Number of (cross-validation) folds)H 212H 113添加数据集(如果您的数据集需要预处理,那么您应该先在资源管理器中进行此操作,然后保存预处理数据集)H 214H 115设置Number of repetitions (我建议1开始)添加要测试的算法(再次简单启动,从一个algorithm)开始
Fold
For
转到Run选项卡,等待实验完成,然后转到Analyse选项卡,然后通过单击Row select:>D37 select:Percent_incorrect或Number_incorrect (或您希望看到的任何其他度量)H 240H 141导入实验结果,您现在可以看到每个fold的指定结果。
发布于 2012-06-02 13:01:22
在使用交叉验证选项时,Weka Explorer没有给出单个折叠的结果的选项,有一些解决办法。如果您显式地不想更改任何代码,则需要执行一些手动操作,但我认为这或多或少地满足了您的需要。
选择classifier
Cross-validation,选择Percentage split并将其设置为90%
More options...,并将Random seed for XVal / % Split值更改为未使用10次的东西。G 213但是,这并不完全等同于10倍交叉验证,因为这样做的伪折叠可能会重叠。
另一种等效于交叉验证,但更麻烦的方法是使用无监督的实例过滤器RemoveFolds或RemoveRange手动完成10次。生成和保存10个训练集和10个测试集。然后,对每个折叠,加载训练集,在分类选项卡中选择Supplied test set,然后选择适当的测试折叠。
https://stackoverflow.com/questions/10860264
复制相似问题