wdmatlab2012
2012-04-16, 20:54
在协同过滤中设计好算法后要用有关数据集对算法测试实验,实验集合为什么要分成训练集合测试集,将数据集分成这两种集合是要做对比吗?那该怎么做对比呢?是将算法分别应用于测试集训练集吗?难道算法在训练集中的得出的预测分数矩阵就是测试集的相应用户对相应电影的真实评分吗?
再有我在MovieLens data sets 下载的数据集中有分好的训练集和测试集,是应该在这个分好的数据集上做算法测试吗?我看到现有的一些论文中都是自己将数据集按照20%H和80%分成测试集和训练集,非得自己分吗?如果可以直接用网站上分好的数据集,是每个数据集都要测还是选一个分好的数据集测试就行?因为网站上把数据集分成了5个测试集和5个相应的训练集。
本人正在做毕设,很多问题不明白,希望高人指点迷津!谢谢诸位!
再有我在MovieLens data sets 下载的数据集中有分好的训练集和测试集,是应该在这个分好的数据集上做算法测试吗?我看到现有的一些论文中都是自己将数据集按照20%H和80%分成测试集和训练集,非得自己分吗?如果可以直接用网站上分好的数据集,是每个数据集都要测还是选一个分好的数据集测试就行?因为网站上把数据集分成了5个测试集和5个相应的训练集。
本人正在做毕设,很多问题不明白,希望高人指点迷津!谢谢诸位!