作业帮 > 综合 > 作业

模式识别中训练集和预测集的比例大概是多少?当我训练集识别率较高,但预测集识别率较低,该怎么办~

来源:学生作业帮 编辑:拍题作业网作业帮 分类:综合作业 时间:2024/05/21 17:27:33
模式识别中训练集和预测集的比例大概是多少?当我训练集识别率较高,但预测集识别率较低,该怎么办~
你用的什么模型?
原因可能有:
1.训练样本随机化不够 -- 解决方法:重新随机取样
2.过学习 -- 如果模型有flexible系数,可以调节这个;如果没有,可以考虑调整参数弱化分类强度,使用boosting
3.选用算法、模型、参数的泛化能力不够,可以使用交叉验证的方法试试泛化能力.
最大的可能性是3
再问: 我用的是支持向量机的方法来做的~从哪里可以知道算法、模型、参数的泛化能力不够,又该如何用交叉验证的方法试试泛化能力~O(∩_∩)O谢谢
再答: 交叉验证就是把训练集划成若干子集,用其中一部分来训练,另一部分来校验,如果对另一部分的预测准确率不高,则说明泛化能力较低。 你可以参考一下别人的经验更换核函数及调整核函数的参数。 过拟合(过学习)本身也是造成泛化能力差的原因,可以适当减小惩罚系数和增大松驰因子降低过拟合可能性。 另外要注意样本点的分布情况,是不是各类样本个数均衡,如果有偏倚,要注意对样本点较少的类做保护。