# 模型优化
# 数据
数据的质量决定模型表现的上限
检查:
- 数据属性的意义,是否为无关数据 =>
删除不必要的属性 => 减少过拟合、节约运算时间 - 不同属性数据的数量级差异性如何 =>
数据预处理:归一化、标准化 => 平衡数据影响,加快训练收敛 - 是否有异常数据 =>
是否保留或过滤掉异常数据 => 提高鲁棒性 - 数据样本数量是否足够 => 扩大数据样本
- 采集数据的方法是否合理,采集到的数据是否有代表性
- 对于标签结果,要确保标签判定规则的一致性(统一标准)
# 不同的模型
尝试不同的模型,对比模型表现 => 帮助确定更合适的模型
# 核心参数
遍历核心参数组合,评估模型表现