# 模型优化

# 数据

数据的质量决定模型表现的上限

检查:

  1. 数据属性的意义,是否为无关数据 =>
    删除不必要的属性 => 减少过拟合、节约运算时间
  2. 不同属性数据的数量级差异性如何 =>
    数据预处理:归一化、标准化 => 平衡数据影响,加快训练收敛
  3. 是否有异常数据 =>
    是否保留或过滤掉异常数据 => 提高鲁棒性
  4. 数据样本数量是否足够 => 扩大数据样本
  5. 采集数据的方法是否合理,采集到的数据是否有代表性
  6. 对于标签结果,要确保标签判定规则的一致性(统一标准)

# 不同的模型

尝试不同的模型,对比模型表现 => 帮助确定更合适的模型

# 核心参数

遍历核心参数组合,评估模型表现