1 min to read
如何优化现有机器学习系统
可以认为机器学习系统由算法和功能两部分构成,工程技术是系统的骨架,而算法是系统的精髓;系统优化一方面是完善系统“骨架”,使系统更加健全。另一方面是提升算法效果。
算法
机器学习得到比较快的发展主要依赖于数据、算法、算力。
1、增加数据集,使用更复杂的算法
2、寻求更有效的特征
3、从badcase入手,在现有算法基础上,分门别类的解决badcase
实践经验
线上线下效果不一致,线下有提升,线上没提升:
- 排查特征穿越
- 训练集和测试集的划分是否合理
- 线上数据与线下训练、测试数据分布是否一致
- 线上线下数据流是否一致等
线下效果提升:
连续特征离散化、归一化处理;
特征覆盖度提升;
特征交叉;
深入理解业务,挖掘新的模型设计思路;比如新增召回策略、引入新的特征或者特征处理方式
增加系统实时性,比如:加入实时特征
Comments