如何优化现有机器学习系统

Featured image

可以认为机器学习系统由算法和功能两部分构成,工程技术是系统的骨架,而算法是系统的精髓;系统优化一方面是完善系统“骨架”,使系统更加健全。另一方面是提升算法效果。

算法

机器学习得到比较快的发展主要依赖于数据、算法、算力。
1、增加数据集,使用更复杂的算法
2、寻求更有效的特征
3、从badcase入手,在现有算法基础上,分门别类的解决badcase

实践经验
线上线下效果不一致,线下有提升,线上没提升:

线下效果提升:
连续特征离散化、归一化处理;
特征覆盖度提升;
特征交叉;
深入理解业务,挖掘新的模型设计思路;比如新增召回策略、引入新的特征或者特征处理方式
增加系统实时性,比如:加入实时特征

工程