机器学习项目到处都是坑?你需要谷歌的工程实践“葵花宝典”

原作 Martin Zinkevich

Root 假装发自第二个宇宙中心

量子位 出品 | 公众号 QbitAI

泡在机器学习研(ju)究(keng)里的你,可能遇到过以下问题:

  • 这个问题能不能用机器学习方法解决?
  • 特征的选取标准怎么定?哪些特征要保留?哪些特征该弃用?
  • 模型在训练时表现还不错,为什么到了应用环境就挂了?

机器学习项目到处都是坑?你需要谷歌的工程实践“葵花宝典”

今天,谷歌开发者推特账号终于上线了《机器学习规则(Rules of Mahchine Learning)》的中文版(撒花.gif)。

这本“葵花宝典”可是汇聚了谷歌大脑高级科学家Martin Zinkevich开发Yoututbe、Google Play、Google Plus等谷歌重磅级产品后的血泪,总共包含43条规则,全文干货满满。

机器学习项目到处都是坑?你需要谷歌的工程实践“葵花宝典”

总的来讲,这篇总结的结构大概是这样:

第一部分帮助大家了解,构建机器学习系统之前要明确可实现的目标如何设计;

第二部分介绍了机器学习工程的第一个的阶段:如何部署第一个管道。保证易用的同时,还要单独进行测试,选择一个可观察可归因的简单指标;

第三部分谈到了新特征的添加发布、迭代、如何评估模型,以及如何应对训练-应用偏差;

最后一部分介绍了当大家达到稳定阶段时该怎么做。

文章特别特别强调了做机器学习的工程项目的一个核心理念:

要打造优质的产品,就请把自己看成是一位出色的工程师,而不是一位机器学习专家。

以后再遇到什么问题,回来翻翻这本机器学习工程实践就好。相信你到时会有打通六脉的感觉。

附上《机器学习规则(Rules of Mahchine Learning)》中文版原文:

https://developers.google.com/machine-learning/rules-of-ml/#before_machine_learning

p.s.友情提示:全文一万六千多字,建议先收藏,找个月黑风高没人打扰的夜晚,到PC端上慢慢研读:)

机器学习项目到处都是坑?你需要谷歌的工程实践“葵花宝典”

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ’ᴗ’ ի 追踪AI技术和产品新动态

版权所有,未经授权不得以任何形式转载及使用,违者必究。