帮助百度提高广告收入的“强化学习”，了解一下_中国智能建筑网B2B电子商务平台_河姆渡

帮助百度提高广告收入的“强化学习”，了解一下

热点推荐2018年04月28日

在“All in AI”的策略指导下，百度交出了一份这几年来最漂亮的成绩单。

截至3月31日的第一季度财报显示，百度第一季总营收猛增31%，至 209 亿元人民币(33.3亿美元)，净利润 67 亿元（11亿美元），每股收益 16.6 人民币（2.60 美元），均高于市场预期。

数据是一片大好，看起来百度正走出低谷期。

这得益于两个方面，一是组织的优化，百度壮士断腕，抛弃了不少累赘业务；另外，也是因为在 AI 方面的押注取得了回报。

AI 带来的盈利，最直接还是体现在了广告上。陆奇表示这一季度里，百度首次在广告系统凤巢里，部署了强化学习技术，能实现更精准的营销。这达到了一个工程上的新里程碑。

强化学习其实不是个新鲜概念了，那么它具体是干啥？百度如何用它赚钱的？

真正意义上的自学成才

强化学习是机器学习的一个分支，相对应的是监督学习，还是拿 Alpha Go 举例：

过去采用监督学习的 Alpha Go，需要输入大量人类棋手的下法、对弈棋局等数据，然后通过模拟完成“左右互搏”，最终不断寻得更科学的下法，也就是说，它其实还是在“模仿”人类。

而采取了强化学习的最强版本 Alpha Go Zero 不同，它不需要对着人类的玩法照猫画虎。了解到基本的规则以及最终要达到的目标后，就开始“随便下”，如果下赢了，就会得到奖励，然后指导下一步的决策；如果输了，就会有惩罚。在这种尝试——反馈——学习的过程中，完成自我进化。

某种角度来看，强化学习更接近智慧生命体的思维模式。通过不断地试错，获得来自环境的反馈，从而获取到更多地知识和数据。

那么，它能带来什么好处呢？显而易见，一是无需在前期输入大量的数据，减少准备的时间和成本，毕竟优质的大数据并不是随时都能获取的；二是适应性强，它是真正意义上的“完全自学”，几乎能被应用在任何领域，理论上讲，如果算力跟得上，它能解决任何问题。

当然问题也出在这儿，因为完全是“两眼一抹黑”式的自我探索，所以强

带来的效果就是，客户爸爸们的钱能花在刀刃上，花更少的钱，得到更精准的曝光。当然，百度和 Google 们过去一直都是这么做的，只不过这是技术的有一次升级而已。

为什么要用强化学习？

就像之前提到的，它的优势在于：无需在前期就输入大量数据，直接可以上线，并在线完成学习的过程。

因为对于许多广告来说，它并没有太多可以参照的数据，前人虽有成功案例，但时间、平台、目标人群的不同，都会导致过去的经验没法直接套用，监督式的机器学习算法，学无可学。

这时候，强化学习就有用武之地了，它可以分析投放广告本身的效果，而无需去寻找其他大数据作为参考，即插即用，方便快捷。

据量子位报道，长安汽车就在使用之后发现CTR（点击通过率）显著提高，转化价格明显降低，于是将每日投放预算提高了5倍。

不过，就像上文提到的，强化学习也有其自身的问题。如何优化模型，使最终结果更快、更可信，是百度要面临的技术考验。

就像前 Facebook 工程师 Jeff Hammerbacher 的那句名言“我们这一代最聪明的人，竟然都在这里思考着怎样让人们去大量的点击广告”一样，百度的技术说得头头是道，结果最后还是投广告的事，肯定免不了被批判一番。

但其实，人类历史上，任何技术的诞生初衷，都是为了商业服务的，而商业带来的资本也能反哺技术的迭代。这个过程循环反复，社会和文明自然而然就实现了进步。

竞价医疗广告除外。

关联标签：

文章来源：河姆渡智能建筑

文章网址：

【上一篇】小米最落魄创始人，黄江吉和他8年小米生涯

【下一篇】苹果谷歌要给 Emoji “禁枪”，这可能是毁灭它的危险一步

一周排行榜

热门活动

服务推荐

工具推荐

工程设计计算器
河姆渡方案馆

热门活动

特色服务

交易保障

更多精选