“真实数据+开源平台”,这样的算法大赛才是AI真正的演武场

“商业界和学生智慧的碰撞,一定能结出很多果实和火花。”

鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

“商业界和学生智慧的碰撞,一定能结出很多果实和火花。”

国内疫情逐渐平稳,被打乱节奏的招聘季重新成为热议话题。

不过,突如其来的意外冲击,还是给AI在内的科技行业带来了意想不到的变化。

新的趋势何在?相关专业学生和从业者又应该如何应对变化?

面对这些问题,在2020腾讯广告算法大赛的专题直播活动中,知乎大V“北冥乘海生”本尊、大数据与人工智能专家刘鹏给出了开头的那句答案。

而他所指的“演武场”,正是腾讯广告算法大赛。

不只是刘鹏,北京大学计算机系副主任崔斌、微众银行首席AI官杨强、腾讯公司副总裁王巨宏、腾讯广告副总裁蒋杰以及腾讯云副总裁黄世飞等一众大佬,都在这场直播中,就相关专业学生和技术从业者普遍关注的议题:行业趋势、职业发展……畅谈了自己的观点。

后疫情时代,产学如何结合

突发的疫情,给整个社会生产生活,都带来了非常大的影响。

对于科技行业而言,新的问题带来了新的挑战,却也带来了前沿技术落地的新契机

正如腾讯公司副总裁王巨宏谈到的,疫情期间,像腾讯这样的科技企业,就利用起了自己的云计算、大数据、AI等能力参与抗“疫”,为复工复产提供技术支援。

比如健康码。小小一个健康码的背后,其实集结了人脸比对、OCR识别等各类要素信息核验能力。

而腾讯就通过自己的云上视觉、语音、语义等AI能力,基于国家卫健委疫情信息大数据,将居民健康风险划分为低风险人群、中风险人群、高风险人群等三类,打通健康状态非接触式核验,已覆盖22个省、60个卫健委,接入医疗机构近600家。

又比如对疫情期间受影响较大的中小餐饮行业,腾讯广告基于附近推产品推出“百万门店成长计划”,

借助庞大的微信流量帮助线下门店注入生意增长新活力,用12亿月活用户为门店引流,有效降低这些中小型企业的投放门槛,提升引流效果,共克时艰。对于大型企业,实现数据精细化运营,打通营销闭环,助力企业在商业上智慧增长。

腾讯云副总裁黄世飞提出这样的观点:

后疫情时代里面,在产业互联网中会有越来越多的产业跟AI平台做结合,进行一些业务的创新,降本提效。

北京大学计算机系副主任崔斌教授也指出,疫情爆发后,国家对新基建的重视程度提升,这对于人工智能产业的发展是一个很好的机遇。

比如人工智能平台。作为人工智能里的“基础设施”,开源开放的平台对于人工智能研究产业发展起到非常重要的作用。这也是为什么国内的科技巨头纷纷投入这方面的工作,比如PaddlePaddle,腾讯广告算法大赛此次提供的Angel深度学习引擎等等。

微众银行首席AI官杨强表示,在金融行业可以利用人工智能机器人进行线上服务,比如利用人脸识别、声纹识别等技术进行在线的身份核验,通过对话系统和用户交流;在智能营销方面也可以利用联邦广告和联邦推荐技术,在保护隐私的前提下,利用多方数据进行精准营销。

那么,面对新的机遇,应该做什么样的准备?

自然是技术力量的不断跟进。

这不单单要靠产业界的努力,也需要学术界的智慧。

比如,腾讯就通过和北大共建联合实验室,共同开拓开源生态。Angel深度学习引擎诞生的背景,就是这样的产学结合。

王巨宏指出,这样的模式能培养出既在学术上有钻研,又能结合产业发展的综合性人才。这样的人才不但是企业所需要的,在实验室里也能起到榜样作用。

这也正是腾讯广告算法大赛的初衷:通过业务场景,通过比赛的方式,推动产学交流融合

当来自学术界的智慧,与产业界的实战经验碰撞,正在飘过的机会气球才能被精准射落。

腾讯广告算法大赛的第四年

说起来,今年是腾讯广告算法大赛的第四年。

从奖金规模上看,也是规模最大的一次,仅冠军奖金就有50万元,总奖金池超百万人民币。

对于比赛中表现优异的团队,腾讯还提供了面试直通的机会。

不过,能吸引到上万选手的关注,很重要的一点是,比赛提供海量真实场景数据,题目均来自实践环节

腾讯广告副总裁蒋杰介绍,现在,在数字营销方面,人工智能已经扮演了非常重要的角色。

通过基于AI算法的大规模实时处理系统,利用AI技术挖掘潜层数据、挖掘广告跟用户之间更深层的转化链路,能让广告更加个性化,让用户的广告体验变得更好。

比如,腾讯广告在实际业务中,就在用AI技术帮助大型传统企业进行数字化转型——

结合计算机视觉技术、NLP等技术建立清晰的用户人群画像,充分发挥广告主之间数据的潜能,再利用机器学习推荐算法,让广告能在适合的时间点推送出去,最大化传播效果。

今年的赛题“广告受众基础属性预估”,同样提取自这样的业务场景之中。

参赛者需要综合运用机器学习领域的各种技术,从用户在广告系统中的交互行为出发,进行反向预估(所有数据均为脱敏处理后的数据)。

这种反向打通的操作在用户统计、数据挖掘等真实的广告投放场景中极具实践价值,且可以帮助缺乏用户信息的广告从业者,在更广的人群上实现智能定向或者受众保护。

并且,由于许多高校尚未复课,大赛官方今年提供了充足的资源。不仅携手了腾讯云、腾讯大数据、腾讯招聘及腾讯高校合作等合作伙伴。更是有腾讯会议为大赛全程提供远程协同、线上会议及直播等服务。

计算资源方面,腾讯云智能钛机器学习平台(TI-ONE)是为AI工程师打造的一站式机器学习服务平台,作为大赛期间唯一指定的机器学习平台,TI-ONE将为参赛选手提供从数据预处理、模型构建、模型训练、模型评估的全流程训练能力。

与此同时,大赛推荐使用针对稀疏高维模型优化的Angel训练框架。Angel是腾讯大数据自研并开源的高性能分布式机器学习框架,支持万亿级超大规模参数模型,支持统计学习、深度学习、图机器学习等多种算法。

正如大数据与人工智能专家刘鹏所说,同学们想要在自己的实验室里拿到这样量级的工业界真实数据,几乎是不可能的,所以腾讯广告算法大赛这样的机会,对于同学们来说是极好的练兵机会,也是检验学习成果的良机。

崔斌教授也说,现在,比赛与应用更加紧密,无论是对学生还是对公司而言,都是很有收获的一件事。

其实,这样的机会连腾讯内部员工都表示眼馋。

王巨宏在直播中分享了一件趣事:从去年开始,腾讯内部员工对算法大赛就十分感兴趣,于是今年,腾讯广告算法大赛开辟了双向赛道,一个外部赛道,一个内部赛道。也就是说,今年腾讯内部的顶尖高手也会在这场比赛中露一手。

总之,借助腾讯广告这个业务场景,加上腾讯云的强大算力,AI技术在这里被精准地应用,也为研究社区孵化出了基于真实的开放数据集,以及广迎人才、锻炼人才的算法大赛。

目前,腾讯广告算法大赛仍在报名中,报名截止日期为5月31日。

今年,比赛将采取线上参赛的形式,初赛阶段时间为5月7日至6月22日,复赛阶段时间为6月23日至7月22日,决赛将在8月份进行。

你,也来试试身手?

版权所有,未经授权不得以任何形式转载及使用,违者必究。

相关阅读