AI十年进阶:一段算法能力演进的历史
算法已经无处不在,但还远远不够。
鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
现在,AI无疑已经到了祛魅的时间点。
当AlphaGo的惊世一战已成5年前的旧事,当GAN制造的特效在鬼畜区遍地开花,当曾经只有最精尖团队才敢涉足的自动驾驶迎来造车大潮……
有人认为AI被捧上神坛的黄金期已经过去,但也有更多的行业观点指出,此时,才真正到了见证AI技术创造价值的时刻。
不错,如今,对于App里的推荐算法,大家早已习以为常;手机里的智能助手也越来越能get到你的意图;甚至去趟亦庄,就能在地图App里打上一辆无人驾驶出租车……曾经只在实验室中被讨论的算法,已经在不知不觉中蔓延到了生活的各个角落。
而当AI神秘的面纱随着技术的普及不断被揭开,行业内那些曾经被精英光环照亮的明星公司,身上的标签也逐渐发生了变化。
说白了,就是比起“顶会论文”、“世界冠军”,外界正在像独角兽们提出更加直接的问题:
一家AI公司,究竟能创造出什么样的价值 ?
迷雾消散,潮水褪去,才见真章。
就在最近,这群独角兽里一直备受瞩目的旷视,成立10年以来首次举办了技术开放日活动。
恰好,旷视首席科学家、旷视研究院院长孙剑等人,就在活动中针对这样的问题,给出了自己的答案。
“AI是不断演进的算法能力”
谈及AI技术创造的价值,首先应该讨论的是衡量价值的标准。
事实上,在技术发展的不同阶段,所谓“AI的价值”始终是在动态变化着的。
众所周知,AI技术迎来爆发期,也就是近10年以来的事,但AI几起几落的历史,却可以追溯到上世纪50年代。
以史为鉴,其实不难看出,虽然受限于计算能力和数据,AI在两度迎来发展高峰后都很快陷入“寒冬”,但算法的演进,始终都是其引发关注的主因。
达特茅斯会议之后,掀起人们对人工智能第一波追逐的,正是机器自动定理证明、会下跳棋的跳棋程序、已经能胜任简单视觉处理的感知机(Perceptron)等算法研究成果。
更不用提现在这波人工智能热潮的来临,是以图灵奖得主Hinton等人提出的深度学习算法为基石。
但这还只是狭义上的“算法的演进”。
事实上,此前AI寒冬的来临,究其本质是AI无法突破从“有没有用”到“在哪里用”之间的距离。
如果说实验室单点算法的突破,是算法演进的深度,那么规模化的实现与落地,就是算法演进的广度。
收缩时间的范围,这样的认知同样可以在最近10年中国的AI价值进阶之路上得到证明。
作为中国AI十年的亲历者,旷视就认为,这10年来AI在中国产生的价值变化,大致可以划分为三大阶段:
- 基础科研
- 行业落地
- 基础设施
孙剑表示:
这三个阶段分别回应了三个问题:AI有没有用?AI在哪里用?AI易不易用?
并且,这三个阶段不是分段接替,而是以基础科研为起点,你中有我我中有你,并行推动着AI价值的进阶。
回到算法的角度,可以这样理解:
基础科研的关键点是突破单点算法,让AI率先在互联网等数字化程度高的领域应用落地,证明可用性的问题。
行业落地的关键点是拓展算法边界,让AI能在越来越大的行业场景中实现规模化的商业落地。
而基础设施的关键点是降低算法门槛,让AI生产变得更加容易,从非标准化生产到标准化量产——旷视研究员周而进也在活动中强调:“非标准化的生产流程是制约算法生产的主要因素。因为非标,所以过程充满不确定性,所以需要全能型人才。只有标准化,才能自动化,才能规模化。”
在这个过程中,正如开头所提到的,算法本身似乎越来越不令人兴奋、让人感知不到,但实际上,算法却已经无处不在,真正开始走出实验室发挥出越来越大的价值。
以这样的视角再去回看旷视的10年历程,就会发现旷视自身的进阶,正是遵循着上述算法能力演进的脉络:
最初,以算法起步,乘着深度学习的变革东风,将深度学习与计算机视觉进行结合,形成以面部识别、视频结构化、图像分类、物体检测、语义分割、动作识别等为代表的算法能力。
进入到产业落地的阶段,在前期积累的科研成果的基础上,又从face++到Brain++,将自身快速、低成本生产算法的能力沉淀为AI生产力平台,提供从数据管理,到深度学习框架引擎,再到算力资源管理的一站式AI能力,大幅降低算法生产的技术门槛,实现AI算法的标准化、自动化生产。
以这样的算法能力为基石,旷视又在与产业的更深入结合中,选择了AIoT的路线。
因为IoT是基于场景空间,以人为核心、软硬结合的网络。AI+IoT的本质,就是将AI的能力注入到IoT场景中,实现智能化。
在AI能力的注入下,传感器、机器人等物联网终端硬件如同拥有“小脑”,能够实现“单体智能”;AIoT操作系统则是在各种物联网硬件和设备完成整合、组网之后,构成“大脑”,实现“群体智能”。
如此一来,AI算法才能真正做到“无所不在”。
旷视十年,不变的是什么?
成立10年,是时候通过技术开放的窗口再来看旷视是一家什么样的公司。
其实跟最初外界给“CV四小龙”的定位,已然相去甚远。
如今,不仅是在CV领域,将算法能力从目标检测、语义分割,拓展到了光学指纹、SLAM导航等更加丰富的场景里,旷视也把基础研发的视角,投入到了更基础、更本质的创新。
比如旷视研究院就在今年提出了RepVGG,革新了模型设计方法论,让经典的极简神经网络架构重新达到SOTA水准。其在开源后Github star已超过1800。
而Brain++提供的智能化、标准化工具组件和AI能力,则是从基础设施的层面发力,解决AI进阶途中逐渐暴露出来的生产效率不足的问题。
看上去技术“杂”了,但实际上,旷视技术路线的演化背后,透露出的是其作为一家跟中国AI行业共同成长起来的公司,对自身造血更新的深入思考。
这样的不同之中,更深层的致胜逻辑其实却是不变的:围绕AI技术、围绕算法本身,持续创新拓展认知边界。
事实上,这种变化,不只局限在旷视。现在仍在行业中开辟自己的生存之道的独角兽们亦如是。
变,是基于作为AI行业的亲历者,对行业的不断洞察。
不变,是技术为王的底色,和对科技创新的坚持。
在这个过程中,旷视这样的公司在技术上依然“精英”,在落地上则更加务实。
— 完 —
- 0元起步打造你的AI搜索!实测秘塔知识库新功能,竟能指导我升职加薪了2024-11-11
- o1满血版泄露!奥数题图片推理手拿把掐,奥特曼上线剧透o22024-11-03
- 科研版AI搜索来了!知乎直答接入正版论文库,一手实测在此2024-11-01
- 微软清华改进Transformer:用降噪耳机原理升级注意力,一作在线答疑2024-11-03