Rokid创始人祝铭明:元宇宙的本质、底层和核心技术 | MEET2022
从产业角度看,AR眼镜要怎么发展?
编辑部 整理自 MEET 2022
量子位 报道 | 公众号 QbitAI
回望2021年的科技圈,最绕不开的关键词非“元宇宙”莫属。
今天,当人们反复谈及这个新兴概念时,总是会忍不住大谈畅想和未来,幻想这个虚拟世界会有怎样的新功能。
但在MEET 2022智能未来大会现场,Rokid创始人及CEO祝铭明却给出了不一样的思考:
我们想关注更本质、底层的技术。
在元宇宙爆火的背景下,这一观点显得冷静又克制。
而作为一家从2014年就入场AR领域、专注人机交互的科技公司,Rokid从产业角度出发已经有了多年的经验与思考。
为了完整体现祝铭明有关AR智能眼镜落地探索的思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。希望也能给你带来新的启发。
关于MEET 智能未来大会:MEET大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿科技技术的落地与行业应用。MEET2022采取线上参会形式,20余家直播平台和渠道转播大会直播,200万行业用户线上参会。除量子位微信、头条号、知乎、微博等全媒体矩阵外,新华社、凤凰科技、腾讯科技、澎湃新闻等数十家主流媒体纷纷报道大会及相关内容,线上曝光量累计超过2000万。
演讲要点
- 谈Metaverse,便要关注感知、理解、协同、展现、数字资产5个方面。
- 元宇宙还是一条非常漫长的路,Rokid想从核心能力出发,一步步带领大家走向那个终点。
- 从使用场景和功能属性两个维度出发,AR眼镜可被划分为4个种类。
- Rokid不认为现在可以用一个通用产品来覆盖所有场景,因此需要对每种产品进行专门地打磨。
- 硬件、技术之外,Rokid还打造了自己的OS,并开放给更多开发者用。
关注元宇宙更本质、底层的东西
Rokid从成立第一天起,我们对自己就有一个明确的定位:
我们更关注的是如何将真实世界与虚拟世界融合。
由此,我们把开发的重点放在了AI和AR上,在VR方面不做过多探索。今天,大家谈元宇宙都很喜欢畅想未来,但是Rokid想关注一些更本质、更底层的东西。
对此,我总结了5个方面。
第一,是感知能力。这会偏向于麦克风、照相机等传感器方面的技术。
第二,是理解能力。AI的范畴非常广,Rokid更关注AI在感知的基础上如何理解这个世界,通过周边的环境理解人与事。
第三,是协同能力。实现人机交互,首先要对人与人之间、人与事物之间的协同深度思考。
比如Facebook推出的VR远程办公应用、我们这次线上直播会议,也都是某种协同。
Rokid也在这个领域里面,有一些自己的思考。我们认为协同不仅是在虚拟世界中进行,更是真实世界与数字世界的融合。
第四,是展现能力。
现在大家谈论AR、VR、MR,更多关注的还是容易吸引眼球的东西。
这就体现了展现能力,其背后是基于光学、图形引擎、空间引擎和算法等方面技术。
最后还有一个方面不得不重视,是数字资产。
这其中包括创作工具、生产工具、管理及安全等方面的能力。
以上这个5个方面,Rokid会有自己的思考,但也不会自己单打独斗做所有的内容。
我们会和整个产业界合作,最终将这5个能力融合到自己的操作系统中,为大家提供对应的硬件产品和开放平台。
为什么Rokid更关注底层能力架构?
因为探索Metaverse是一条非常漫长的路,会延续5年、10年、20年甚至更久。作为一个实业类的公司,我们和其他研究型团队或者机构不大一样,我们会更加关注一些核心能力和整个路线该怎么走。
Rokid想做的是一步一步带大家到那个地方去。
四个象限划分AR眼镜
而从一家产品平台型公司的角度出发,我们还会考虑技术的载体。
除了前面提到的5个能力,针对终端设备,我们也有4方面的思考。
横轴从使用场景出发,纵轴从功能属性出发,我们将AR眼镜大致分为四个象限。
首先看第四象限,偏工具属性、强调日常长时间佩戴。
其中这款产品叫做Rokid Glass,现在已经升级到了第二代Rokid Glass 2.
2019年我们就发布了这个产品,已经在全球范围内有了应用和落地。
就在今早我们刚刚得知消息,代表全球最精密生产线的瑞士手表,也将我们列为了它的生产合作伙伴,并且在主页上有长篇介绍。
再看第三象限,这部分希望AR眼镜可以用在专业领域、更强调计算能力。
其中这款产品叫做X-Craft,它强调展现计算能力,带有GPS、GPU、NPU等大量计算单元。
它也是一款在全球范围内销售的产品,国内许多能源制造企业中都已经有了应用。
而在第二象限,我们也在考虑如何让AR眼镜逼近每一个人的日常生活,
所以今年我们上线了一款名为Rokid Air的产品。
它虽然还不能做到像普通眼镜那般容易佩戴,但也已非常轻便,放在口袋里毫无压力的那种。
同时它的能力也更偏向内容交互。
今天我们谈论Metaverse,很多人可能是受到这一象限产品的影响。
目前在一些众筹网站上已经有人抢先体验到了这款产品,反响很不错;所以我们最近也在筹备大规模销售,今年年底它或许就会和大家见面。
当然我们也不会放弃继续探索可每天日常佩戴的场景。
在第一象限内,我们一直保持的产品研究方向叫Rokid Vision,目标是希望它能像普通佩戴眼镜一样方便,而不仅仅只是用在一些特定场合。
以上就是我们对整个AR产品的布局、衡量和定位。
覆盖智能制造、文旅、娱乐等领域
其实德国很多汽车厂都在使用Rokid Glass系列产品,如奥迪、宝马、奔驰、保时捷等等。
尤其在疫情期间,Rokid的产品非常受欢迎,直到今天仍然畅销。
与此同时,我们还将AR眼镜和疫情防控结合在一起,其优势更多体现在人性关怀。
当测温人员佩戴AR眼镜后,在几米远的位置就能识别到每个人的体温,由此便无需将人拦下来,通过测温门或者体温枪指着人的方式来测温。
这其中用到了大量的AI技术,可以保障很高的精确度、稳定度,还能同时识别多人体温。
这个产品目前在全球有70多个国家和地区使用。
智能制造业方面,美的、比亚迪等国内灯塔工厂都在使用我们的产品。
如下展示的,就是在生产线上使用Rokid Glass2的场景。其核心在于如何让使用者不用编写代码、就能完成对自己整个工作流程的设定。
我们将AI能力与无代码、低代码配置平台结合,让更多人能够快速将我们的产品用在不同生成领域,这也是行业里比较领先的做法。
事实上,当我们谈论AR或Metaverse时,硬件只是其中之一,更重要的是后台算力等方面的能力。
在此,我给大家举一个例子。
在中石油AR智能辅助系统中,X-Craft更强调安全性,它配有北斗和GPS,同时也防尘防爆防污染,是一个专门针对重工业领域的产品。
而这个系统与国家电网的AR巡检/运维系统,在产品形态上有所不同,但基本平台是互通的。
这其实就是Rokid根据场景对产品的定制和细分。
但在此也分享一个我们的观点:Rokid不认为现在可以用一个通用产品来覆盖所有场景。
如果想要在行业里落地,我们都是会针对每一行业的特性对产品进行打磨。
而除了工业上的应用,我们还希望Rokid能够走到消费类市场。
比如Rokid Air,它最早被使用在文旅场景里。国内很多景点都在用Rokid Air进行文物或景区解说、导览、甚至一些古建筑重现。
大家知道现存的很多古建筑遗址,无法重现往日的辉煌,但是我们通过AR技术可以将它们重现。
目前我们也在如火如荼地推进这块业务,已经成立了团队专门建设生态体系,同时我们还引进很多伙伴帮忙进行内容创作、线下服务和推广。
我相信AR技术在文博领域会对传统导游解说、机器解说、二维码讲解带来一次全新的变革。
这里要强调一个概念,Rokid做人机交互是由不同阶段的。
从最早的指令型人机交互,再到图形化人机交互,显然是对人越来越友好的。
我们认为下一代人机交互会和AI息息相关,我们将它定位为基于专注力和意图的人机交互。
在文博领域,我们就是在打造这样的能力。
举例来说,如果使用Rokid的AR眼镜,在逛博物馆时无需做任何指令,不需要任何点击、操作,只要盯着界面就可以操控。
这样的AR眼镜自身可以去理解周围环境,能掌握使用者的注意力在哪里,最后还能推荐信息。
整体的操作会非常简单,不管是老人孩子,甚至是不会使用手机的人,戴上这样的AR眼镜走进博物馆,都能有非常好的体验。
再给大家分享一个产品,就是我们对消费级AR眼镜的尝试——Rokid Air。
它更侧重于让每一个人都能体验到AR。
在此当然娱乐先行,比如更加高清的视频体验、娱乐游戏互动,它不仅仅是更大屏幕,而是从交互上给大家展现更多不一样的内容。
Rokid认为,如果元宇宙是一个发展方向,那元宇宙不应该局限于虚拟世界、不应该与真实世界割裂,它应该是考虑如何将人与真实世界、虚拟世界进行融合。
所以我们会不遗余力地在AR领域探索,让我们的产品成为大家进入元宇宙的一个入口或桥梁。
开放Rokid的系统给大家用
最后再和大家介绍一下Rokid的系统。
我自己、我们团队中,很多人都有做AR研发的背景,在这个领域里大家可以看到,Rokid一直致力于建立自己的系统。
很多人或许会问,在Metaverse中系统和过去的OS、基础平台会有怎样的区别?
在此我和大家分享一些Rokid的思考:
我们认为有3个核心区别。
第一,当然是从2D到3D的变化。而且这个3D还不是传统意义上的3D屏幕,而是一个空间的概念。
第二,是在界面、输入方面的变化。原来我们通过键盘、鼠标来操作系统,未来则可能通过你的眼睛、语言、意图、姿态、大脑或者更多方式,这个将会非常有趣。
简单讲,就是从指令式交互变成注意力或意图交互。
第三,是将真实世界和虚拟世界融合的变化。这是大势所趋,也是Rokid在构建自己的系统时,一个非常重要的理念。
大家可以看到,我们将传统的OS系统作为底层,向上来构建能力。
这样一来,开发者就不用关心AI、不用关心AR,也不用关心数字引擎、空间引擎等,只需要去做内容开发和相关应用就好,
这一系统我们也会对外开放,目前已经有超过200个专业开发者在使用Rokid的OS。
如果大家之后拥有了我们的产品,就能在上面看到非常多精彩的游戏和应用。
但是Rokid本身并不认为,Metaverse很快会发展到每个人都能用的阶段,不会有那么快。
不过Rokid还是会耐着心一步一步打造我们的基本能力、平台、产品,帮助大家一步一步走到未来的那个世界。
最后,和大家分享一下Rokid的口号:Leave Nobody Behind。
我们希望将来科技和人文可以融合,让越来越多人都能够使用我们的产品、让科技为他们服务,真正做到每个人、每天都会使用未来新技术。
- 黄仁勋:AI算力集群会扩展到100万芯片,没有任何物理定律可阻止2024-11-08
- 腾讯发最大开源MoE模型,3890亿参数免费可商用,跑分超Llama3.12024-11-06
- Llama版o1来了,来自上海AI Lab,强化学习代码已开源,基于AlphaGo Zero范式2024-11-05
- 慢思考准确率反降30%!普林斯顿揭示思维链某些任务上失效的秘密2024-11-04