恺望数据上线国内首个支持4D-BEV数据拼接及标注工具链
完成Pre-A轮数千万级别融资
恺望数据发布最新版的”自动化AI数据产线”,包括
- 国内首个支持4D-BEV感知算法的数据拼接及数据标注工具链;
- 国内首个实现可在8G内存电脑上运行的5千万点云数据标注能力的工具“5KW大点云”产品、3D辅助标注等行业领先的数据服务技术及工具链。
与此同时,该公司为AI大模型研发的数据标注工具链和强化训练工具已投入使用。
同日,恺望数据宣布完成由亚盛投资领投的Pre-A轮数千万级别融资,清智资本参与投资。
据知,这是恺望数据在一年内完成的第三次融资,此前天使轮及天使+轮投资方包括辰韬资本、璞跃中国、三一集团和溪山天使汇等。
国内首个可支持4D-BEV数据拼接与标注工具链
为了迎合纯Lidar 4D-BEV、Lidar+Camera 4D-BEV、纯Camera 4D-BEV、Occupancy、End-to-end 、Full Self- Learning End-to-end 的发展,恺望数据对产线平台进行了矩阵式架构升级,从业务响应速度、数据文件大小支撑、数据并发、数据处理流程灵活度、标注难度降维、标注质量监督等方面进行了全方面升级。
为了应对客户大急项目和未来低延迟量产数据实时处理,高并发服务器可以轻松扩展以应对不断增长的数据任务量,通过动态缩扩容技术,可以有效地处理更多的并发请求,从而提高系统的可伸缩性。
“为了减少高并发作业下的服务器压力,我们通过算法降维、自研的Web Work调度系统、Web GPU、前端分布式计算等方式和技术,将更多计算和处理放到前端处理。”恺望数据创始人、CEO于旭表示。
于旭表示,恺望数据在行业内为头部主机厂及自动驾驶生态企业提供数据服务的过程中,感受到行业对于优质、高效及稳定的大规模数据需求正在爆发式持续增长:”以往可能只看价格,现在既看价格,还要求稳定、要求高质量、要求高效率。因此,恺望数据很坚定地通过研发最领先技术和优化运营效率,持续打造提供高安全、高质量、高效率的稳定大规模数据的核心能力。”
在最新版的”Smart Chain恺望自动化AI数据产线”中,为了降低标注学习难度、标注难度、提高生产和质量,新产线平台从任务编排上进行了重构,以支持自动拆分子任务,降低人员学习难度、降低单帧数据处理的精神消耗,从而提高数据处理速度和质量。同时根据不同项目和客户要求,该工具链可支持拆分验收和合并验收,降低验收人员压力、提升验收人员效率和质量。
8G内存电脑可运行,国内首个实现“5千万大点云”工具平台
拆解2023″Smart Chain恺望自动化AI数据产线”的全新工具平台,是一套”3456″数据服务工具包——
包括:”3D辅助标注”工具平台、”4D-BEV数据拼接与标注”工具链、”5KW大点云”工具平台,以及”6大数据生态闭环解决方案”。
其中,”3D辅助标注”工具是国内唯一一个在2D中标记后反投影到3D中精准找到标注物的工具,”5KW大点云工具平台则是国内首个实现可在8G内存电脑上运行的5千万点云数据标注能力的工具。
行业内有关人士表示:
“国内行业内领先水平大概是约200万、300万点云,上千万级别点云能力的工具和平台极为稀缺。”
恺望数据技术及产品负责人透露,通过自研Web多线程调度系统,完成点云异步加载和渲染,”5KW大点云”工具平台经验证即使在8G内存电脑上也可运行,上限可支持1亿点云加载。”Web多线程技术执行复杂的计算、处理大量数据、进行后台网络请求在后台线程中运行,不会影响用户界面的响应性,将数据加载、点云处理、渲染分开异步完成处理的同时不会影响业务正常使用。”
“标注人力,正从卷价格到卷质量”
虽然研发有最贴近领先感知算法的数据标注工具,但恺望数据认为,要解决自动驾驶数据的长尾问题,目前阶段仍无法全自动化,目前行业数据仍需要经历”人的智慧”。”随着自动驾驶对高质量、高产效数据的需求逐步提升,数据标注已经从低成本人力标注,逐渐变为了高阶标注人才的需求。”
而比自动驾驶更需要”高端标注人员”的,是AI大模型行业。据透露,随着人工智能与大模型的快速发展,AI大模型相关的数据服务今年以来也呈现爆发式增长。恺望数据目前已为多家知名大模型公司提供数据服务,其自研的AI大模型数据标注工具链和强化训练工具也已正式使用。
“什么样的人能训出什么样的模型,对于新的领域,首先需要有主观判断的人。AI大模型的数据来自各类垂直专业领域,要在短时间内形成大量稳定优质的标注供应能力,经过一段时间的探索,我们发现大量使用本科及以上学历各专业的毕业生能够快速满足大模型标注人才的需求,但在行业内极为稀缺。”于旭表示,恺望数据定义这些高阶标注人员为”垂类高阶标注人才”。她表示,由于恺望数据在去年已打造”恺望数据学院”,通过高校合作储备及培训有大批高校学生标注员,通过共建产融实训基地的形式为行业迅速提供大量稳定且优质的数据标注服务,同时运用AI工具辅助管理、基地化管理、专业化高级人才培养等方式,获得最优人力和最优人效的平衡,降本增效表现领先行业。
于旭透露,目前恺望数据学院已培训50所学校,培养超过1500名学生为恺望提供数据标注服务,计划至今年年底将超过2000人规模。
作为国内唯一一家参与国家时空数据标准制定的数据服务公司,恺望数据在安全合规方面,设置有严格的安全设置流程,对使用者身份严格审核,坚持以提升数据处理技术和客户服务为核心能力,在自动驾驶、大模型及AI应用业务线均不保留委托方数据。
- 突破短视频局限!MMBench 团队构建中长视频开放问答评测基准,全面评估多模态大模型视频理解能力2024-10-30
- 人形机器人新品牌“灵宝CASBOT”发布,来自中科慧灵2024-10-30
- 第一波大模型已经走进厨房了!实测方太Healthy CookingGPT2024-10-25
- 讯飞版《Her》长脸了!多模态虚拟人表情动作超逼真,一张图一句话就能DIY自己2024-10-24