48小时烧脑角逐,吃住赛场,国内首个大模型极限挑战赛落幕
围绕“科技助老”命题
4月21日晚,第四届ATEC科技精英赛(ATEC2023)线下赛落幕。本届赛事以大模型为技术基座,围绕“科技助老”命题,是国内首个基于真实场景的大模型全链路应用竞赛。ATEC2023线下赛采用48小时极限挑战的形式,来自东南大学、哈尔滨工业大学、华中科技大学的4名选手夺冠并捧走100万元奖金。赛事赛题的全程解读及代码展示,将在国内首档程序员科技节目《燃烧吧!天才程序员4》中播出。
本届ATEC科技精英赛(ATEC2023)由中国电子学会主办,ATEC前沿科技探索社区承办,清华大学等17所高校参与,清华大学与蚂蚁集团共同命题。
经过三个月层层海选,从1901支报名队伍3000余位选手中脱颖而出的16位选手,在48小时内,依托大模型技术,在支付宝智能助手等真实业务场景中,极限破解老年人异地就医所遇到的一系列现实问题。
“大模型+贴近工业真实”,这两大亮点让本届赛事报名人数及985、211高校占比都创下历史新高。本次竞赛的核心挑战,是解决工业真实场景中,大模型训练过程及落地应用亟需解决的三个核心问题:可用性、安全性、高效能。
赛题出题人之一、蚂蚁集团基础智能部技术总监张志强告诉记者,赛题围绕这三个核心问题来出题,考验选手们的破解思路和能力,比如让模型学会检索文档并总结文档内容做出精确回答、让模型学会收集用户需求并调用工具解决实际问题;在模型推理阶段,掌握好模型效果和推理速度的平衡,以让模型能为生产之用;在追求模型效果和迭代效率的同时,也追求模型线上推理速度,以让计算成本可控。
值得一提的是,这届赛事以大模型为技术基座,以贴近工业真实的业务场景做命题,折射了以蚂蚁为代表的国内互联网企业加速发展AI及AI落地应用的趋势。譬如,本届赛事命题中涉及的蚂蚁大模型医疗场景,今年年初在权威全球医疗评测榜单PubMedQA中,就以最小的模型参数,取得了准确度位居第五的成绩,排在GPT-4之前。
“选手们面临的都是来自真实应用的挑战,在大模型了转向大规模落地应用的当下,ATEC是技术青年们很好的练兵场。”ATEC2023评审委员会主席、西安交通大学教授沈超教授强调,“给代码赋予意义、让技术造福社会,关注科技助老等价值命题,是大赛组委会的初心。