首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
淘天
任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B
提出具有任务级奖励的交互式强化学习框架
西风
2025-07-20
Agent
淘天
我在淘天做算法:十年拍立淘,一部视觉算法技术演变史
要时刻保持技术创新
量子位
2024-11-07
淘天
加载更多
热门文章
机器人训练,北京男大有了技能玩法
2025-11-08
AI100访谈:「Get笔记」方法论|量子位智库
2025-11-08
LLM强化学习新框架!UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍
2025-11-08
ICCV涌现自动驾驶新范式:统一世界模型VLA,用训练闭环迈向L4
2025-11-08
大厂AI新战场:AQ狂飙,蚂蚁押注大健康赛道
2025-11-09