"淘天"最新资讯 | 量子位

淘天

任务级奖励提升App Agent思考力，淘天提出Mobile-R1，3B模型可超32B

提出具有任务级奖励的交互式强化学习框架

西风 2025-07-20

Agent 淘天

我在淘天做算法：十年拍立淘，一部视觉算法技术演变史

要时刻保持技术创新

量子位 2024-11-07

淘天

加载更多

热门文章

机器人训练，北京男大有了技能玩法

AI100访谈：「Get笔记」方法论｜量子位智库

LLM强化学习新框架！UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍

ICCV涌现自动驾驶新范式：统一世界模型VLA，用训练闭环迈向L4

大厂AI新战场：AQ狂飙，蚂蚁押注大健康赛道