大模型

大模型架构的下半场

面向大模型深度扩展的Flash Depth Attention与混合深度注意力

衡宇 前天 18:12

蚂蚁用8B小模型构建用户“话”像,跨任务跨模型通用且SOTA

迎接大模型应用爆发,给每个用户配赛博秘书