阿里PAI开源AgenticQwen小模型:凭「双数据飞轮」让8B性能逼近235B

币界网消息,阿里PAI团队发布并开源了专为工业级工具调用设计的小型智能体语言模型AgenticQwen(包含8B和30B-a3b两个版本)。该系列模型通过创新的「双数据飞轮」强化学习框架训练,在大幅降低推理成本的同时,实现了接近千亿参数大模型的智能体能力。评测显示,AgenticQwen-8B在真实工具环境基准(如tau-2和bfcl-v4)中平均得分47.4,远超基础版Qwen3-8B(23.8),逼近Qwen3-235B(52.0)。目前该模型已在内部类似manus的生产系统中部署,大幅缩小了与235B大模型的差距。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注