加载中...

阿里巴巴通义Qwen3上线非思考模型,核心能力与GPT-4o相当

2025/07/30 · Ai资讯
28
0

7月30日,阿里巴巴的通义千问团队正式推出了 Qwen3系列模型的最新成员 ——Qwen3-30B-A3B-Instruct-2507。这一全新的开源模型采用非思考模式(non-thinking mode),仅需激活3B 参数,就能在多个核心能力上与 Gemini2.5-Flash 和 GPT-4o 等知名闭源模型相媲美。此外,Qwen3-30B-A3B-Instruct-2507在多语言支持、用户偏好对齐和长文本处理等方面也实现了显著突破。

该模型现已在魔搭社区(ModelScope)和 HuggingFace 平台上全面开源。作为 Qwen3-30B-A3B 系列中的新版本,Qwen3-30B-A3B-Instruct-2507不仅继承了通义千问团队在架构创新方面的优势,还大幅降低了计算成本,力求与千亿级闭源模型的性能相对接。

根据官方数据,Qwen3-30B-A3B-Instruct-2507在数学推理(AIME25测试得分61.3)、代码生成(LiveCodeBenchv6得分43.2)、研究生级物理与天文学问题(GPQA 测试得分70.4)及人类偏好对齐(Arena-Hard v2得分69)等多个关键基准测试中表现出色,甚至在部分指标上超越了 GPT-4o。这一成就标志着该模型在逻辑推理、数学、科学和编程等多个领域的全面能力得到了显著提升。

更值得一提的是,Qwen3-30B-A3B-Instruct-2507在多语言的长尾知识覆盖上也表现优异,并在主观和开放任务中更好地对齐用户的偏好,生成更高质量的文本,为用户提供更有价值的答案。同时,其长文本理解能力也提升至256K,意味着用户能够处理更加复杂的文本内容。

自2023年发布以来,通义千问系列模型已开源超过200个,全球下载量突破3亿次,衍生模型数量超过10万个,展现了强大的市场影响力和技术潜力。

您需要登录后再评论
登录
{{item.user_nickname}}
{{item.create_time_txt}}待审核
{{item.comment_number}}
{{item.zan_num}}
{{item.zan_num}}
删除
{{comment.user_nickname}}
@{{comment.reply_nickname}}
{{comment.create_time_txt}}待审核
{{comment.comment_number}}
{{comment.zan_num}}
{{comment.zan_num}}
删除
展开更多
加载更多
回复@{{replyItem.user_nickname}}的评论
取消
回复
删除评论
确定要删除该评论吗?
取消
确定
登录
注册账号
找回密码
注册邮箱已存在
两次输入密码不一致
注册并登录
直接登录
找回密码
两次输入密码不一致
确定
注册账号