加载中...

阿里开源千问3向量模型,性能大幅提升,挑战谷歌和OpenAI

2025/06/06 · Ai资讯
16
0

在人工智能技术快速发展的今天,阿里巴巴于6月6日正式开源了其全新的千问3向量模型系列 ——Qwen3-Embedding。该模型是基于千问3底座,为文本表征、检索和排序等任务进行优化,标志着阿里在 AI 领域的又一重大突破。

相较于前一版本,Qwen3-Embedding 在文本检索、聚类和分类等核心任务上的性能提升了超过40%。这一进步不仅让它在技术上更具竞争力,还使得它在 MTEB 等专业榜单中,超越了谷歌的 Gemini Embedding、OpenAI 的 text-embedding-3-large 以及微软的 multilingual-e5-large-instruct 等顶尖模型,获得了同类模型的最佳性能(SOTA)。

 

简单来说,向量模型可以看作是 AI 的 “翻译器”,它通过将文本和图片等非结构化信息转换为机器易于理解的向量,从而实现高效的信息分类、检索和排序。基于千问3模型,通义团队采用对比训练、SFT 和模型融合等多种方法,成功打造出这一新型向量模型,涵盖了文本嵌入模型 Qwen3-Embedding 及文本排序模型 Qwen3-Reranker。

值得一提的是,千问3向量模型具有强大的多语言能力,支持超过100种语言,包括多种编程语言,展现出卓越的多语言、跨语言及代码检索能力。这为全球开发者提供了更为广阔的应用空间。

此次开源的千问3向量模型共有9款,涵盖不同尺寸(0.6B、4B、8B 等)及 GGUF 版本,开发者可以根据需求选择合适的模型,并自由组合模块,甚至可以自定义向量或指令,以实现特定任务、语言和场景的深度优化。这一灵活性将极大提升开发者的工作效率。

目前,千问3Embedding 和 Reranker 模型已经在魔搭社区、Hugging Face 和 GitHub 等多个平台上开源,开发者还可以通过阿里云百炼直接使用 API 服务。自4月29日开源以来,千问3大模型在多个国际榜单中取得了开源冠军的好成绩。

您需要登录后再评论
登录
{{item.user_nickname}}
{{item.create_time_txt}}待审核
{{item.comment_number}}
{{item.zan_num}}
{{item.zan_num}}
删除
{{comment.user_nickname}}
@{{comment.reply_nickname}}
{{comment.create_time_txt}}待审核
{{comment.comment_number}}
{{comment.zan_num}}
{{comment.zan_num}}
删除
展开更多
加载更多
回复@{{replyItem.user_nickname}}的评论
取消
回复
删除评论
确定要删除该评论吗?
取消
确定
登录
注册账号
找回密码
注册邮箱已存在
两次输入密码不一致
注册并登录
直接登录
找回密码
两次输入密码不一致
确定
注册账号