阿里巴巴的新人工智能编码器超越了DeepSeek

阿里巴巴的新AI编码器超越了DeepSeek

公司Alibaba推出了“最先进的编程AI工具”——开源AI模型Qwen3-Coder。

Qwen3-Coder 现已推出!✅

我们发布了 Qwen3-Coder-480B-A35B-Instruct,这是我们迄今为止最强大的开放性智能代码模型。这个480B参数的专家混合模型(35B active)原生支持256K上下文,并通过外推扩展到1M上下文。它达到了… pic.twitter.com/Z8HfyrVScE

— Qwen (@Alibaba_Qwen) 2025 年 7 月 22 日

神经网络旨在解决与编程相关的任务。它能够编写代码并管理复杂的工作流程,在其他领域展示进展:

  • 遵循指示;
  • 逻辑思维;
  • 理解文本;
  • 数学;
  • 自然科学;
  • 使用工具。

公司将产品定位为在代理人工智能任务中“特别强大”——即人工智能能够在没有人类干预的情况下独立工作。

pic.twitter.com/M8krjTM4tq

— Qwen (@Alibaba_Qwen) 2025 年 7 月 22 日

根据提供的数据,Qwen3-Coder 在多个指标上超越了中国竞争对手,包括 DeepSeek 的模型和 Moonshot AI 的 K2。 在美国数学奥林匹克中,它获得了 70.3 分,而 DeepSeek-V3-0324 仅获得 46.6 分。

在MultiPL-E编程测试中,语言模型得分为87.9分,DeepSeek的得分为82.2。

在某些领域,神经网络可与前沿的美国同类产品相媲美,例如Anthropic的Claude和OpenAI的GPT-4。

神经网络 Qwen3-235B-A22B-Instruct-2507-FP8 是之前版本 Qwen3-235B-A22B-FP8 的升级版,但以无推理模式工作——直接给出结果而不进行逐步逻辑推理。因此,处理内容的最大长度增加了八倍——达到 256 000 个标记,这使得在一次对话中可以处理更大文本。

提醒一下,阿里巴巴在五月宣布在降低针对搜索的人工智能模型训练成本方面取得了突破。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)