阿裏巴巴的新人工智能編碼器超越了DeepSeek

阿裏巴巴的新AI編碼器超越了DeepSeek

公司Alibaba推出了“最先進的編程AI工具”——開源AI模型Qwen3-Coder。

Qwen3-Coder 現已推出!✅

我們發布了 Qwen3-Coder-480B-A35B-Instruct,這是我們迄今爲止最強大的開放性智能代碼模型。這個480B參數的專家混合模型(35B active)原生支持256K上下文,並通過外推擴展到1M上下文。它達到了… pic.twitter.com/Z8HfyrVScE

— Qwen (@Alibaba_Qwen) 2025 年 7 月 22 日

神經網路旨在解決與編程相關的任務。它能夠編寫代碼並管理復雜的工作流程,在其他領域展示進展:

  • 遵循指示;
  • 邏輯思維;
  • 理解文本;
  • 數學;
  • 自然科學;
  • 使用工具。

公司將產品定位爲在代理人工智能任務中“特別強大”——即人工智能能夠在沒有人類幹預的情況下獨立工作。

pic.twitter.com/M8krjTM4tq

— Qwen (@Alibaba_Qwen) 2025 年 7 月 22 日

根據提供的數據,Qwen3-Coder 在多個指標上超越了中國競爭對手,包括 DeepSeek 的模型和 Moonshot AI 的 K2。 在美國數學奧林匹克中,它獲得了 70.3 分,而 DeepSeek-V3-0324 僅獲得 46.6 分。

在MultiPL-E編程測試中,語言模型得分爲87.9分,DeepSeek的得分爲82.2。

在某些領域,神經網路可與前沿的美國同類產品相媲美,例如Anthropic的Claude和OpenAI的GPT-4。

神經網路 Qwen3-235B-A22B-Instruct-2507-FP8 是之前版本 Qwen3-235B-A22B-FP8 的升級版,但以無推理模式工作——直接給出結果而不進行逐步邏輯推理。因此,處理內容的最大長度增加了八倍——達到 256 000 個標記,這使得在一次對話中可以處理更大文本。

提醒一下,阿裏巴巴在五月宣布在降低針對搜索的人工智能模型訓練成本方面取得了突破。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)