伊人六月,97自拍超碰,久久精品亚洲7777影院,五月婷婷综合在线观看,日本亚洲欧洲无免费码在线,2019国产精品视频,国产精品第一页在线

首頁  >  財經(jīng)  >  財經(jīng)要聞

千問最強模型來了!多項性能破全球紀錄

2026-01-27 06:48:00

來源:上海證券報

  1月26日,阿里正式發(fā)布千問旗艦推理模型Qwen3-Max-Thinking,創(chuàng)下數(shù)項權(quán)威評測全球新紀錄。其性能媲美GPT-5.2、Gemini 3 Pro,成為迄今為止最接近國際頂尖模型的國內(nèi)最強AI大模型。

  Qwen3-Max-Thinking是目前阿里規(guī)模最大、能力最強的千問推理模型,其總參數(shù)量超萬億(1T),預訓練數(shù)據(jù)量高達36T Tokens。

  通過總參數(shù)、強化學習、推理計算的極致規(guī)模擴展,新模型實現(xiàn)了性能的大幅飛躍,刷新科學知識、數(shù)學推理、代碼編程等多項關鍵性能基準測試的全球紀錄。

  在關鍵的模型推理能力提升中,千問新模型采用了一種全新的測試時擴展(Test-time Scaling)機制,推理性能提升的同時還更經(jīng)濟。

  業(yè)界普遍的推理時計算,只會簡單增加并行推理路徑,重復推導已知結(jié)論,造成冗余推理效率低下;而千問采用的這一新機制,可對此前推理的結(jié)果進行“經(jīng)驗提取”式的提煉,并據(jù)此進行多輪自我迭代,在相同的上下文中實現(xiàn)更高效的推理計算,獲得更智能的推理結(jié)果?;谶@一推理技術創(chuàng)新,千問推理性能和推理效率大為提升,比如在啟用工具的“人類最后的測試”HLE中,千問得分58.3,大幅超過GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,錄得當前所有模型的最高分。

  面向即將到來的智能體Agent時代,Qwen3-Max-Thinking還大幅增強了自主調(diào)用工具的原生Agent能力。

  具體而言,在完成初步的工具使用微調(diào)后,通義團隊對模型進一步在大量多樣化任務上進行了基于規(guī)則獎勵與模型獎勵的聯(lián)合強化學習訓練,使得Qwen3-Max-Thinking擁有更智能結(jié)合工具進行思考的能力。這種自適應的工具調(diào)用能力可在QwenChat上完整體驗,模型自主選用搜索、個性化記憶和代碼解釋器等三個核心的Agent工具功能,提供專業(yè)人士一樣水平的回答,更合用戶心意、更智能、更流暢;同時,模型幻覺也大為降低,為解決真實復雜任務打下基礎。

  目前,開發(fā)者可在QwenChat上免費體驗Qwen3-Max-Thinking模型,企業(yè)可通過阿里云百煉獲取新模型API服務,普通用戶也可通過千問PC端和網(wǎng)頁端試用模型。

  據(jù)了解,千問App也即將接入新模型,所有用戶都可免費體驗千問最強模型。

  作者:楊翔菲 溫婷

免責聲明:本網(wǎng)對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網(wǎng)站轉(zhuǎn)載圖片、文字之類版權(quán)申明,本網(wǎng)站無法鑒別所上傳圖片或文字的知識版權(quán),如果侵犯,請及時通知我們,本網(wǎng)站將在第一時間及時刪除。