日韩人妻av一区二区-精品国产综合区久久久久久蜜臀-色女激情五月激情五月-99热国产这里只有的精品

阿里巴巴,登頂全球開源模型!
來源:證券時(shí)報(bào)網(wǎng)作者:周春媚2025-04-29 10:35

4月29日,阿里巴巴開源了備受期待的新一代通義千問模型Qwen3(簡(jiǎn)稱千問3),在GPQA、AIME24/25、LiveCodeBench等多個(gè)權(quán)威基準(zhǔn)測(cè)試中全面超越R1、OpenAI-o1等全球頂尖模型,表現(xiàn)出極具競(jìng)爭(zhēng)力的結(jié)果,登頂全球開源模型。

其中,在奧數(shù)水平的AIME25測(cè)評(píng)中,千問3獲得81.5分,刷新開源紀(jì)錄;在考察代碼能力的Live Code Bench測(cè)評(píng)中,千問3突破70分大關(guān),表現(xiàn)超過Grok3;在評(píng)估模型人類偏好對(duì)齊的Arena Hard測(cè)評(píng)中,千問3以95.6分超越OpenAI-o1及DeepSeek-R1。

千問3采用混合專家架構(gòu),總參數(shù)量為235B,激活參數(shù)量?jī)H需22B,在推理、指令遵循、工具調(diào)用、多語(yǔ)言能力等方面均大幅增強(qiáng)。

千問3具有以下主要亮點(diǎn):

一是“快思考”與“慢思考”結(jié)合。作為國(guó)內(nèi)首個(gè)“混合推理模型”,Qwen3將“快思考”與“慢思考”集成進(jìn)同一個(gè)模型,可以在思考模式(用于復(fù)雜的邏輯推理、數(shù)學(xué)和編碼等任務(wù))與與非思考模式(用于聊天等簡(jiǎn)單實(shí)時(shí)交互)之間無縫切換,既可以對(duì)簡(jiǎn)單需求進(jìn)行“秒答”,也能夠?qū)?fù)雜問題進(jìn)行多步驟“深度思考”,從而大幅節(jié)省算力消耗。

二是提供8種參數(shù)大小的模型。千問3提供了8款不同尺寸的豐富的模型版本,包含2款30B、235B的混合專家模型,以及0.6B、1.7B、4B、8B、14B、32B等6款稠密模型,每款模型均斬獲同尺寸開源模型SOTA(最佳性能)。這為本地測(cè)試與科研、手機(jī)端側(cè)應(yīng)用、電腦或汽車端、企業(yè)落地、云端高效部署等不同場(chǎng)景與任務(wù)提供了能夠滿足要求的尺寸模型,最大程度平衡性能與成本。

二是推理能力顯著提升。千問3在數(shù)學(xué)、代碼生成和常識(shí)邏輯推理方面超越QwQ(在思考模式下)和Qwen2.5 instruct models(在非思考模式下)。其中,Qwen3-235B-A22B表現(xiàn)尤為突出,刷新了開源模型的智能水平新高,顯存占用僅為性能相近模型的三分之一。無論是數(shù)學(xué)推理、代碼生成還是綜合邏輯分析,Qwen3均展現(xiàn)出卓越能力,穩(wěn)居全球開源模型前列。

四是支持MCP協(xié)議,具備強(qiáng)大的工具調(diào)用能力。在評(píng)估模型智能體能力的BFCL評(píng)測(cè)中,千問3拿下70.8的新高,超越谷歌Gemini2.5-Pro、OpenAI-o1等頂尖模型,大幅降低智能體調(diào)用工具的門檻。千問3還支持MCP(模型上下文協(xié)議),并具備強(qiáng)大的工具調(diào)用能力,能夠?qū)崿F(xiàn)高效的手機(jī)及電腦智能體操作等任務(wù)。

五是部署成本大幅下降。在性能大幅提升的同時(shí),千問3的部署成本大大降低。滿血版671B參數(shù)量的DeepSeek-R1需要8張H20(價(jià)格大約100萬元)進(jìn)行部署,適合低并發(fā)場(chǎng)景;一般推薦使用16張H20部署,總價(jià)約200萬元。而千問3的旗艦?zāi)P蛢H需3張H20(大約36萬元)即可部署,推薦使用4張H20部署,總價(jià)約50萬。因此,從部署成本角度看,千問3旗艦?zāi)P褪菨M血版R1的25%—35%,部署成本大降75%—65%。

據(jù)了解,千問3系列模型依舊采用寬松的Apache2.0協(xié)議開源,并首次支持119多種語(yǔ)言。目前,千問3已上線魔塔社區(qū)、HuggingFace、Github等平臺(tái),全球開發(fā)者、研究機(jī)構(gòu)和企業(yè)均可免費(fèi)下載模型并商用。此外,個(gè)人用戶可通過通義APP直接體驗(yàn)千問3,同時(shí)夸克也即將全線接入千問3。

當(dāng)下,AI產(chǎn)業(yè)已將關(guān)注點(diǎn)從模型訓(xùn)練轉(zhuǎn)向以智能體為核心的AI應(yīng)用,性能更強(qiáng)、成本更優(yōu)的模型將有越來越大的應(yīng)用價(jià)值。通義千問團(tuán)隊(duì)表示:“千問3的發(fā)布和開源將極大地推動(dòng)大型基礎(chǔ)模型的研究與開發(fā)。我們的目標(biāo)是為全球的研究人員、開發(fā)者和組織賦能,幫助他們利用這些前沿模型構(gòu)建創(chuàng)新解決方案?!?/p>

此次開源的千問3型以更小的參數(shù)規(guī)模實(shí)現(xiàn)了更高的智能水平,為開發(fā)者提供了更加多樣的模型尺寸及思考模式選擇,有助于開發(fā)者更好地平衡及控制預(yù)算成本。

通義千問團(tuán)隊(duì)的技術(shù)負(fù)責(zé)人林俊旸在其個(gè)人社交平臺(tái)上表示,花了一些時(shí)間來找方法解決一些并不花哨的問題,比如如何通過穩(wěn)定的訓(xùn)練來擴(kuò)展強(qiáng)化學(xué)習(xí)、如何平衡來自不同領(lǐng)域的數(shù)據(jù)、如何增強(qiáng)對(duì)更多語(yǔ)言的支持等。他還表示,團(tuán)隊(duì)正邁向下一個(gè)階段,即訓(xùn)練智能體來擴(kuò)展長(zhǎng)程推理,同時(shí)更多地關(guān)注現(xiàn)實(shí)世界的任務(wù)。

據(jù)悉,作為與DeepSeek并成為“開源雙子星”的另外一星,阿里通義已開源200余個(gè)模型,全球下載量超3億次,千問衍生模型數(shù)超10萬個(gè),已超越Meta的Llama,成為全球第一開源模型。通過持續(xù)的模型迭代及開源開放,阿里在推動(dòng)AI技術(shù)普及的同時(shí),也增強(qiáng)了中國(guó)在全球開源AI生態(tài)中的影響力。

校對(duì):楊立林

圖片

責(zé)任編輯: 冉超
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,或關(guān)注官方微信公眾號(hào),即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,把握財(cái)富機(jī)會(huì)。
網(wǎng)友評(píng)論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場(chǎng)
暫無評(píng)論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換
    久久精品欧美日韩精品不卡| 人人超级碰青青精品| 国产又粗又猛又色又免费| 亚洲欧美一区二区三区在 | 精品麻豆国产免费一区二区三区| 小嫩骚逼操死你视频| 男人吃奶大鸡巴操逼视频| 欧美国产综合日韩一区二区| 美女玩奶子和鸡巴| 国产91视频观看| 久久久中文字幕一区| 热精品韩国毛久久久久久| 国产免费无码一区二区视频无码| 国产成人无码AV一区二区三区 | 三级无码日B视频| 久久丁香花五月天色婷婷| 日本免费精品一区二区三区四区| 亚洲中文字幕二区不卡| 国产在线麻豆精品| 一区二中文字幕在线看国产一区| 美国大骚逼啊啊啊| 亚洲另类激情在线观看| 让女人下面出水视频| 男女插插调教骚逼| 交换夫妇4中文字幕| 日韩视频无码日韩视频又2020| 欧美精品日韩精品中文字幕| 视频在线观看一区@99| 日本精品久久人妻一区二区三区| 国产 自拍 欧美 在线| 加勒比五月综合久久伊人| 亚洲国产成人久久成人52| 欲色福利网免费在线播放| 国产163黄网人看人人爽| 中文字幕人妻一区二区三区人妻 | 久久精品男人的天堂av| 国产伦精品一区二区三区福利| 彩虹网免费视频在线观看| 三上悠亚精品一区二区久久| 美女麻豆颜色光屁股眼子| 国产成人精品久久久成人|