日韩人妻av一区二区-精品国产综合区久久久久久蜜臀-色女激情五月激情五月-99热国产这里只有的精品

阿里發(fā)布并開源千問3,稱成本僅需DeepSeek-R1三分之一
來源:第一財經(jīng)作者:陳楊園2025-04-29 09:24

4月29日凌晨,阿里巴巴宣布推出新一代通義千問模型Qwen3(千問3)并進行開源。阿里云方面表示,千問3是國內首個“混合推理模型”,將“快思考”與“慢思考”集成進同一個模型,參數(shù)量僅為DeepSeek-R1的1/3,成本大幅下降,并在ChatBot Arena等榜單中性能全面超越R1、OpenAI-o1等全球頂尖模型,登頂全球最強開源模型。知情人士對記者表示,這是今年上半年阿里云最核心的技術產(chǎn)品發(fā)布。

具體來看,通義千問官方發(fā)布的技術博客顯示,千問3采用混合專家(MoE)架構,總參數(shù)量235B,激活僅需22B。預訓練數(shù)據(jù)量達36T ,并在后訓練階段多輪強化學習。同時將非思考模式無縫整合到思考模型中,對簡單需求可“快思考”,低算力“秒回”答案,對復雜問題可多步驟“深度思考”,兩種模式的結合增強了模型實現(xiàn)穩(wěn)定且高效的“思考預算”控制能力。

阿里云方面表示,性能大幅提升的同時,千問3的部署成本大幅下降,僅需4張H20即可部署千問3滿血版,顯存占用僅為DeepSeek-R1的三分之一。

目前,千問3已開源了2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,阿里云透露,千問3的30B參數(shù)MoE模型實現(xiàn)了10倍以上的模型性能杠桿提升,僅激活3B就能實現(xiàn)上代Qwen2.5-32B模型性能。所有千問3模型都是混合推理模型,API可按需設置“思考預算”(即預期最大深度思考的tokens數(shù)量),靈活滿足AI應用和不同場景對性能和成本的多樣需求。

開源后,用戶可在魔搭社區(qū)、HuggingFace等平臺下載模型并商用,也可以通過阿里云百煉調用千問3的API服務。個人用戶可通過通義APP體驗千問3,記者了解到,夸克也即將全線接入千問3。

未來,千問3將通過優(yōu)化模型架構和訓練方法等提升模型,以實現(xiàn)幾個關鍵目標:擴展數(shù)據(jù)規(guī)模、增加模型大小、延長上下文長度、拓寬模態(tài)范圍,并利用環(huán)境反饋推進強化學習以進行長周期推理。通義千問團隊在技術博客中表示,“Qwen3 代表了我們在通往通用人工智能(AGI)和超級人工智能(ASI)旅程中的一個重要里程碑。我們認為,我們正從專注于訓練模型的時代過渡到以訓練 Agent 為中心的時代。”

責任編輯: 李志強
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據(jù)此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    裸毛片视频在线视频| 国产精品熟女一区二区三区久久夜| 天堂丝袜人妻中文字幕在线| 大几吧插进小穴视频| 白虎鲍鱼抠逼免费看| 无码av一区二区大桥久未| 大鸡鸡插我骚逼视频| 一级特一黄大片欧美久久| 久久99热东京热亲亲热| 2021国产精品自在自线| 91热国产在线观看| 亚洲欧美一区二区三区在| 最新AV中文字幕在线看| 人妻熟女av一区二区三区| 亚洲欧美一区二区三区在| 日本福利一区二区视频| 操大屌粉的小穴视频| 女女同性女同1区二区三| 黑人大屌大战中国女| 插欧美美女逼逼逼逼| 久久噜噜噜久久熟女精品| 大鸡吧干小逼逼视频大全| 熟妇丰满大阴户熟妇啪啪| 在线免费观看一区二区三区| 精品人妻一区二区三区日产乱码| 啊啊啊好疼视频进来| 国内不卡的中文字幕一区| 裸体美女被操的啊啊直叫| 正在播放 国产精品推荐| 裸体美女被操的啊啊直叫| 外国处女BB视频| 久久久久黑人强伦姧人妻| 韩国三级a视频哪里看| 亚洲日韩国产欧美久久久| 大肉棒插了按摩视频| 女人扒开腿让我舔十八禁| 国产91视频观看| 骚女性爱视频在线看| 国产91视频观看| 亚洲欧美一区二区三区在| 亚洲欧美日韩精品一区二区|