嚴(yán)格來說,OpenAI此次發(fā)布的開放權(quán)重模型并不等同于開源模型,卻是當(dāng)前開源模型社區(qū)采用的主流方式。
OpenAI終于變得“Open”了起來。當(dāng)?shù)貢r間8月5日,OpenAI推出了兩款開放權(quán)重的AI模型gpt-oss-120b、gpt-oss-20b,可在開源技術(shù)平臺Hugging Face上免費下載。這也是OpenAI自2019年發(fā)布GPT-2以來,時隔六年再次開放語言模型權(quán)重。
據(jù)OpenAI介紹,gpt-oss的兩款模型在推理任務(wù)上表現(xiàn)優(yōu)于同級別開源模型,能夠適配消費級硬件。其中,gpt-oss-120b的推理能力幾乎與o4-mini模型持平,可在一張80GB的GPU上運行。而gpt-oss-20b的通用表現(xiàn)接近o3-mini,可以直接在配備了16GB內(nèi)存的筆記本電腦上運行。
嚴(yán)格來說,OpenAI此次發(fā)布的開放權(quán)重模型并不等同于開源模型。因為gpt-oss系列公開了其訓(xùn)練參數(shù),讓開發(fā)者能夠基于這些權(quán)重對模型進行定制,但未公布訓(xùn)練數(shù)據(jù)、訓(xùn)練流程等核心細節(jié)。開放權(quán)重是當(dāng)前開源模型社區(qū)采用的主流方式,包括Meta的Llama模型、DeepSeek、阿里Qwen系列等模型。
在解釋開放模型的重要性時,OpenAI表示,gpt-oss模型不僅為開發(fā)者提供了更廣泛的工具選擇,也降低了新興市場、資源受限行業(yè)、預(yù)算或靈活性有限的小型組織使用AI的門檻?!耙粋€健康的開放模型生態(tài),是實現(xiàn)AI廣泛可及、惠及所有人的重要一環(huán)。”
然而,此前OpenAI發(fā)布的絕大多數(shù)模型都是閉源模型。馬斯克也曾多次諷刺稱,OpenAI應(yīng)更名為“ClosedAI”。DeepSeek的開源模型引發(fā)全球關(guān)注后,OpenAI CEO Sam Altman罕見表態(tài)稱,需要重新思考開源策略,“我個人認(rèn)為我們在這個問題上一直站在歷史的錯誤一邊?!?/p>
閉源模型陣營中,OpenAI不是第一家出現(xiàn)轉(zhuǎn)向的公司。在今年2月的財報電話會上,百度聯(lián)合創(chuàng)始人、首席執(zhí)行官李彥宏坦言,百度從DeepSeek學(xué)到的一點是:開源最好的模型可以極大地幫助推廣,人們自然會出于好奇去嘗試它。就在去年,他還曾多次公開表示,“開源模型會越來越落后”。6月,百度也正式開源了其文心大模型4.5系列。
當(dāng)開源的呼聲越來越高時,一向倡導(dǎo)開源的Meta卻似乎在態(tài)度上出現(xiàn)了微妙的轉(zhuǎn)變。在7月30日發(fā)布的公開信中,Meta創(chuàng)始人兼CEO馬克·扎克伯格表示,需要以嚴(yán)謹(jǐn)?shù)膽B(tài)度來應(yīng)對超級智能可能帶來的風(fēng)險,“并謹(jǐn)慎選擇開源內(nèi)容”。
不過一年前,扎克伯格發(fā)表的公開信主題還是“開源AI是前進的道路”。他在其中提到,開源模型正在迅速縮小與閉源模型間的差距,預(yù)計Llama模型將從2025年起成為業(yè)內(nèi)最先進的。然而今年以來,Meta一度陷入低潮。先是DeepSeek帶來的沖擊,隨后4月亮相的Llama 4系列模型,在實測效果上也未能達到外界預(yù)期。
前后追擊下,扎克伯格選擇了大手筆撒錢的“翻牌”策略。先是向數(shù)據(jù)標(biāo)注公司Scale AI投資143億美元,并招來其創(chuàng)辦人兼CEO。之后又斥資數(shù)十億美元招攬OpenAI等其他公司的頂尖AI人才,在硅谷掀起一場瘋狂的“搶人大戰(zhàn)”。這些人才被匯聚到新設(shè)立的Meta Superintelligence Labs部門中,劍指人人可用的個人超級智能,并確保Meta在這一進程中保持引領(lǐng)地位。
Meta發(fā)言人強調(diào),公司對開源AI的立場沒有改變?!拔覀冇媱澙^續(xù)發(fā)布領(lǐng)先的開源模型。”其稱,“我們過去開發(fā)的成果還沒有全部發(fā)布,未來也預(yù)計會繼續(xù)訓(xùn)練開源和閉源模型的混合版本?!?/p>