在AI的牌桌上,埃隆·馬斯克(Elon Musk)從不缺席。
太平洋時(shí)間2月17日,馬斯克旗下人工智能初創(chuàng)公司xAI的大模型Grok-3正式面世。發(fā)布會(huì)上,xAI展示了一系列家族,包括Grok-3(Beta)、Grok-3 mini、首個(gè)推理模型Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning。
同時(shí),xAI還推出了名為Deepsearch的智能搜索引擎Agent工具。從大模型到AI搜索應(yīng)用,xAI緊跟競(jìng)品步伐通通上線。時(shí)?!耙痪€沖鋒”的馬斯克,正加速在AI賽場(chǎng)上奔跑。
在預(yù)告中,馬斯克將Grok-3標(biāo)榜為“地球上最聰明的人工智能”。根據(jù)xAI展示的數(shù)據(jù),Grok-3在多項(xiàng)基準(zhǔn)測(cè)試中超越了DeepSeek-V3、Gemini-2 Pro、GPT-4o,刷新最新成績(jī)。
在大模型的你追我趕中,AI的細(xì)分賽道上,最聰明的AI不斷易主。這場(chǎng)“不進(jìn)則退”的殘酷競(jìng)賽中,馬斯克也著急了。上周他還表示,為了提供最好的用戶體驗(yàn),xAI還在打磨產(chǎn)品,還需要一兩周的時(shí)間。
但是面對(duì)新貴DeepSeek和勁敵OpenAI,馬斯克快馬加鞭急于讓Grok-3亮相。一周后,xAI將會(huì)陸續(xù)上線完整功能,不過當(dāng)前付費(fèi)用戶才能使用,Grok-3也未開源。新王不斷涌現(xiàn),AI界的技術(shù)狂人們還將繼續(xù)過招。
誰是“最聰明的AI”
本次直播發(fā)布的時(shí)間并不長(zhǎng),只有半小時(shí)左右,馬斯克和xAI團(tuán)隊(duì)基本上都在用數(shù)據(jù)和實(shí)操展現(xiàn)Grok-3的“智力”。
和很多模型一樣,Grok-3在數(shù)學(xué)推理、科學(xué)邏輯推理和代碼編寫等方面表現(xiàn)出色。多項(xiàng)基準(zhǔn)測(cè)試成績(jī)顯示,Grok-3在數(shù)學(xué)(AIME 2024)、科學(xué)問答(GPQA)、編碼(LCB)上刷新SOTA(State of the Art,描述在某一特定領(lǐng)域內(nèi)當(dāng)前最佳的技術(shù)、方法或模型),擊敗了谷歌的Gemini-2 Pro、DeepSeek的V3模型、OpenAI的GPT-4o。
按照xAI提供的數(shù)據(jù),在多個(gè)AI領(lǐng)域內(nèi),Grok-3已經(jīng)登頂。馬斯克表示,Grok-3的計(jì)算能力是前一代的“10倍以上”,并于1月初完成了預(yù)訓(xùn)練,“我們每天都在不斷改進(jìn)模型,實(shí)際上在24小時(shí)內(nèi),你就會(huì)看到改進(jìn)。”
AI,正在以每分每秒的速度不分晝夜地進(jìn)化著,大模型廠商之間的火藥味更加濃烈。在Grok-3發(fā)布不久前,OpenAI的CEO Sam Altman還在社交媒體上發(fā)布了GPT-4.5的相關(guān)信息,表示測(cè)試者們嘗試GPT-4.5后,有比預(yù)期更多的“感受到AGI”的時(shí)刻。
在鋪天蓋地的Grok-3報(bào)道中,Sam Altman穿插新品預(yù)告,吸引了不少關(guān)注。Sam Altman和馬斯克的“針鋒相對(duì)”,也將顯示在產(chǎn)品的PK中。
xAI工程師介紹,雖然Grok起步較晚,但在MMLU得分上以超的速度追上了ChatGPT。Grok-3和Grok-3 mini在多方面性能上都超過或媲美Gemini、DeepSeek和ChatGPT等對(duì)手。
與此同時(shí),Grok-3也很明顯在對(duì)標(biāo)競(jìng)品,比如,馬斯克還特別提到了推理性能,而推理是DeepSeek-R1的強(qiáng)項(xiàng)。
馬斯克表示,Grok-3接受了合成數(shù)據(jù)的訓(xùn)練,可以通過反復(fù)檢查數(shù)據(jù)來審查所犯的錯(cuò)誤,以達(dá)到邏輯上的一致性,“因此,如果它得到了錯(cuò)誤的數(shù)據(jù),它會(huì)反思并刪除錯(cuò)誤的數(shù)據(jù)。它的基本推理非常好?!?/p>
而對(duì)于OpenAI,從Grok-3目前的數(shù)據(jù)看,其似乎領(lǐng)先于OpenAI最新的ChatGPT。隨著Grok-3即將上線,xAI和OpenAI之間的競(jìng)爭(zhēng)將日益激烈?!白盥斆鞯腁I”,將會(huì)是一場(chǎng)持續(xù)的排位賽。
大模型競(jìng)速
近年來快速崛起的AI明星著實(shí)不少,xAI當(dāng)屬其一。技術(shù)狂熱又多金的馬斯克,在和OpenAI“決裂”后,轉(zhuǎn)而成立自己的AI公司。
2023年,馬斯克的xAI公司成立,時(shí)隔半年便發(fā)布了Grok和Grok-1.5模型,可謂進(jìn)展迅速。2024年8月,xAI又發(fā)布了Grok-2大模型;12月,xAI宣布開始向X平臺(tái)上的所有用戶免費(fèi)推出新版Grok-2模型,而此前該模式只向訂閱了Premium Plus的用戶開放。
在算力基礎(chǔ)上,馬斯克也迅速囤卡。xAI團(tuán)隊(duì)自建Colossus超級(jí)計(jì)算集群,集群規(guī)模已經(jīng)從10萬塊英偉達(dá)GPU擴(kuò)展到20萬塊,基于自家集群訓(xùn)練出的Grok-3的性能也得到了增強(qiáng)。
在xAI一日千里之時(shí),AI圈的同行也在飚速。2025年,大洋彼岸的DeepSeek-V3和R1掀起新浪潮,尤其是R1為業(yè)內(nèi)稱道。R1大模型的一個(gè)特點(diǎn)是采用了MOE架構(gòu)(混合專家,Mixture-of-Experts),事實(shí)上Grok初代版本也使用了MOE架構(gòu)。在開源世界中,如何練出絕世武功,還得看各家功力。
DeepSeek-R1模型的沖擊下,在AI領(lǐng)域有大動(dòng)作可不止xAI一家,不少公司都陸續(xù)放出大招。
2月6日,OpenAI宣布擴(kuò)大ChatGPT搜索功能的用戶范圍,任何人無需注冊(cè),就可以使用ChatGPT的搜索功能;同一天,谷歌正式推出Gemini 2.0系列模型,包括Flash、Pro及Flash-Lite版本,繼續(xù)提升AI能力,并提供更具性價(jià)比的解決方案。
2月13日,Sam Altman宣布,將很快發(fā)布GPT-5,并且免費(fèi)無限使用;同日,文心一言官宣將于4月1日0時(shí)起全面免費(fèi),并且即日起上線深度搜索功能。
AI的第一梯隊(duì)玩家都感受到“危機(jī)感”,不由得加快了迭代腳步,直接開啟新一輪價(jià)格戰(zhàn),并探索更多應(yīng)用場(chǎng)景形成商業(yè)閉環(huán)。有AI資深人士向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,目前Grok-3需要付費(fèi)使用,馬斯克也在探索解決算力商業(yè)模式問題。
在技術(shù)、Agent應(yīng)用競(jìng)速的同時(shí),大模型廠商的融資也在競(jìng)速。有報(bào)道稱,xAI正在接洽潛在的投資者,計(jì)劃籌集約100億美元資金,此輪融資可能使該公司估值達(dá)到約750億美元;還有報(bào)道稱OpenAI正在進(jìn)行談判,希望在新一輪融資中籌集高達(dá)400億美元,這將使其估值達(dá)到3000億美元。
在這場(chǎng)資金、技術(shù)、智力的金字塔游戲中,大模型競(jìng)速已從單純的技術(shù)迭代演變?yōu)槿S度的生態(tài)博弈。算力軍備競(jìng)賽與開源策略并行,價(jià)格戰(zhàn)倒逼商業(yè)閉環(huán)重構(gòu)。有云計(jì)算高管向記者表示,目前AI產(chǎn)業(yè)已經(jīng)過了炒作階段,開始出現(xiàn)一些真正規(guī)?;膽?yīng)用,大家會(huì)看到更多實(shí)用價(jià)值。
而這場(chǎng)以硅基智能為燃料的競(jìng)逐,能否加速構(gòu)建通向AGI之路,大家都在拭目以待。