日韩人妻av一区二区-精品国产综合区久久久久久蜜臀-色女激情五月激情五月-99热国产这里只有的精品

OpenAI重磅發(fā)布GPT-5!性能大幅提升至“專家級別”
來源:證券時報網(wǎng)作者:周春媚2025-08-08 18:35

在頻頻“跳票”和多次“劇透”之后,萬眾期待的GPT-5終于發(fā)布了。

北京時間8月8日凌晨1時,OpenAI舉行了長達1個多小時的線上發(fā)布會,正式推出了GPT-5。與此前的模型更新直播時間短且主要由研發(fā)人員發(fā)布相比,GPT-5的發(fā)布明顯規(guī)格更高,不僅發(fā)布時間長、細節(jié)多,而且OpenAI首席執(zhí)行官山姆·奧特曼也現(xiàn)身發(fā)布會現(xiàn)場。

263f9e75eede68f33cf60ceddbe98ace.jpg

經(jīng)證券時報記者梳理,發(fā)布會的主要亮點如下:

集成模型:GPT-5是一個集成模型(integrated model),融合了大語言模型GPT系列和推理模型o系列,這意味著用戶在使用時不再需要手動切換各類不同的模型。

能力提升:據(jù)OpenAI公開的測試數(shù)據(jù),GPT-5在數(shù)學(xué)、編程、視覺感知和健康等領(lǐng)域,都表現(xiàn)出了頂尖性能,全部大幅度超越前代,成為目前最強大模型。

幻覺降低:與GPT-4o相比,GPT-5的事實錯誤率降低了45%;深度思考模式下,事實錯誤率則比o3降低80%,變得更加準(zhǔn)確和可靠。

“專家級別”的大模型,智能且融合水平高

在發(fā)布會上,奧特曼對GPT-5給出了極高評價,稱其是“此前所有模型的巨大飛躍”。他還表示,如果說GPT-4是一個大學(xué)生,那么GPT-5就是“真正的專家”。

GPT-5最核心的亮點是,它并非單一的語言或者推理模型,而是整合了GPT系列(大語言模型)和o系列(推理模型),具備調(diào)度子模型的能力。奧特曼在其個人社交平臺上連發(fā)十余條推文介紹GPT-5,其中首條就強調(diào)“GPT-5是一個集成模型,這意味著不再需要模型切換器,它將自行決定何時需要更深入地思考”。

42f43d8b3315f5d40f352833469b4170.jpg

據(jù)介紹,GPT-5首次使用了內(nèi)嵌式三位一體集成架構(gòu),系統(tǒng)由三部分組成,分別是處理常規(guī)問題的GPT-5-main模型、解決復(fù)雜任務(wù)的GPT-5-thinking 深度思考模型、以及實時決策的路由機制,還有一個是額度使用完后啟動的mini版本。其中,實時決策的路由機制會根據(jù)對話類型、復(fù)雜程度、工具需求以及用戶的明確意圖,快速決定使用哪個模型,自主決定是否進入深度思考模式,自動匹配最適合的模型。

根據(jù)OpenAI公開的測試數(shù)據(jù),GPT-5在數(shù)學(xué)、編程、視覺感知和健康領(lǐng)域表現(xiàn)均大幅超越前代模型,展現(xiàn)了頂尖的性能。例如在數(shù)學(xué)領(lǐng)域,GPT-5在2025年AIME測試中無工具輔助達到94.6%,大幅超過了o3模型;在健康領(lǐng)域,GPT-5的表現(xiàn)大幅超越包括GPT-4o、o1、o3和o4-mini在內(nèi)的所有前代模型。

值得注意的是,在大模型競技場LMArena上,剛剛上線的GPT-5憑借著極強的性能在所有細分類目中都位列第一。

45aa6f64d757c10836b98e2edbc9372b.png

應(yīng)用場景方面,據(jù)現(xiàn)場展示的多個案例,GPT-5編碼能力突出,只需要幾句話就可以創(chuàng)建一個名為“Jumping Ball Runner”的游戲。該游戲界面色彩豐富,游戲角色采用卡通風(fēng)格設(shè)計,且具備最高分記錄功能、重試按鈕、趣味音效等多種特色功能。此外,GPT-5還可以用幾分鐘就開發(fā)一個學(xué)習(xí)法語的網(wǎng)絡(luò)應(yīng)用、一個復(fù)雜的財務(wù)分析模版等等。

3e0233314bf90a4bf301abfbb3c09f3c.png

作為長期被用戶吐槽的重災(zāi)區(qū),“AI幻覺”一直是所有大模型難以克服的痛點。GPT在減少AI幻覺方面,展現(xiàn)了行業(yè)領(lǐng)先的水平。據(jù)介紹,與GPT-4o相比,GPT-5的事實錯誤率降低了45%;在深度思考模式下,事實錯誤率更是比o3大幅下降80%,變得更加準(zhǔn)確可靠。在開放性事實準(zhǔn)確性基準(zhǔn)LongFact和FActScore測試中,GPT-5的幻覺率比o3減少大約六倍,長篇內(nèi)容生成的準(zhǔn)確性顯著提升。

GPT-5擁有GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四個版本,免費用戶的GPT-5用量有限,超過限額后將自動轉(zhuǎn)至GPT-5-mini,GPT-5-pro僅供Pro訂閱用戶使用。

定價方面,GPT-5、GPT-5-mini、GPT-5-nano三款模型可面向開發(fā)者提供API服務(wù),三款模型的輸入、輸出價格分別為每百萬token 1.25美元/10美元、每百萬token 0.5美元/5美元、每百萬token 0.15美元/1.5美元。與主要競爭對手Anthropic和谷歌相比,OpenAI的GPT-5模型對于開發(fā)人員來說成本相當(dāng)甚至更低。

此前差點“難產(chǎn)”,被質(zhì)疑進步不夠驚艷

GPT-5一直是OpenAI最受外界關(guān)注和期待的產(chǎn)品。但在過去的一年多時間里,盡管頻頻有GPT-5即將發(fā)布的消息傳出,但也屢屢“跳票”,始終未能如約而至。

在此期間,OpenAI發(fā)布了許多復(fù)雜的模型產(chǎn)品與功能更新??傮w來看,OpenAI模型有GPT(大語言模型)和o(推理模型)兩大核心系列,同時還通過Turbo、mini、high等后綴或內(nèi)部代號來區(qū)分模型的版本與特性。據(jù)統(tǒng)計,OpenAI對外提供服務(wù)的模型數(shù)量已超過了40個,尺寸、上下文窗口、價格各異。大量的模型讓用戶面臨“選擇困難癥“。

在今年6月的一場播客節(jié)目中,奧特曼也提到,產(chǎn)品發(fā)布節(jié)奏失控是復(fù)雜化的主因,他表示希望未來不會出現(xiàn)更復(fù)雜的命名方式,盡快走出當(dāng)前o4-mini、o3、4o等略顯混亂的命名局面。“我期待著GPT-5和GPT-6的到來,這樣人們使用起來會更簡單,不用再糾結(jié)于o4-mini-high或o3這樣的版本。”奧特曼說。

之所以衍生出這么多模型產(chǎn)品并且再三推遲GPT-5的發(fā)布時間,原因是GPT-5的研發(fā)一直不順利,沒有達到期待??v觀OpenAI在推出GPT-4以后的大多數(shù)模型,都屬于"漸進式優(yōu)化",沒有復(fù)刻像GPT-4那樣巨大的性能飛躍。

值得注意的是,在GPT-5發(fā)布前夕,多個信源爆料稱,GPT-5并未取得明顯技術(shù)突破,依然沒有像GPT-4那種級別的進步。此外,由于Meta前段時間瘋狂“挖人”,一大批核心研究者被高薪挖走,導(dǎo)致內(nèi)部組織結(jié)構(gòu)陷入混亂,讓GPT-5的研發(fā)進一步陷入困境。據(jù)知情人士爆料,直到今年6月,OpenAI開發(fā)的模型中沒有一個能配得上GPT-5的名號,內(nèi)部也無法確認哪個模型版本足以稱之為GPT-5。

一名人工智能資深研究員告訴證券時報記者,雖然GPT-5 在編程、數(shù)學(xué)推理、智能體等方面表現(xiàn)有所進步,但仍然只是“漸進式優(yōu)化”,而非顛覆性、跨越式的提升。GPT-5表現(xiàn)不夠驚艷的核心原因在于,大模型訓(xùn)練遵循Scaling Laws(縮放定律),即模型性能隨著參數(shù)規(guī)模、訓(xùn)練數(shù)據(jù)量、計算資源的增加而提升。如今這一定律正在放緩,預(yù)訓(xùn)練帶來的邊際收益在減弱,而且全球高質(zhì)量數(shù)據(jù)已經(jīng)枯竭,這也使得OpenAI的訓(xùn)練資源面臨瓶頸,模型性能提升十分有限。

正以5000億美元估值進行員工股份出售

此次推出GPT-5,除了回應(yīng)市場長期以來的期待,或許還與OpenAI近期正在進行的資本運作有關(guān)。據(jù)外媒8月6日報道,知情人士透露,OpenAI正以約5000億美元的估值對現(xiàn)任和前任員工潛在的股票二次出售展開初步談判。

值得注意的是,就在一周以前,OpenAI才成功融資83億美元,投資者包括黑石集團、TPG、T.Rowe等,估值達到3000億美元。若股票二次出售的交易成功,OpenAI的賬面估值將較此前估值增長約三分之二,并將一舉超越SpaceX,成為全球最具價值的獨角獸。

GPT-5的發(fā)布,將進一步鞏固OpenAI在大模型技術(shù)領(lǐng)域的領(lǐng)先優(yōu)勢,提振投資者信心,有助于公司估值的增長及股票二次出售計劃的實施。

業(yè)內(nèi)人士分析,最近一段時間,硅谷的“搶人大戰(zhàn)”趨于白熱化,OpenAI多名核心研發(fā)人員的離職給公司帶來重創(chuàng)。OpenAI此舉旨在為員工提供兌現(xiàn)機會,同時作為人才激勵工具,在不稀釋公司控制權(quán)的情況下,增強員工忠誠度。

除此以外,為了增強對人才的吸引力,Hyperbolic AI首席執(zhí)行官Yuchen Jin在社交平臺上表示,他在OpenAI任職的朋友透露,奧特曼近日宣布將在兩年內(nèi)為每名員工提供150萬美元獎金。

校對:彭其華

責(zé)任編輯: 高蕊琦
聲明:證券時報力求信息真實、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風(fēng)險自擔(dān)
下載“證券時報”官方APP,或關(guān)注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換