最新進(jìn)展!
3月25日晚,DeepSeek又有大消息傳來。該公司在官方賬號上正式宣布V3模型完成小版本升級的消息,并介紹了新版本DeepSeek-V3-0324模型的提升細(xì)節(jié),包括推理、前端開發(fā)、中文寫作、中文搜索幾個方面的能力優(yōu)化。另據(jù)海外專業(yè)AI模型評測機(jī)構(gòu)最新排名,新版V3模型現(xiàn)在是得分最高的非推理模型,超過xAI的Grok3和OpenAI的GPT-4.5(preview)。
值得注意的是,北京時間昨天晚上,人工智能大模型“暗戰(zhàn)”不斷。當(dāng)?shù)貢r間3月25日,美國開放人工智能研究中心(OpenAI)宣布推出4o圖像生成功能,“將迄今最先進(jìn)的圖像生成器集成至GPT-4o”。谷歌也發(fā)布Gemini 2.5系列人工智能推理模型,其首個版本Pro Experimental一登場就搶下大模型競技場第一名,并且整整比GPT-4.5高出40分。
再度引爆:又變強(qiáng)了!
3月25日晚間消息,DeepSeek宣布V3模型已完成小版本升級,目前版本號 DeepSeek-V3-0324,用戶登錄官方網(wǎng)頁、APP、小程序進(jìn)入對話界面后,關(guān)閉深度思考即可體驗。
據(jù)悉,DeepSeek-V3-0324 API接口和使用方式保持不變。如非復(fù)雜推理任務(wù),建議使用新版本V3模型,即刻享受速度更加流暢、效果全面提升的對話體驗。
模型推理任務(wù)表現(xiàn)提高,新版V3模型借鑒DeepSeek-R1模型訓(xùn)練過程中所使用的強(qiáng)化學(xué)習(xí)技術(shù),大幅提高了在推理類任務(wù)上的表現(xiàn)水平,在數(shù)學(xué)、代碼類相關(guān)評測集上取得了超過GPT-4.5的得分成績。
DeepSeek-V3-0324與之前的DeepSeek-V3使用同樣的base模型,僅改進(jìn)了后訓(xùn)練方法。私有化部署時只需要更新checkpoint和tokenizer_config.json(tool calls相關(guān)變動)。模型參數(shù)約660B,開源版本上下文長度為128K(網(wǎng)頁端、App和API提供64K上下文)。
不過,外界對于DeepSeek-V3-0324的關(guān)注并不僅僅因為該版本的能力提升,而是猜測它的發(fā)布是否意味著DeepSeek更新一代的V4與R2大模型的發(fā)布不遠(yuǎn)了。
DeepSeek方面表示,一是新版本代碼能力顯著提升,接近Claude 3.7水平。例如,有用戶在實測中發(fā)現(xiàn),V3-0324能一次性生成800行無錯誤的網(wǎng)頁代碼,并實現(xiàn)動態(tài)響應(yīng)式布局和交互效果。二是數(shù)學(xué)與邏輯推理能力增強(qiáng)。例如經(jīng)典的“4升水壺問題”和數(shù)學(xué)競賽題(如AIME 2025題目),部分表現(xiàn)接近專業(yè)推理模型。三是模型架構(gòu)與開源生態(tài)。V3-0324采用MIT許可證,允許自由修改、分發(fā)及商業(yè)化應(yīng)用,進(jìn)一步降低了開發(fā)者的使用門檻。
暗戰(zhàn)不斷
就在DeepSeek宣布V3模型已完成小版本升級的同時,當(dāng)?shù)貢r間3月25日,美國開放人工智能研究中心(OpenAI)宣布推出4o圖像生成功能,“將迄今最先進(jìn)的圖像生成器集成至GPT-4o”。即日起,所有Plus、Pro、Team及免費(fèi)用戶將陸續(xù)在ChatGPT和Sora中體驗該功能,企業(yè)版與教育版即將接入,Sora平臺同步啟用。開發(fā)者即將通過API調(diào)用GPT-4o圖像生成功能,接口權(quán)限將于未來數(shù)周內(nèi)開放。據(jù)介紹,GPT-4o圖像生成功能可精準(zhǔn)文本渲染、嚴(yán)格遵循指令提示、深度調(diào)用4o知識庫及對話上下文——包括對上傳圖像進(jìn)行二次創(chuàng)作或?qū)⑵滢D(zhuǎn)化為視覺靈感。
谷歌也發(fā)布了Gemini 2.5系列人工智能推理模型。該系列模型在回答問題前會“思考”片刻。作為這一系列模型的首發(fā)產(chǎn)品,Gemini 2.5 Pro Experimental已經(jīng)率先亮相。這款多模態(tài)推理人工智能模型被谷歌稱為“目前最智能的模型”,支持高達(dá)100萬Token的超大上下文窗口,單次可以處理約75萬英文單詞,遠(yuǎn)超《指環(huán)王》三部曲的總字?jǐn)?shù)。
谷歌透露,未來Gemini 2.5 Pro將支持200萬Token的雙倍輸入長度。這一模型將于周二登陸谷歌開發(fā)者平臺Google AI Studio,同時向每月支付20美元訂閱“Gemini Advanced”的用戶開放。谷歌表示,未來所有新推出的人工智能模型都將集成推理能力。
值得注意的是,Gemini 2.5系列首個版本Pro Experimental一登場就搶下大模型競技場第一名,并且整整比GPT-4.5高出40分!谷歌介紹稱,相較于Gemini 2.0 Flash Thinking這個谷歌首個推理模型,Gemini 2.5在基礎(chǔ)模型和后訓(xùn)練技術(shù)上都有改進(jìn)。不僅是在大模型競技場上一舉拿下高分,在各種推理、數(shù)學(xué)、科學(xué)、編程基準(zhǔn)上,Gemini 2.5 Pro都表現(xiàn)出色,屬于是編程能跟Claude 3.7 Sonnet掰手腕,數(shù)學(xué)能跟Grok 3相媲美。
人工智能光環(huán)仍在
就在DeepSeek的最新動作之后,騰訊也快速行動。3月26日凌晨,騰訊元寶迎來重大升級,同時接入兩大模型:深度思考模型“騰訊混元T1”正式版,和DeepSeek V3-0324最新版。
機(jī)構(gòu)認(rèn)為,當(dāng)前人工智能對于中國資產(chǎn)的加持光環(huán)可能依然存在。高盛發(fā)布最新研究報告稱,在今年中國股票上漲約20%之后,預(yù)計還會有更多基本面驅(qū)動的上漲,不過重申牛市可能因事件風(fēng)險和獲利回吐壓力而放緩。
分析師Kinger Lau等在報告中指出,根據(jù)對投資者的調(diào)研,基于宏觀、政策等方面的原因,股票投資者似乎對美國關(guān)稅擔(dān)憂感到輕松,原因可能是一些投資者相信相比貿(mào)易戰(zhàn)1.0,中國當(dāng)前似乎更有能力應(yīng)對外部需求逆風(fēng),因?qū)γ绹苯映隹诘臏p少和產(chǎn)品競爭力的提高。
盡管對于人工智能潛在獲益的問題和爭論已經(jīng)浮出水面,但是大多數(shù)投資者認(rèn)可中國人工智能敘事是游戲規(guī)則改變者。預(yù)計人工智能的廣泛應(yīng)用將會在未來十年每年提升中國每股收益預(yù)測2.5%,并帶來潛在的超過2000億美元的投資組合資金流入。
排版:王璐璐????
校對:楊立林????????????????