作為AI智能體的“黑馬”,Manus的爆火一度讓外界對其充滿期待。但經(jīng)過數(shù)月的摸索,Manus“折戟”中國市場。今日(7月19日),Manus創(chuàng)始人罕見發(fā)聲,首次公開回應了這次起落背后的一切。
7月19日,Manus聯(lián)合創(chuàng)始人季逸超發(fā)布了一篇長博客,從技術層面深度復盤從創(chuàng)業(yè)以來在Agent(智能體)研發(fā)與訓練方面的經(jīng)驗教訓。季逸超表示,Manus團隊之所以選擇“套殼”而非自研大模型,正是基于前一次創(chuàng)業(yè)的慘痛教訓,決定基于開源或商業(yè)大模型做“上下文工程”,構(gòu)建智能體。然而,這個過程并不簡單,團隊經(jīng)歷了4次智能體框架調(diào)整才實現(xiàn)局部最優(yōu)解。
通過回溯過去幾個月的創(chuàng)業(yè)歷程,季逸超為智能體賽道創(chuàng)業(yè)者總結(jié)了一系列的經(jīng)驗。他指出,AI智能體的未來在于上下文設計,而非單純比拼模型能力。值得注意的是,最近AI智能體領域迎來了不少新進展,OpenAI推出了ChatGPT智能體系統(tǒng),Kimi發(fā)布了最新的大模型K2,并表示K2的設計目標是“為下一代智能體提供通用認知引擎”。在基礎模型廠商憑借底層模型發(fā)力智能體賽道的背景下,純智能體創(chuàng)業(yè)公司如何在激烈的競爭中立足,成為Manus不得不思考的問題。
從技術層面深度復盤Manus經(jīng)驗教訓
今年3月,一款名為Manus的產(chǎn)品刷屏網(wǎng)絡。這款產(chǎn)品由一家名為“蝴蝶效應”的初創(chuàng)公司研發(fā),被稱為“全球第一款通用Agent產(chǎn)品”,能夠?qū)崿F(xiàn)真正的自主執(zhí)行能力,完成篩選簡歷、做房產(chǎn)研究、股票分析等復雜任務。
一夜爆火后,Manus的內(nèi)測邀請碼“一碼難求“,在二手平臺上甚至被爆炒至數(shù)萬元。然而不到半年時間,Manus就被爆出撤離中國市場的消息,不僅官方微博和小紅書賬號的內(nèi)容均已清空,官網(wǎng)首頁也顯示“Manus在你所在的地區(qū)不可用”。此外,還有消息稱Manus已將總部遷往新加坡,除了核心研發(fā)團隊40多人遷往新加坡,其余約80名非核心員工被裁。對此,Manus對外回應表示:“基于公司自身經(jīng)營效率考量,我們決定對部分業(yè)務團隊進行調(diào)整。公司將繼續(xù)專注核心業(yè)務發(fā)展,提升整體運營效率?!?/p>
從智能體的“當紅炸子雞”到撤離中國市場,Manus一直飽受行業(yè)爭議,外界對其這一選擇也存在諸多猜測。7月19日,Manus聯(lián)合創(chuàng)始人季逸超發(fā)布了一篇長博客,從技術層面深度復盤創(chuàng)業(yè)以來在Agent(智能體)研發(fā)與訓練方面的經(jīng)驗教訓,試圖將輿論拉回到技術與產(chǎn)品本身。
在長文中,季逸超表示在Manus項目的最初階段,他和他的團隊就面臨一個關鍵決定:是使用開源基礎模型訓練一個端到端的智能體,還是基于前沿模型的上下文學習能力構(gòu)建一個智能體?季逸超說,在他的上一段創(chuàng)業(yè)經(jīng)歷中,他從頭開始訓練模型,但隨著GPT-3 和 Flan-T5的出現(xiàn),其內(nèi)部模型“一夜之間變得無關緊要”。正是因為有了這樣的慘痛教訓,Manus 選擇押注于上下文工程而非底層模型,這也使得Manus能快速地改進,進行產(chǎn)品迭代。
具體來看,季逸超總結(jié)了Manus的不少實操經(jīng)驗,為業(yè)內(nèi)同行提供了重要參考。比如,他強調(diào)KV-Cache(Key-Value Cache,一種緩存機制)的命中率至關重要,輸入越穩(wěn)定,緩存命中率越高,成本和延遲越低。因此,創(chuàng)業(yè)者有三種辦法可以提高KV-Cache緩存命中率:一是保持提示前綴穩(wěn)定,避免在提示中使用時間戳;二是使上下文僅追加,避免修改先前的操作或觀察,確保序列化是確定性的;三是在需要時明確標記緩存斷點。
此外,季逸超還提到,動態(tài)修改工具列表會讓緩存失效、模型混亂,因此不要動態(tài)添加工具,而是要使用“遮蔽法”來控制選擇;要用文件系統(tǒng)承載持久上下文,規(guī)避信息丟失;要保留錯誤日志(如失敗的操作、堆棧信息),幫助模型更新內(nèi)部信念,減少重復錯誤等。
并未直接回應撤離中國市場原因
值得注意的是,季逸超的長文主要是技術層面的復盤與探討,但并未對市場關注的裁員、遷址新加坡、撤離中國市場等話題進行直接回應。
Manus雖然此前在國內(nèi)引發(fā)了不少關注,但Manus從創(chuàng)業(yè)之初就有著極強的海外市場基因。發(fā)布之初,Manus就僅僅支持英文,發(fā)布視頻也是全程英文介紹,還需要特殊的網(wǎng)絡條件進行注冊。據(jù)了解,Manus的核心基礎是Claude大模型,這是美國創(chuàng)業(yè)公司Anthropic推出的一款大語言模型,而Anthropic是OpenAI最強勁的競爭對手之一。
此外,今年4月,Manus母公司“蝴蝶效應”還完成了硅谷知名風投Benchmark牽頭,騰訊、真格基金、HSG跟投的7500萬美元B輪融資,主要用于擴張美國、日本、中東等海外市場。
業(yè)內(nèi)人士表示,Manus最初就是瞄準了海外市場,但在國內(nèi)的意外爆火使其開始萌生同時開拓國內(nèi)市場的想法。Manus受到國內(nèi)用戶關注后,曾宣布與阿里通義千問團隊達成戰(zhàn)略合作,雙方將基于通義千問系列開源模型,致力于在國產(chǎn)模型和算力平臺上實現(xiàn)Manus的全部功能。不過,Manus與通義千問的合作始終沒有落地,用戶注冊Manus依然需要特殊的網(wǎng)絡條件。
外界對于Manus撤出中國市場有諸多猜測。有分析人士指出,Manus的B輪融資由美國風投公司Benchmark領投,而美國“對外投資安全計劃”禁止美國資本投資可能增強中國AI技術的項目,Manus將總部遷至新加坡或是為了規(guī)避審查風險。此外,由于Manus主要基于Claude模型,而Claude模型不向國內(nèi)用戶提供服務,即使與阿里通義千問合作,也面臨維護兩套不同產(chǎn)品、成本高、投入產(chǎn)出不成正比等問題。這些原因,或都是其做出這一戰(zhàn)略調(diào)整的主要考量。
AI智能體賽道持續(xù)升溫加速落地
在Manus引發(fā)行業(yè)對“智能體退潮”的憂慮時,近期AI智能體賽道卻迎來了頗多重磅消息和重要技術進展。
7月18日,OpenAI推出了全新智能體產(chǎn)品“ChatGPT Agent”。根據(jù)介紹,這是一個融合Operator智能體網(wǎng)頁交互能力、含“深度研究”(Deep Research)功能的互聯(lián)網(wǎng)信息搜集能力以及ChatGPT對話能力的統(tǒng)一智能體,可以完成包括在線購物、訂餐預約、撰寫研究報告、制作PPT和財務分析在內(nèi)的多步驟復雜任務。
三者組成強力“AI三劍客”,標志著OpenAI全面進軍自動化AI代理領域。值得注意的是,這一智能體產(chǎn)品的底層模型在多個基準測試中提供了最先進的性能,在涵蓋超百個學科的 Humanity' s Last Exam(人類的最后測試)中,得分率達41.6%,約是OpenAI o3和o4-mini 得分的兩倍;在FrontierMath數(shù)學基準測試中,使用工具時得分27.4%,遠超o4-mini 的 6.3% 。
與此同時,Kimi近期也開源了萬億參數(shù)的混合專家模型K2。在Kimi公布的測評結(jié)果中, K2在自主編程、工具調(diào)用和數(shù)學推理三個維度的表現(xiàn)上,都超過了同為開源模型的DeepSeek-V3和阿里Qwen3。Kimi團隊還對外宣稱,K2的設計目標是“為下一代智能體提供通用認知引擎”,其核心亮點是智能體的應用能力,在工具調(diào)用和智能體循環(huán)方面表現(xiàn)極為出色。
多家券商研報表示,隨著各AI巨頭發(fā)力智能體產(chǎn)品商業(yè)化,2025年有望成為AI Agent元年。中金研報指出,基礎大模型仍是決定Agent能力上限的關鍵,大模型的編程及智能體能力也是各家廠商競爭關注的焦點。C端Agent具有更大的市場想象空間,因此也是大廠和創(chuàng)業(yè)公司更為聚焦的領域,無論是海外的OpenAI、Google還是國內(nèi)的字節(jié)、阿里,以及Manus、Genspark等創(chuàng)業(yè)公司都在這一領域積極布局,近半年來產(chǎn)業(yè)進展顯著。
不過,當前智能體類產(chǎn)品存在同質(zhì)化嚴重、商業(yè)化路徑不明等問題,在基礎模型廠商憑借底層模型發(fā)力智能體賽道的背景下,純智能體創(chuàng)業(yè)公司如何在激烈的競爭中立足,成為Manus不得不思考的問題。
校對:陶謙