日韩人妻av一区二区-精品国产综合区久久久久久蜜臀-色女激情五月激情五月-99热国产这里只有的精品

頭部企業(yè)搶奪標(biāo)準(zhǔn)定義權(quán),機器人“暗戰(zhàn)”升級
來源:第一財經(jīng)作者:喬心怡2025-08-14 14:18

一個能夠意識到失敗的機器人,或許比一個永不出錯的機器,更接近AGI(Artificial General Intelligence,通用人工智能)。

在過去的幾天中,第一財經(jīng)記者近距離看到了多次“失誤”:機器人鋪床時意外卡殼、運動時突然中斷“抽搐”、操作中出現(xiàn)延遲……但部分機器人能夠在任務(wù)失敗后,不斷嘗試新的解法——這種由數(shù)據(jù)驅(qū)動的閉環(huán)大模型帶來的感知與反復(fù)嘗試能力,恰恰是行業(yè)追逐的技術(shù)亮點。

但圍繞機器人大模型的分歧也在不斷加劇。有人堅持“統(tǒng)一模型直出”,有人選擇分層設(shè)計,算力消耗、延遲表現(xiàn)與落地場景成為博弈焦點。另一方面,機器人企業(yè)也不斷推出靈活度更高、更便宜的本體或自研核心零部件產(chǎn)品來搶占市場。

現(xiàn)階段,共識或許并非必須。在模型或本體的局部競爭之外,行業(yè)領(lǐng)先者們正搶奪更重要的話語權(quán):誰來制定統(tǒng)一的性能測評標(biāo)準(zhǔn)?誰能掌握核心數(shù)據(jù)集的開放權(quán)與主導(dǎo)權(quán)?這些問題的答案或許將直接決定未來的行業(yè)競爭格局。

機器人失敗了,也會思考了

機器人正在收拾床鋪,但它的抓夾突然停頓,身體失去了平衡,死死地咬住被子的一角不放開。

在機器人主動嘗試幾次調(diào)整角度也未能找到角度松開抓夾時,許華哲宣告了這次任務(wù)的失敗。他說:“我們的機器人似乎沒有找到一個很好的辦法來繼續(xù)完成這次任務(wù),希望大家給他一些時間,稍后再來觀看?!?/p>

許華哲是清華大學(xué)交叉信息研究院助理教授,同時也是星海圖的聯(lián)合創(chuàng)始人。第一財經(jīng)記者在一旁全程觀察到了這次“失敗”,許華哲告訴記者,在具身智能模型發(fā)展初期,這個狀況發(fā)生非常正常,“就這幾天機器人的工作情況來看,這種情況的發(fā)生概率不高”。

機器人的“失敗”時刻。圖片來源:喬心怡

機器人的“失敗”時刻。圖片來源:喬心怡

星海圖首席科學(xué)家、清華交叉信息學(xué)院助理教授趙行在向記者提及此事的時候,也坦言,在這次失敗的過程里,他希望大家能看到的是模型自主學(xué)習(xí)的能力。這個執(zhí)行鋪床任務(wù)的機器人身上搭載的是星海圖新發(fā)布的端到端雙系統(tǒng)全身VLA模型G0?!拔覀冋谧龅氖且粋€閉環(huán)的大模型系統(tǒng),所以在搭載G0的機器人察覺到自己任務(wù)失敗之后,他仍然會反復(fù)嘗試去完成任務(wù)。”

“他起碼能夠意識到自己沒有成功,這是數(shù)據(jù)驅(qū)動的具身大模型一個典型的標(biāo)志?!壁w行解釋,傳統(tǒng)的機器人系統(tǒng),更多是按照既定程序機械執(zhí)行,一旦出現(xiàn)偏差,也會像“走流程”一樣繼續(xù)做下去,哪怕動作已經(jīng)脫離目標(biāo)。

但由數(shù)據(jù)驅(qū)動的具身大模型,也是這一波具身智能AI模型的追逐點,是機器人能夠利用模仿學(xué)習(xí)、強化學(xué)習(xí)等方式,通過傳感器感知環(huán)境狀態(tài),將實時反饋與任務(wù)目標(biāo)進行比對,如果判斷未達成預(yù)期,就會觸發(fā)新的動作嘗試。

這種能力并非源自人工預(yù)設(shè),而是依靠大量數(shù)據(jù)訓(xùn)練與模仿學(xué)習(xí)逐步習(xí)得,因此它不僅會“做動作”,還會“評估結(jié)果”,并且不斷學(xué)習(xí),最終“琢磨”出一個可行方案。

沒有共識又如何?擊穿場景才是正經(jīng)事

在過去的幾天中,包括星海圖、自變量、宇樹科技等機器人企業(yè)創(chuàng)始人在內(nèi),都在公開場合表達了對具身智能大模型的追逐。

具身智能大模型的背后,是數(shù)據(jù)、算力和算法。數(shù)據(jù)和算法又有緊密的關(guān)系——數(shù)據(jù)規(guī)模越大,對算力的需求越高,而算力的提升又直接拓展了可處理的數(shù)據(jù)量級與模型復(fù)雜度。

正如宇樹科技的創(chuàng)始人王興興所說:“大家對于基礎(chǔ)數(shù)據(jù)的關(guān)注度太高了?!彼J為,相比數(shù)據(jù),機器人的模型架構(gòu)是更應(yīng)該探討的點,因為現(xiàn)在的模型“不夠好,也不夠統(tǒng)一”。

當(dāng)前,業(yè)界追求的主流大模型方向為VLA(Vision-Language-Action,視覺語言動作)模型。自變量機器人創(chuàng)始人兼CEO王潛告訴記者,業(yè)界對VLA模型的定義并非絕對統(tǒng)一,“相對寬泛的定義是,只要模型具備視覺、語言和動作處理能力,就可以稱為VLA模型”。從這個角度上看,目前業(yè)內(nèi)大部分模型都可歸入這一范疇。

不過,在具體架構(gòu)上,各家企業(yè)都還在探索自己的路。自變量的通用具身大模型WALL-A并沒有采用分層架構(gòu),而是將視覺、語言和動作的輸入輸出全部交由同一個模型完成,省去了中間分層銜接帶來的損耗?!斑@是為了提升模型效率。”王潛解釋,如果采用分層架構(gòu),隨著信息在不同層之間傳遞,某一層產(chǎn)生的微小誤差可能會在后續(xù)環(huán)節(jié)呈指數(shù)級擴散。

這種“一個模型直出”的構(gòu)型,意味著WALL-A不需要為感知、決策、控制分別調(diào)用模型。理論層面,只要模型學(xué)習(xí)到了豐富的原子技能,就能將長序列任務(wù)拆解為這些技能的組合,從而處理更長序列的任務(wù),并執(zhí)行更復(fù)雜的推理與規(guī)劃。

王潛也向記者坦言,這個構(gòu)型所需要的算力是“巨量”的,“統(tǒng)一模型的推理過程需要大量算力支撐,因此訓(xùn)練成本很高”。且長程推理雖然具備更強的泛化能力,但也可能帶來延遲,在工業(yè)生產(chǎn)等高節(jié)拍場景中未必適用。

對于這一點,自變量也有明確的商業(yè)打法。王潛說,目前團隊的短期目標(biāo)是攻下商業(yè)服務(wù)和公共服務(wù)的場景,如酒店和養(yǎng)老院等。在更貼近C端的場景完成足夠復(fù)雜的任務(wù),有助于其展現(xiàn)WALL-A模型的長程推理優(yōu)勢?!拔覀儾⒉痪窒抻谀硞€單點技能,而是希望他能夠在真實的世界里做一些傳統(tǒng)自動化無法替代的工作?!?/p>

“只要能成功擊穿一個標(biāo)桿場景,就證明了我們技術(shù)路線的商業(yè)價值,屆時我們撬動的將是一個千億元甚至萬億元級別的巨大市場,實現(xiàn)規(guī)?;虡I(yè)落地將是水到渠成的事。”王潛說。

搶奪標(biāo)準(zhǔn)定義權(quán),誰會成功?

在和趙行、王潛、許華哲等人交流的過程當(dāng)中,第一財經(jīng)記者注意到,benchmark是一個被他們提及的高頻詞。Benchmark指的是用來檢驗和對比模型好壞的統(tǒng)一測評標(biāo)準(zhǔn),就像一場所有人都參加的統(tǒng)一考試。在這場考試中,也許沒有標(biāo)準(zhǔn)答案,但能夠通過比較判斷出模型的好壞。

Benchmark也能夠作為衡量具身智能大模型的標(biāo)準(zhǔn)之一。只是,這個測評標(biāo)準(zhǔn)的定義尚未清晰,行業(yè)中已經(jīng)出現(xiàn)了一些企業(yè),希望來定義這個標(biāo)準(zhǔn)。

星海圖于近日開源了數(shù)據(jù)集 Galaxea Open-World Dataset。這個500小時的數(shù)據(jù)集不再僅僅包括簡單的拿放操作數(shù)據(jù),還包括軀干和移動數(shù)據(jù),涵蓋超過150種任務(wù)。星海圖目前已經(jīng)宣布面向全球具身智能開發(fā)者開源。

至于開源的目的,趙行告訴第一財經(jīng)記者,他希望這次數(shù)據(jù)集的開源,對于行業(yè)來說能夠構(gòu)成一個很好的衡量標(biāo)準(zhǔn)。“具身智能在模型層面的發(fā)展,在過去很難被衡量?!壁w行說,但如果大家用相同的數(shù)據(jù)和本體去訓(xùn)練模型,那通過結(jié)果能夠很快比較出誰的算法更優(yōu)。

為模型的優(yōu)劣提供一個評判標(biāo)準(zhǔn),這一舉措的背后藏著更大的野心?!拔覀兿M峁?shù)據(jù),吸引更多人來參與到我們的生態(tài)當(dāng)中,讓星海圖成為一個能夠服務(wù)更多開發(fā)者的平臺型、生態(tài)型的公司?!壁w行說。

想要成為機器人平臺型公司的企業(yè)并不只有星海圖一家。除了一直強調(diào)全棧能力的智元、傅利葉等機器人企業(yè)之外,此前在本體領(lǐng)域一向低調(diào)的自變量機器人也首發(fā)了全自研輪式雙臂仿人形機器人“量子2號(Quanta X2)”和自研的靈巧手。同時,自變量也在研發(fā)自己的遙操平臺工具。

自變量新發(fā)布的本體。圖片來源:受訪者供圖。

自變量新發(fā)布的本體。圖片來源:受訪者供圖。

從數(shù)據(jù)環(huán)節(jié),到核心零部件,再到機器人的本體和大模型,原本強調(diào)單點能力的企業(yè),正在劍指更大的生態(tài)環(huán)節(jié)。

共識尚未達成,頭部企業(yè)的野心已經(jīng)顯現(xiàn)。“不同企業(yè)在VLA與強化學(xué)習(xí)等技術(shù)路徑上有差異,但這并不是‘二選一’的問題?!笔壮炭毓啥聲k公室總經(jīng)理康雨向第一財經(jīng)記者如是說道。

去年,首程控股參與設(shè)立并管理了規(guī)模總計100億元的“北京機器人產(chǎn)業(yè)發(fā)展投資基金”,并且已經(jīng)參與投資了星海圖、自變量、宇樹科技等企業(yè)。在首程控股投資的企業(yè)中,各家的技術(shù)路徑分歧已經(jīng)出現(xiàn),比如星海圖采用的是分層模型,而自變量則堅持統(tǒng)一模型直出??涤暌蔡寡裕軜?gòu)是模型的核心與底層問題,“因為它直接決定未來需要的數(shù)據(jù)量、算法的絲滑程度,以及訓(xùn)練中要消耗多少算力”。

“根據(jù)我們的觀察,幾乎每一家涉及具身智能的公司,都在不斷迭代自己的架構(gòu)?!笨涤晖饬送跖d興此前表達的觀點:架構(gòu)決定了后續(xù)的訓(xùn)練成本與效率。她說,一套優(yōu)秀的模型架構(gòu)可能只需極少的數(shù)據(jù)就能完成泛化,而也許能夠成為企業(yè)的核心競爭力。

在康雨看來,技術(shù)的優(yōu)勢不僅關(guān)乎當(dāng)下機器人的性能表現(xiàn),更決定了企業(yè)未來能否以可控的成本實現(xiàn)規(guī)?;涞亍?/p>

對于正處在快速迭代中的機器人行業(yè)而言,這或許才是真正的分水嶺——跑得快并不難,難的是在長跑中保持速度與耐力。

責(zé)任編輯: 陳勇洲
聲明:證券時報力求信息真實、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風(fēng)險自擔(dān)
下載“證券時報”官方APP,或關(guān)注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換