金沙江創(chuàng)投管理合伙人朱嘯虎向人形機(jī)器人“開(kāi)炮”了。
3月28日,他在采訪(fǎng)中稱(chēng),因“商業(yè)化不清晰”,正批量退出對(duì)人形機(jī)器人的投資,引發(fā)行業(yè)震動(dòng)。
對(duì)此,經(jīng)緯創(chuàng)投創(chuàng)始合伙人張穎發(fā)朋友圈調(diào)侃:“朱老板別鬧”,直言朱嘯虎的言論可能影響其未來(lái)在機(jī)器人領(lǐng)域的投資機(jī)會(huì);眾擎機(jī)器人CEO趙同陽(yáng)更尖銳批評(píng)其“用眼前否定未來(lái)”。
趙同陽(yáng)直言:“他(朱嘯虎)是非常成功和精明的商人,但很多創(chuàng)業(yè)者不是?!?/p>
一場(chǎng)投資人與創(chuàng)業(yè)者之間的唇槍舌劍,折射出人形機(jī)器人在資本狂熱、“泡沫疑云”與技術(shù)攻堅(jiān)之間的復(fù)雜處境。
中關(guān)村論壇期間,21世紀(jì)經(jīng)濟(jì)報(bào)道記者見(jiàn)到了銀河通用、星動(dòng)紀(jì)元、穹徹智能、樂(lè)聚機(jī)器人等具身智能公司創(chuàng)始人,也采訪(fǎng)了智源研究院院長(zhǎng)王仲遠(yuǎn),本文將總結(jié)他們對(duì)人形機(jī)器人“泡沫論”、“訓(xùn)練數(shù)據(jù)瓶頸”、“人形必要性”、技術(shù)路線(xiàn)分歧等方面的觀(guān)點(diǎn),拆解人形機(jī)器人爭(zhēng)議大全。
朱嘯虎的退出理由直指商業(yè)化前景不明,“誰(shuí)會(huì)花十幾萬(wàn)買(mǎi)一個(gè)機(jī)器人去干這些活?”但這一觀(guān)點(diǎn)遭到多位從業(yè)者反駁。
經(jīng)緯創(chuàng)投張穎認(rèn)為,機(jī)器人領(lǐng)域“大賽道,百花齊放,過(guò)程中有點(diǎn)泡沫也非常正?!?,并強(qiáng)調(diào)“時(shí)間拉長(zhǎng),人形機(jī)器人賽道一定能出大公司”。
眾擎機(jī)器人趙同陽(yáng)則表示,朱嘯虎更適合“今年投入后年見(jiàn)效的快餐式項(xiàng)目”,而AI和人形機(jī)器人需要長(zhǎng)期投入,“質(zhì)問(wèn)人形機(jī)器人現(xiàn)階段有什么用,就像否定剛出生嬰兒的未來(lái)”。
智源研究院院長(zhǎng)王仲遠(yuǎn)告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,具身智能的訓(xùn)練非常復(fù)雜,需要海量數(shù)據(jù),5年時(shí)間都是樂(lè)觀(guān)的,也許需要10年后才能成熟,不同風(fēng)格的投資機(jī)構(gòu)就會(huì)出現(xiàn)分歧。
“如果是比較看重產(chǎn)業(yè)落地、希望迅速實(shí)現(xiàn)行業(yè)應(yīng)用的機(jī)構(gòu),也許當(dāng)下并不是進(jìn)入具身智能的好時(shí)機(jī)?!蓖踔龠h(yuǎn)表示:“但我們對(duì)于具身智能長(zhǎng)期發(fā)展是非常樂(lè)觀(guān)的,就好像10年前看無(wú)人駕駛技術(shù)是一樣的?!?/p>
樂(lè)聚機(jī)器人冷曉琨從產(chǎn)業(yè)視角補(bǔ)充:“具身智能是硬件與軟件的耦合,硬件從實(shí)驗(yàn)室到產(chǎn)業(yè)化,需要3-5年,軟硬件最終合起來(lái)才能真正迎來(lái)質(zhì)變?!?/p>
數(shù)據(jù)是具身智能發(fā)展的核心難題。銀河通用創(chuàng)始人王鶴指出,當(dāng)前數(shù)據(jù)分為真實(shí)數(shù)據(jù)與仿真合成數(shù)據(jù)兩類(lèi)。真實(shí)數(shù)據(jù)中,互聯(lián)網(wǎng)視頻雖量大但“不足夠”:“看別人游泳無(wú)法學(xué)會(huì)游泳,除非你已具備基本運(yùn)動(dòng)機(jī)能?!?/p>
他主張“用合成數(shù)據(jù)做預(yù)訓(xùn)練,用真機(jī)數(shù)據(jù)完成后訓(xùn)練”,并類(lèi)比自動(dòng)駕駛:“人形機(jī)器人存量達(dá)百萬(wàn)臺(tái)前,合成數(shù)據(jù)是最寶貴資產(chǎn)。”
樂(lè)聚機(jī)器人冷曉琨坦言硬件采集觸覺(jué)等模態(tài)數(shù)據(jù)成本高企,現(xiàn)在采集的數(shù)據(jù)模態(tài)數(shù)量不夠,包括視覺(jué)信息、觸覺(jué)信息等,在模型未完全確定的時(shí)候,投入大量精力采集的數(shù)據(jù)有被推翻的可能性。
穹徹智能盧策吾更強(qiáng)調(diào)實(shí)踐檢驗(yàn):“數(shù)據(jù)價(jià)值如同配方,需在實(shí)踐中動(dòng)態(tài)調(diào)整比例,互聯(lián)網(wǎng)數(shù)據(jù)、仿真數(shù)據(jù)、真機(jī)數(shù)據(jù)各有優(yōu)劣,需互補(bǔ)克服缺點(diǎn)?!?/p>
關(guān)于“人形必要性”的爭(zhēng)論由來(lái)已久。
行業(yè)里有觀(guān)點(diǎn)認(rèn)為,當(dāng)前70%的場(chǎng)景并不需要機(jī)器人具備“人形”,所以“機(jī)器人做成人形”的必要性是否不夠充分。
王仲遠(yuǎn)在一定程度上認(rèn)同這一觀(guān)點(diǎn),他舉例說(shuō)明,行業(yè)內(nèi)也有不少機(jī)器人公司已開(kāi)始迭代輪式構(gòu)型機(jī)器人,以克服雙足機(jī)器人穩(wěn)定性欠佳的問(wèn)題。
“不過(guò),從長(zhǎng)遠(yuǎn)來(lái)看,人形機(jī)器人具有獨(dú)特優(yōu)勢(shì),因其與人的構(gòu)型相似,能更好地適應(yīng)社會(huì)基礎(chǔ)設(shè)施,復(fù)用技能,從互聯(lián)網(wǎng)數(shù)據(jù)中學(xué)習(xí)人類(lèi)技能,推動(dòng)具身智能和具身大腦模型的迭代。”王仲遠(yuǎn)表示。
樂(lè)聚機(jī)器人冷曉琨透露:“我們交付的100臺(tái)人形機(jī)器人已進(jìn)入工廠(chǎng),需先解決拿、放、走等基礎(chǔ)技能泛化,再拓展復(fù)雜場(chǎng)景?!睓C(jī)器人進(jìn)工廠(chǎng)以后,樂(lè)聚給自己定的標(biāo)準(zhǔn)是連續(xù)工作1500個(gè)小時(shí)左右,才能說(shuō)人形機(jī)器人可以實(shí)際用起來(lái)。不過(guò),目前人形機(jī)器人完成的任務(wù)比較簡(jiǎn)單,比如搬箱子等,更多精細(xì)性任務(wù),需要后期更復(fù)雜的訓(xùn)練。
銀河通用王鶴認(rèn)為,輪式機(jī)器人與人形機(jī)器人有不同的適應(yīng)場(chǎng)景?!拜喪綑C(jī)器人成本低、續(xù)航長(zhǎng),貨架場(chǎng)景無(wú)需雙腿,制約因素是智能而非形態(tài)?!彼e例說(shuō)明,但有些復(fù)雜地形,就需要人形機(jī)器人穿越,并且,最終人形機(jī)器人的目標(biāo)是走進(jìn)家庭,不過(guò),距離這個(gè)目標(biāo),還有很長(zhǎng)的一段旅程要走。
穹徹智能盧策吾從工具使用角度力挺靈巧手:“拿錘子、筷子需五指靈活調(diào)整,二指無(wú)法完成復(fù)雜操作?!?/p>
當(dāng)前,隨著具身機(jī)器人任務(wù)種類(lèi)和任務(wù)量不斷增加,如何在跨本體、跨場(chǎng)景以及跨任務(wù)的情況下解決具身機(jī)器人的泛化問(wèn)題,成為具身機(jī)器人和具身智能領(lǐng)域面臨的重大挑戰(zhàn)。
智源研究院王仲遠(yuǎn)分享女兒的學(xué)習(xí)經(jīng)歷,不到兩歲的孩子在春節(jié)期間通過(guò)觀(guān)看大量短視頻,自主學(xué)會(huì)拆糖果、用牙簽穿藍(lán)莓。在不斷嘗試失敗后最終成功。人類(lèi)大腦的這種自主學(xué)習(xí)能力遠(yuǎn)超當(dāng)前具身智能模型??蒲袡C(jī)構(gòu)和模型公司始終要攻克的方向,就在于怎么讓機(jī)器人能夠自主學(xué)習(xí),掌握技能。
銀河通用王鶴認(rèn)同對(duì)人類(lèi)學(xué)習(xí)過(guò)程的觀(guān)察很重要。他指出,人類(lèi)在學(xué)習(xí)過(guò)程中,通過(guò)大模型提供獎(jiǎng)勵(lì)函數(shù)助力強(qiáng)化學(xué)習(xí)。但目前具身智能在這方面仍處于探索階段。
具身機(jī)器人的物理世界智能研發(fā)需遵循特定過(guò)程。首先,沿著能產(chǎn)生生產(chǎn)力價(jià)值的維度探索泛化,如抓取、放置和場(chǎng)景移動(dòng)等基礎(chǔ)技能。通過(guò)合成大數(shù)據(jù)和少量真機(jī)數(shù)據(jù)實(shí)現(xiàn)這些技能的泛化,為人形機(jī)器人創(chuàng)造生產(chǎn)力價(jià)值。隨后,研究機(jī)器人在家庭、工廠(chǎng)等更多場(chǎng)景中跨越技能,最后再探索跨本體。
對(duì)于人形機(jī)器人的爆發(fā)節(jié)點(diǎn),各有闡述。
穹徹智能盧策吾認(rèn)為,具身智能的ChatGPT時(shí)刻不是單一的,而是一批場(chǎng)景,階梯性、漸進(jìn)地實(shí)現(xiàn)?!皟赡暌恢芷冢锪?、食品加工等場(chǎng)景可能會(huì)有第一波變化?!?/p>
星動(dòng)紀(jì)元陳建宇表示,爆發(fā)點(diǎn)要看設(shè)定的標(biāo)準(zhǔn)是什么,如果只是簡(jiǎn)單的推理問(wèn)答,可能就比較早,但如果是復(fù)雜場(chǎng)景的實(shí)際應(yīng)對(duì)與執(zhí)行,這個(gè)標(biāo)準(zhǔn)還是蠻高的?!暗@并不妨礙人形機(jī)器人的持續(xù)應(yīng)用,一些垂類(lèi)場(chǎng)景的規(guī)?;瘧?yīng)用是在持續(xù)推進(jìn)的?!?/p>
銀河通用王鶴預(yù)測(cè),輪式機(jī)器人貨架級(jí)別的智能可能在2025年、2026年迎來(lái)突破,但如果是每個(gè)人都用上人形機(jī)器人,這個(gè)目標(biāo)實(shí)現(xiàn)的周期就會(huì)比較長(zhǎng),尤其未來(lái),人形機(jī)器人走進(jìn)家庭,需要硬件成本與安全性再突破。
智源研究院王仲遠(yuǎn)類(lèi)比深度學(xué)習(xí)發(fā)展史:“從2006年論文到ChatGPT用了16年,具身智能受硬件制約,比較可能的突破時(shí)刻,可能是會(huì)現(xiàn)在受限的場(chǎng)景下具備可用性、一定的智能性以及一定程度的泛化,積累幾年之后,逐步進(jìn)化?!彼赋?,受到大模型快速迭代的正面影響,具身智能的發(fā)展也會(huì)加速。
樂(lè)聚冷曉琨直言:“我覺(jué)得可能不會(huì)是忽然眼前一亮的時(shí)刻,而是整個(gè)社會(huì)面逐漸用起來(lái),隨著產(chǎn)業(yè)化不斷成熟、智能性不斷成熟,慢慢泛化?!彼f(shuō),硬件產(chǎn)業(yè)化沒(méi)有捷徑,五年后回頭看方知滲透,而非某刻突然爆發(fā)。
朱嘯虎的“撤退”,揭開(kāi)了人形機(jī)器人行業(yè)理想與現(xiàn)實(shí)的激烈碰撞。短期內(nèi),商業(yè)化路徑不明、數(shù)據(jù)成本高企、硬件成熟度不足仍是攔路虎;但長(zhǎng)期來(lái)看,多模態(tài)大模型、世界模型與硬件迭代的共振,可能逐步將具身智能推向“數(shù)字-物理”融合的臨界點(diǎn)。
泡沫是技術(shù)爆發(fā)的前奏,耐心者才能等到春天。當(dāng)人形機(jī)器人真正走入家庭時(shí),今天的爭(zhēng)議或許會(huì)成為一段精彩的注腳。