原標(biāo)題:南京聚力打造“機(jī)器人之城”,記者一線探訪本土相關(guān)企業(yè)
人形機(jī)器人的“遠(yuǎn)”和“近”
8月中旬,全球首個為人形機(jī)器人組織的綜合性競技賽事——2025世界人形機(jī)器人運(yùn)動會在北京舉行。2天比賽里,各類消息頻頻霸占熱搜榜,給已在風(fēng)口飛舞的人形機(jī)器人產(chǎn)業(yè)再添一把火。
100米冠軍成績21.50秒、400米冠軍成績1分28.03秒、跳高冠軍成績95.641厘米……雖然在田徑場上,這些人形機(jī)器人的成績與人類冠軍們還有很大差距,但一個個機(jī)器人已經(jīng)真真切切地走上賽場、走近觀眾身邊,他們能跑能跳,踢得了足球,賽得了體操。比起春晚上只能轉(zhuǎn)轉(zhuǎn)手絹,僅僅半年多時間,人形機(jī)器人行業(yè)又取得了肉眼可見的進(jìn)步。
人形機(jī)器人是不是已經(jīng)離我們的日常生活很近了?目前人形機(jī)器人的性能到底如何、能應(yīng)用在哪些場景,離走進(jìn)千家萬戶,真正“活出個人樣”,還有多遠(yuǎn)?南京正聚力打造“機(jī)器人之城”,近日,記者走訪了本土多家人形機(jī)器人企業(yè),試圖尋找這些問題的答案。
人形和具身——
“為什么一定要是人形?”
今年3月的全國兩會上,政府工作報告中首次提到了“具身智能”“智能機(jī)器人”的概念,明確提出要大力發(fā)展相關(guān)產(chǎn)業(yè)。曾經(jīng)有些科幻的機(jī)器人一下子成為了可感可及的、國家要大力發(fā)展的產(chǎn)業(yè)。會后,關(guān)于機(jī)器人產(chǎn)業(yè)的各類消息迅速占據(jù)大眾視野。紛繁復(fù)雜的信息中充斥著大量新詞匯、新概念,其中就有“具身機(jī)器人”。很多報道中都是直接援引政府工作報告中的詞匯。那“具身機(jī)器人”和“人形機(jī)器人”有什么區(qū)別?
“簡單點(diǎn)理解,‘人形機(jī)器人’是‘具身機(jī)器人’的一種,也是最復(fù)雜的一種。甚至可以說,‘人形機(jī)器人’是‘具身機(jī)器人’的最高形態(tài)?!睎|南大學(xué)首席教授、機(jī)器人傳感與控制技術(shù)研究所所長宋愛國說,具身機(jī)器人的概念更加寬泛,像機(jī)械臂、機(jī)器狗(四足機(jī)器人)乃至掃地機(jī)器人,都可以認(rèn)為屬于具身機(jī)器人的范疇,而人形機(jī)器人則“物如其名”,必須是類似人類形態(tài)的機(jī)器人。
“外形做成人類形態(tài)很容易,但要同時具備實(shí)用性功能,難度就陡然提升了許多?!彼螑蹏e例說,現(xiàn)在一些人形機(jī)器人產(chǎn)品的雙手手指是不能動的或只能簡單揮動,復(fù)雜一些的可以進(jìn)行一些物品的抓取、擰螺絲等,“跟我們真人的手部功能還差得比較遠(yuǎn)。更不用說觸覺了,這正是我們團(tuán)隊攻關(guān)的領(lǐng)域之一。人形機(jī)器人每向真實(shí)人類靠近一點(diǎn),都需要大量的研發(fā)積累?!?/p>
既然技術(shù)難度極大,為什么一定要費(fèi)力把機(jī)器人做成人類形態(tài)呢?
“因?yàn)槲覀兩畹倪@個現(xiàn)實(shí)世界,都是圍繞人類設(shè)計的?!避浲▌恿瘓F(tuán)副總裁兼創(chuàng)新與技術(shù)研究院執(zhí)行院長雒冬梅說,生活中絕大多數(shù)場景都是圍繞人搭建的,機(jī)器人做成人形就可以具備最廣泛的適用場景、最廣大的市場空間。宋愛國也認(rèn)為,將來成熟的人形機(jī)器人一定會走進(jìn)大眾的日常生活,面對各類生活場景,只有人形才是最普適的選擇。
面對這個問題,幾乎每個采訪對象都提到了適用性,還有一些業(yè)內(nèi)人員提到了“人形”的另外一個優(yōu)勢——親近性。華夏機(jī)器人(南京)有限公司銷售總監(jiān)周攀說,“試想一個場景,將來人形機(jī)器人會走進(jìn)千家萬戶,你希望這位‘家庭成員’是一副冷冰冰的金屬框架還是一個外形非常接近真人的機(jī)器人?”
大腦和小腦——
“不僅看著像人,運(yùn)作機(jī)理也像人”
“從容”地獨(dú)自邁步走上舞臺,向觀眾揮手致意,隨后轉(zhuǎn)身指向大屏幕播放“自己的宣傳片”……6月在南京舉行的2025智能機(jī)器人發(fā)展大會上,南京埃斯頓酷卓科技有限公司的第二代人形機(jī)器人Codroid 02自己上臺向全球發(fā)布了自己——身高170cm、體重70kg,單臂能負(fù)載5公斤,全身自由度達(dá)31個。
“發(fā)布會上看似簡單的幾個動作,其實(shí)充分展現(xiàn)了Codroid 02出色的能力。”南京埃斯頓酷卓科技有限公司首席技術(shù)官臧家煒介紹,讓機(jī)器人以雙足的方式用人類這樣的自然步態(tài)行走、跑跳,需要具備很精細(xì)的感知能力、運(yùn)動控制能力,“人形機(jī)器人不僅看著像人,運(yùn)作機(jī)理也像人??刂扑麄兊暮诵目梢灶惐葹榇竽X和小腦,大腦負(fù)責(zé)認(rèn)知決策,實(shí)現(xiàn)環(huán)境感知、任務(wù)規(guī)劃、自然語言交互等,小腦則專注運(yùn)動控制,處理關(guān)節(jié)協(xié)調(diào)、力控反饋等精細(xì)操作?!?/p>
談及人形機(jī)器人的運(yùn)作機(jī)制,南京理工大學(xué)機(jī)械工程學(xué)院教授王禹林也提到了“大腦”“小腦”的概念?!叭诵螜C(jī)器人從外形到內(nèi)在,都是在模仿人類?!彼e例說,“比如倒水這個簡單的動作,就需要機(jī)器人的‘大小腦’通力配合。首先理解倒水這個指令,通過眼睛,也就是攝像頭采集圖像,識別出水壺、水杯的位置,然后規(guī)劃出要先走到水壺和水杯旁、拿起水壺,把里面的水倒進(jìn)水杯,這些都是‘大腦’的活。通過電機(jī)驅(qū)動全身各處關(guān)節(jié)動起來,尤其是手部的精細(xì)操作,比如用多大力度把水壺拿起來、怎么對準(zhǔn)水杯,這些就是‘小腦’的活了。”
人形機(jī)器人的“大腦”和“小腦”,其實(shí)就是該領(lǐng)域目前很主流的一個研發(fā)方向——VLA模型,即Vision(視覺)—Language(語言)—Action(動作)。通過VLA模型可以借助基礎(chǔ)大模型的通用能力與大規(guī)模學(xué)習(xí)范式,處理通用的視覺與語言信息并生成實(shí)時動作,由此讓人形機(jī)器人實(shí)現(xiàn)各項功能。
“VLA模型的訓(xùn)練和基礎(chǔ)大模型一樣,也需要‘投喂’大量數(shù)據(jù),而這些數(shù)據(jù)目前相對來說非常匱乏,這也是我們當(dāng)下面臨的主要瓶頸之一。”臧家煒說,對于通用大模型來說,互聯(lián)網(wǎng)上就有海量數(shù)據(jù)可供訓(xùn)練,但人形機(jī)器人研發(fā)領(lǐng)域,目前還缺乏一個類似互聯(lián)網(wǎng)的公共基礎(chǔ)設(shè)施,以及在此基礎(chǔ)設(shè)施上所沉淀下來的海量多模態(tài)數(shù)據(jù)集。VLA模型的訓(xùn)練數(shù)據(jù)最好是要通過人形機(jī)器人在實(shí)際環(huán)境中收集,這就需要大量時間去積累。
正是同樣看到了數(shù)據(jù)匱乏這一行業(yè)痛點(diǎn),華夏機(jī)器人(南京)有限公司發(fā)起建設(shè)了具身智能機(jī)器人應(yīng)用中心。記者在現(xiàn)場看到,中心模擬了日常家庭、公司辦公室、工廠倉庫等多個實(shí)體化場景,還設(shè)置了砂石、塑膠、坡道等各種路面環(huán)境,可以讓人形機(jī)器人產(chǎn)品在各種真實(shí)環(huán)境里進(jìn)行試驗(yàn)?!爸行募婢邤?shù)據(jù)采集和場景驗(yàn)證兩大功能,并向行業(yè)開放?!敝芘收f,歡迎其他公司的產(chǎn)品到中心進(jìn)行測試、驗(yàn)證,未來中心計劃建立一個開放共享的數(shù)據(jù)平臺,助力推動整個人形機(jī)器人產(chǎn)業(yè)的發(fā)展。
盆景和風(fēng)景——
“一個產(chǎn)品,必須真正有用”
雖然人形機(jī)器人在公眾眼中是一個嶄新的領(lǐng)域,整個產(chǎn)業(yè)也剛剛熱鬧起來,但相關(guān)企業(yè)包括整機(jī)公司已如雨后春筍般涌現(xiàn)。企查查數(shù)據(jù)顯示,截至8月,國內(nèi)人形機(jī)器人整機(jī)平臺超過160家,占據(jù)全球50%以上;核心零部件供應(yīng)鏈企業(yè)更是超過600家。不僅數(shù)量多,實(shí)力也很雄厚,超過一半的人形機(jī)器人整機(jī)公司注冊資本在千萬元級別以上,其中5000萬元以上的占比近三成。
在資本推動下,我國人形機(jī)器人行業(yè)正呈現(xiàn)百花齊放的局面。根據(jù)摩根士丹利最新發(fā)布的報告,過去5年,中國共有5880項人形機(jī)器人專利,遠(yuǎn)超美國的1483項、日本的1195項以及全球知識產(chǎn)權(quán)組織的1123項。
整個產(chǎn)業(yè)起步初期就迅速面對激烈的競爭格局,這樣的背景下,選準(zhǔn)賽道變得至關(guān)重要。
“一個產(chǎn)品,必須真正有用?!蹦暇┨靹?chuàng)機(jī)器人公司董事長助理劉旦復(fù)說,人形機(jī)器人產(chǎn)品不能奢望一步到位、貪大求全,而要在現(xiàn)有技術(shù)水平的前提下,盡快形成產(chǎn)品力、走向市場,這樣一方面可以讓企業(yè)發(fā)展進(jìn)入良性循環(huán),另一方面也可以讓產(chǎn)品在更廣泛的現(xiàn)實(shí)場景里迭代升級,而不僅僅是在實(shí)驗(yàn)室里閉門造車。
天創(chuàng)機(jī)器人的選擇是瞄準(zhǔn)特種行業(yè)、特種場景。1月,他們發(fā)布了全球首款獲得防爆合格證IIC T6的人形機(jī)器人“天魁一號”,填補(bǔ)了人形機(jī)器人在工業(yè)復(fù)雜場景的應(yīng)用空白。“天魁一號”是人形機(jī)器人中的“大個子”和“大力士”,身高220cm,單臂負(fù)重達(dá)25kg,全身擁有30個自由度。不僅如此,“天魁一號”核心優(yōu)勢在于其運(yùn)動結(jié)構(gòu)、電源系統(tǒng)及電氣線路經(jīng)過特殊改造,可在氫氣、甲烷等爆炸性環(huán)境中作業(yè)。“這樣的特性,讓‘天魁一號’一亮相就備受關(guān)注,有很多單位主動找我們溝通?!眲⒌?fù)說,這些復(fù)雜的特種場景下,防爆機(jī)器人可以有效提供無人化解決方案,提高運(yùn)維作業(yè)效率,同時減少人員傷亡事故。
埃斯頓酷卓則把目光繼續(xù)聚焦在工業(yè)領(lǐng)域。統(tǒng)計顯示,南京埃斯頓自動化股份有限公司連續(xù)兩個季度領(lǐng)跑中國工業(yè)機(jī)器人市場,2025年上半年市場份額達(dá)10.5%?!鞍K诡D在工業(yè)機(jī)器人領(lǐng)域的優(yōu)勢也給了我們成長的底氣。”臧家煒說,他們將不斷提升人形機(jī)器人Codroid的手腳眼腦感控協(xié)同能力,并聚焦具體的工業(yè)制造場景進(jìn)行方案驗(yàn)證,從巡檢、搬運(yùn)這些簡單的功能,逐步升級到裝配、檢查等精細(xì)操作,最終可以根據(jù)具體的生產(chǎn)需要整建制地替換工廠現(xiàn)有生產(chǎn)線。不同于機(jī)械臂所能實(shí)現(xiàn)的操作比較單一,人形機(jī)器人的泛化能力強(qiáng)得多,“現(xiàn)在生產(chǎn)線工藝升級或者流程改造可能就要更換機(jī)械臂,而以后只需跟Codroid‘說一聲’就行?!?/p>
華夏機(jī)器人選擇的賽道,從他們的企業(yè)slogan里就能看出端倪——“有溫度的人形機(jī)器人”。在華夏的展廳,記者看到人形機(jī)器人“夏瀾”有著跟真人近乎一樣的面龐。“我們應(yīng)該算是國內(nèi)最早做出有仿真人臉的人形機(jī)器人的企業(yè)?!敝芘收f,“夏瀾”僅頭部就有30個電機(jī),可以做出各種栩栩如生的表情。公司還有自研的情感大模型,讓“夏瀾”可以理解人類語言所傳達(dá)的情緒、情感。這樣的特點(diǎn),讓華夏的人形機(jī)器人產(chǎn)品在與人交流過程中有更強(qiáng)的親近感。目前公司產(chǎn)品已應(yīng)用在景區(qū)引導(dǎo)、銀行大堂等現(xiàn)實(shí)場景中?!爸荒茉趯?shí)驗(yàn)室里的人形機(jī)器人是‘盆景’,更多是觀賞價值,只有更多產(chǎn)品真正應(yīng)用到現(xiàn)實(shí)生活中去,才能形成人形機(jī)器人產(chǎn)業(yè)的靚麗風(fēng)景?!?/p>
腳下和遠(yuǎn)方——
“人形機(jī)器人發(fā)展很難有‘ChatGPT時刻’”
人形機(jī)器人企業(yè)目前都在各自錨定的領(lǐng)域里埋頭深耕,不過他們也都表示,細(xì)分領(lǐng)域是受限于目前的技術(shù)水平,最終目標(biāo)肯定還是要朝著全能的通用型人形機(jī)器人發(fā)展。
在ChatGPT橫空出世前,公眾也沒想到人機(jī)交互可以一瞬間提升到這樣的水平,人工智能似乎一夜之間完成了“飛升”。那人形機(jī)器人產(chǎn)業(yè)的發(fā)展,會不會也在將來某一天迎來自己的“ChatGPT時刻”——人形機(jī)器人各項能力迅速大幅接近甚至超過人類?
“我覺得很難?!彼螑蹏幕卮鹬苯亓水?dāng),原因還是訓(xùn)練數(shù)據(jù)的匱乏,“巧婦難為無米之炊,人形機(jī)器人的進(jìn)步,需要腳踏實(shí)地一點(diǎn)一點(diǎn)積累。”
關(guān)于人形機(jī)器人的產(chǎn)業(yè)迭代之路,劉旦復(fù)有著清晰的思考,他認(rèn)為比較現(xiàn)實(shí)的路徑是先從環(huán)境相對單一、工作內(nèi)容相對簡單的特種場景開始,如一些危險場景下的巡檢、維修等,目前的人形機(jī)器人已經(jīng)可以勝任。然后,隨著人形機(jī)器人各方面能力的提升,可以逐步進(jìn)入工廠、走上生產(chǎn)線,從事裝配、質(zhì)檢等一些更復(fù)雜但模式相對固定的操作。在這一階段,伴隨著在工業(yè)領(lǐng)域的大規(guī)模應(yīng)用,數(shù)據(jù)收集量和產(chǎn)業(yè)升級速度也將指數(shù)級提升。最后,在人形機(jī)器人能完成更多更復(fù)雜任務(wù)時,才會真正進(jìn)入民用領(lǐng)域,走進(jìn)千家萬戶,“到了那個階段,機(jī)器人的數(shù)量和數(shù)據(jù)收集量又會再次爆發(fā)性增長,真正的通用型人形機(jī)器人也許就不遠(yuǎn)了?!?/p>
宋愛國很認(rèn)同這一產(chǎn)業(yè)發(fā)展的路線圖,他還提到一個可以加速產(chǎn)業(yè)演進(jìn)的思路——遙操作。“目前隨著硬件技術(shù)的突破,人形機(jī)器人的手部自由度有了很大提升,人工遠(yuǎn)程遙控操作,正好可以發(fā)揮這一硬件優(yōu)勢?!彼螑蹏f,遙操作可以讓人形機(jī)器人的能力快速提升,使其可以應(yīng)用到更多場景,更重要的是操作過程也是數(shù)據(jù)積累的過程,可以幫助在更多場景、更大范圍內(nèi)收集數(shù)據(jù),助推人形機(jī)器人的研發(fā)、訓(xùn)練。
“數(shù)據(jù)是很重要的一環(huán),人形機(jī)器人的訓(xùn)練就是得一步一腳印,沒有捷徑可走?!闭勂鹫麄€行業(yè)的未來,臧家煒也坦言“急不得”。
瞄準(zhǔn)打造“機(jī)器人之城”的目標(biāo),南京已出臺《南京市促進(jìn)機(jī)器人產(chǎn)業(yè)高質(zhì)量發(fā)展行動計劃(2024—2026年)》,聚力打造“1+N+1”整機(jī)體系。最后一個“1”正代表著前瞻布局人形機(jī)器人產(chǎn)業(yè)?!缎袆佑媱潯分忻鞔_提出“開展人形機(jī)器人試點(diǎn)應(yīng)用”,而三類應(yīng)用領(lǐng)域正是特種作業(yè)、工業(yè)制造、服務(wù)消費(fèi),契合了從業(yè)者們關(guān)于產(chǎn)業(yè)發(fā)展的路徑設(shè)想。
如今,人形機(jī)器人離我們很近,近到已經(jīng)就在身邊;人形機(jī)器人又離我們很遠(yuǎn),遠(yuǎn)在離真正走進(jìn)千家萬戶還有不小距離。不過,無論從業(yè)者還是業(yè)內(nèi)專家大咖,大家堅信只要走好腳下每一步,慢慢積累,“通用型人形機(jī)器人”這一遠(yuǎn)方終將抵達(dá)。
路雖遠(yuǎn),行則將至;事雖難,做則可成。