四川省人形機器人訓練場B場近日投用,記者探訪機器人“學校”都教些啥——
具身智能機器人何以成“人”?
訂閱已訂閱已收藏
收藏
5月21日,機器人正在四川省人形機器人訓練場訓練。
問題
●具身智能機器人怎麼“上課”?最終何以成“人”?
回答
●訓練師是機器人的啟蒙老師,他們需“手把手”引導機器人學習,直到把它們訓練成掌握多種技能的工作伙伴
●每個訓練師對同一任務進行一段時間訓練后,就會和其他訓練師進行輪換。如果一直讓一個人訓練,當機器人遇到突發情況時就難以靈活應變
●高質量動作數據“教材”的出現,讓機器人的學習能力更強。“以前機器人學一個新動作可能需要幾天,現在也許隻需要一兩個小時”
●除了用機器人採集數據來編寫“教材”,訓練場也在構建多元化數據體系,同時探索世界模型、機器人自主學習等先進訓練范式,提高整體數據規模與訓練效率
目的
●訓練的核心不是提升機器人做事的技能,而是產生數據,然后用這些數據去訓練模型,提升機器人的適應能力
●聚焦智慧健康、工業巡檢等垂直場景,推動人形機器人技術成果在真實環境中快速驗証與示范應用
在裝滿零食、飲料瓶的貨架旁,一台人形機器人在練習貨物抓取。一旁的機器人訓練師及時記錄下機器人的每一次抓取,並不時調整其動作幅度……這一幕發生在近日投用的四川省人形機器人訓練場B場。四川省人形機器人訓練場由天府絳溪實驗室牽頭建設,採用“本部—展示—外場”布局。其中,“本部”聚焦具身智能機器人核心研發和訓練,“外場”則構建機器人室外驗証場,訓練場B場是場景展示與示范平台,聚焦智慧健康、工業巡檢等垂直場景,推動人形機器人技術成果在真實環境中快速驗証與示范應用。近日,記者走進這座佔地面積超1000平方米的訓練場,看機器人是如何“上課”的。
“手把手”教學 每個動作每天重復數百次
“機器人就像一個小孩子,隻有不斷配合動作示范、糾錯和強化,才能讓它學得更快、更穩”
訓練場有高度復刻的超市、管廊、復雜地形等仿真場景。每個細分場景中,都有一台或幾台機器人,以及它們的專屬訓練師。
訓練師張明每天的工作是根據不同任務需求,引導機器人進行重復抓取、交互等動作。在整個訓練場,像張明這樣的訓練師還有20余個。
訓練師是機器人的啟蒙老師,他們需“手把手”引導機器人學習,直到把它們訓練成掌握多種技能的工作伙伴。張明以抓取貨物為例,整個任務會被拆解為識別、抓取、擺放等動作,需要訓練師操控手柄控制機器人移動、俯仰、彎折手臂,每個動作每天需訓練數百次。“動作既要准確,還要盡量自然、接近人類習慣。”
為避免機器人隻學到某一個人的操作習慣,每個訓練師對同一任務進行一段時間訓練后,就會和其他訓練師進行輪換。“以抓取貨物來說,有人喜歡橫著抓,有人喜歡豎著抓,大家習慣都不相同。”張明說,如果一直讓一個人訓練,當機器人遇到突發情況時就難以靈活應變。
“機器人就像一個小孩子,隻有不斷配合動作示范、糾錯和強化,才能讓它學得更快、更穩。”訓練場共建方代表四川具身人形機器人科技有限公司CEO、天府絳溪實驗室交互人形機器人前沿研究中心副主任馮振宇說,訓練的核心不是提升機器人做事的技能,而是產生數據,然后用這些數據去訓練模型,提升機器人的適應能力。
用數據編寫“教材” 讓機器人的學習能力更強
“當‘智能涌現’越來越頻繁,機器人的智慧化程度也會越來越高”
“一個三歲小孩,隻需要坐過幾個凳子,就知道凳子是可以用來坐的。”四川具身人形機器人科技有限公司算法工程師曾易介紹,這是因為人具備通過直接經驗快速建立功能關聯的能力。
這項能力,也在機器人身上顯現。記者在現場擺放幾個不在訓練計劃中的飲料瓶,當訓練師發出抓取指令后,機器人不僅能順利抓取,還能穩穩放在固定位置。
“這是因為‘教材’已經教會了它。”曾易所說的“教材”,是指高質量動作數據。他打了一個比方,平時訓練機器人從貨架上抓取蘋果、梨子等水果,這些數據賦予到一個新的機器人上,它依然會抓取蘋果、梨子等水果,但當貨架上突然多了一個桃子,它之前並沒有訓練過,但“教材”提示說桃子也是水果,它就會自我判斷,重復抓取這個動作,這就是“智能涌現”。“當‘智能涌現’越來越頻繁,機器人的智慧化程度也會越來越高。”
“教材”的出現,讓機器人的學習能力更強。“以前機器人學一個新動作可能需要幾天,現在也許隻需要一兩個小時。”曾易說,這並不是因為它突然變“聰明”了,而是在“教材”中已經進行了“預學習”,這樣到真實場景,僅需要微調就能學會。
除了用機器人採集數據來編寫“教材”,訓練場也在構建多元化數據體系,包括高保真合成數據、人類視頻數據、無本體訓練數據等。同時,探索世界模型、機器人自主學習等先進訓練范式,提高整體數據規模與訓練效率。“真實數據和合成數據‘虛實結合’的方式,能夠實現模型訓練效率和泛化能力的平衡。”馮振宇說。
從“課內”到“課外” “學區地圖”正在四川形成
“訓練場可以為機器人企業提供測試與優化,採集高質量數據,訓練出更智能、更可靠的模型”
訓練場B場已投用,幾十公裡外的訓練場“本部”建設也在提速。放眼全省,隨著位於綿陽的四川省具身智能機器人訓練場、自貢的四川人形機器人多模態數據採集測試中心、宜賓的西南具身智能訓練中心等陸續鋪開,一張機器人“學區地圖”正在四川形成。
除了搭建“課堂”,四川也將機器人的學習拓展到“課外”,一些機器人產品紛紛走進工廠、養老院、超市等真實空間採集數據。比如,去年7月,人形機器人在富臨精工股份有限公司“直播打工”﹔更早之前,“四川造”養老機器人“小麗”走進成都養老社區,正式“上崗”……
“學區”的價值,遠不止於訓練機器人,更在於構建一個產業整體發展的開放生態。四川省人形機器人訓練場B場所在地——“諸葛空間”人工智能產業生態示范區,匯聚四川具身科技、越凡創新等機器人企業。“訓練場可以為機器人企業提供測試與優化,採集高質量數據,訓練出更智能、更可靠的模型。”該園區相關負責人說。
□四川日報全媒體記者 高杲/文 郝飛/圖
分享讓更多人看到
- 評論
- 關注
































第一時間為您推送權威資訊
報道全球 傳播中國
關注人民網,傳播正能量