3月12日,北京人形機器人創(chuàng)新中心,即國家地方共建具身智能機器人創(chuàng)新中心(以下簡稱“創(chuàng)新中心”)在北京發(fā)布全球首個“一腦多能”“一腦多機”的通用具身智能平臺“慧思開物”?!盎鬯奸_物”的應(yīng)用是對基于單一場景單一任務(wù)做專項開發(fā)這一傳統(tǒng)機器人應(yīng)用開發(fā)模式的顛覆,同時也填補了具身智能領(lǐng)域在通用軟件系統(tǒng)方面的空白,真正推動智能機器人從單一任務(wù)執(zhí)行向復(fù)雜環(huán)境下的自主決策與執(zhí)行能力躍升。
作為國家級創(chuàng)新平臺,創(chuàng)新中心持續(xù)攻堅具身智能機器人關(guān)鍵共性技術(shù)研發(fā)和生態(tài)建設(shè),并向全行業(yè)開源開放。創(chuàng)新中心總經(jīng)理熊友軍在現(xiàn)場發(fā)言時表示,創(chuàng)新中心的開源計劃自落地以來已取得了豐碩的成果,在本體開源方面,多家合作伙伴們基于“天工”平臺面向應(yīng)用場景進(jìn)行二次開發(fā),大量極具應(yīng)用能力的機器人涌現(xiàn),例如優(yōu)必選的新產(chǎn)品“天工行者”,將基于“天工”平臺重點應(yīng)用至教育領(lǐng)域;在數(shù)據(jù)集開源方面,創(chuàng)新中心發(fā)布的行業(yè)首個標(biāo)準(zhǔn)化通用具身智能數(shù)據(jù)集和Benchmark RoboMIND首批開源數(shù)據(jù)10萬條,近百家企業(yè)、高校和科研機構(gòu)數(shù)千次下載使用;在開源社區(qū)方面,創(chuàng)新中心通過開源協(xié)作模式吸引了超千名開發(fā)者參與數(shù)據(jù)集的數(shù)據(jù)優(yōu)化與模型訓(xùn)練工作,推動技術(shù)成果在GitHub、Hugging Face等平臺形成傳播,以社區(qū)共治機制構(gòu)建起了技術(shù)普惠的全球協(xié)作網(wǎng)絡(luò)。
熊友軍表示,具身智能在“智能化”方面仍處于初級階段,行業(yè)亟需一個具備多本體兼容性、多場景適應(yīng)性和強大泛化能力的通用智能平臺。為了替具身智能產(chǎn)業(yè)補上通用軟件系統(tǒng)這塊重要拼圖,創(chuàng)新中心研發(fā)了全球首個支持多本體多場景應(yīng)用的通用具身智能平臺“慧思開物”,熊友軍同時提到,在“慧思開物”的支持下,優(yōu)必選在全球范圍內(nèi)首次把群腦網(wǎng)絡(luò)(BrainNet)用于人形機器人執(zhí)行整條產(chǎn)線的工業(yè)級任務(wù)。
據(jù)介紹,“慧思開物”能夠?qū)崿F(xiàn)從任務(wù)理解到執(zhí)行的全流程智能化,具備處理多場景復(fù)雜任務(wù)的泛化能力,首次實現(xiàn)了單個軟件系統(tǒng)在機械臂、輪式機器人、人形機器人等多構(gòu)型本體上的兼容,能夠適應(yīng)多樣化的應(yīng)用場景和任務(wù),為具身智能機器人提供強大的感知、決策與執(zhí)行能力。創(chuàng)新中心首席技術(shù)官唐劍表示,“慧思開物”作為機器人中樞神經(jīng)系統(tǒng),集成感知、決策、語言、學(xué)習(xí)及運動控制等高級認(rèn)知功能,通過多專家智能體協(xié)同實現(xiàn)模型能力提升,增強機器人在復(fù)雜任務(wù)中的智能化與執(zhí)行效率,同時通過低代碼方式降低機器人開發(fā)門檻,簡化開發(fā)流程。
據(jù)介紹,“慧思開物”由AI大模型驅(qū)動的任務(wù)規(guī)劃具身“大腦”以及數(shù)據(jù)驅(qū)動的端到端技能執(zhí)行具身“小腦”構(gòu)成,是支持各類機器人與物理世界交互的開放平臺。其中,具身“大腦”具備自然交互、空間感知、意圖理解、分層規(guī)劃和錯誤反思等能力,具身“小腦”分為具身操作和具身運控兩個子平臺:具身操作涵蓋元技能庫、泛化抓取、技能拆解和錯誤處理等功能,而具身運控負(fù)責(zé)實現(xiàn)全身控制、雙臂協(xié)作、穩(wěn)定行走和移動導(dǎo)航等任務(wù)。由具身“大腦”進(jìn)行任務(wù)規(guī)劃,再調(diào)用具身“小腦”技能庫執(zhí)行具體動作,并將執(zhí)行反饋傳遞給具身“大腦”,形成任務(wù)閉環(huán)。
基于高效協(xié)同的具身“大腦”與具身“小腦”架構(gòu),“慧思開物”可以精準(zhǔn)解析自然語言交互指令,通過多模態(tài)信息融合與上下文理解,將復(fù)雜任務(wù)分解為可執(zhí)行的子任務(wù)序列,并在任務(wù)執(zhí)行過程中實時監(jiān)測狀態(tài),通過自適應(yīng)糾錯機制和動態(tài)路徑規(guī)劃,確保任務(wù)的高效推進(jìn)與準(zhǔn)確完成。同時,“慧思開物”內(nèi)置多場景適配引擎,支持從工業(yè)制造到家庭服務(wù)等多種場景,結(jié)合高效的資源調(diào)度與并行計算能力,能夠精準(zhǔn)滿足特定場景下的工作節(jié)拍與精度標(biāo)準(zhǔn),為機器人在復(fù)雜場景的應(yīng)用提供可靠的技術(shù)保障。
發(fā)布會現(xiàn)場,創(chuàng)新中心首席技術(shù)官唐劍演示了“慧思開物”在工業(yè)分揀、積木搭建、桌面清理和物流打包四個場景的真機操作。通過語音交互、APP直連等多種方式,用戶能夠與機器人輕松交互,場景任務(wù)豐富且執(zhí)行精度高,機器人動作絲滑流暢。這是全球首次多場景、多任務(wù)、多構(gòu)型具身智能機器人操作的直播展示,充分體現(xiàn)了“慧思開物”平臺的通用性與智能化水平。
在工業(yè)分揀任務(wù)中,通過“慧思開物”APP直連,UR-5e機械臂能夠精準(zhǔn)解析語音指令,并通過雙臂協(xié)同的方式完成分揀操作,展現(xiàn)了“慧思開物”在人機自然交互協(xié)作與機器人系統(tǒng)高效對接方面的技術(shù)優(yōu)勢。行業(yè)內(nèi)首創(chuàng)的“APP+機器人”模式,將復(fù)雜的技術(shù)能力(如推理、規(guī)劃、技能調(diào)用)封裝為簡單易用的操作流程,顯著降低了用戶使用門檻。同時,平臺支持自定義模型和技能的快速添加,能夠靈活適配不同場景的應(yīng)用需求,為工業(yè)自動化領(lǐng)域提供便捷、高效、智能的解決方案。
隨后,唐劍現(xiàn)場展示了“慧思開物”賦能下的人形機器人積木搭建任務(wù)。積木搭建對人形機器人的空間理解能力和執(zhí)行精度要求極高,“慧思開物”通過充分發(fā)揮大模型思維鏈能力,首次實現(xiàn)了復(fù)雜任務(wù)的智能化拆解與執(zhí)行。工作人員與“天工”閑聊的過程中隨機搭建了一個積木樣例,隨后,“天工”利用視覺大模型(VLM)對樣例進(jìn)行拆解,精確規(guī)劃每一層的搭建順序,準(zhǔn)確拾取相應(yīng)積木,并按次序完成了3層積木的毫米級精準(zhǔn)搭建。這一過程首次實現(xiàn)了基于視覺空間思維鏈的復(fù)雜任務(wù)智能化拆解與執(zhí)行,以及強大的擬人交互能力和執(zhí)行精度,展現(xiàn)了具身智能在教育娛樂、精密制造等領(lǐng)域的應(yīng)用潛力。
在桌面清理場景中,人形機器人“天工”展現(xiàn)了端到端模型賦能下雙臂協(xié)作的高效性與動態(tài)環(huán)境下的自適應(yīng)能力,流暢地整理桌面餐具,將垃圾收進(jìn)錫紙盤并放入垃圾桶。整個過程中,機器人動作絲滑流暢,且在多次任意隨機的人為打斷和移位干擾的情況下,仍能自主糾錯、重新規(guī)劃并完成任務(wù),充分體現(xiàn)了平臺在雙臂協(xié)同控制、動態(tài)運動規(guī)劃以及自適應(yīng)糾錯方面的技術(shù)優(yōu)勢,這也是全球首個經(jīng)受真實場景直播充分驗證展示的,具備高實時性、高泛化性的糾錯適應(yīng)能力的端到端技能學(xué)習(xí)方案。
在物流打包場景,基于“慧思開物”平臺,“天工PRO”首次實現(xiàn)了全尺寸人形機器人物流打包全流程的自主作業(yè)。通過上半身29個自由度的精密配合,“天工PRO”使用左右手分別拿起物品和掃碼槍,通過頭部相機確認(rèn)物品條形碼位置,雙手協(xié)同完成掃碼、裝箱、封箱及粘貼快遞標(biāo)簽等一系列操作。“慧思開物”將任務(wù)拆解為拿、擰、挑等多項元技能,僅需少量數(shù)據(jù)即可高效訓(xùn)練并成功執(zhí)行,顯著提升了數(shù)據(jù)利用效率,并能在復(fù)雜場景的長程任務(wù)執(zhí)行中實現(xiàn)子任務(wù)間的平滑過渡。該場景不僅展現(xiàn)了機器人對復(fù)雜任務(wù)的理解與執(zhí)行能力,還凸顯了靈巧手在工具使用與精細(xì)操作中的優(yōu)勢,展現(xiàn)了對真實物流打包場景中從物品處理到包裝封箱的全流程自動化應(yīng)用需求的充分支持。
除了具身“大腦”和具身操作能力,基于“慧思開物”,“天工”機器人的具身運控能力也在持續(xù)升級。發(fā)布會現(xiàn)場,搭載“慧思開物”的“天工”機器人通過多模態(tài)傳感器融合技術(shù)精準(zhǔn)感知環(huán)境,結(jié)合高效的路徑規(guī)劃與步態(tài)生成算法,穩(wěn)健地走上舞臺,并與唐劍進(jìn)行了多輪流暢對話,進(jìn)一步凸顯了“慧思開物”平臺在感知、決策與執(zhí)行一體化方面的技術(shù)優(yōu)勢。
強大的感知、決策與執(zhí)行能力離不開高質(zhì)量具身智能數(shù)據(jù)的支撐,“慧思開物”依托創(chuàng)新中心構(gòu)建的具身智能數(shù)據(jù)全鏈路解決方案,以及行業(yè)首個標(biāo)準(zhǔn)化通用具身智能數(shù)據(jù)集和Benchmark RoboMIND,實現(xiàn)了對多模態(tài)數(shù)據(jù)的高效利用與精準(zhǔn)學(xué)習(xí)。RoboMIND覆蓋工業(yè)、家庭、辦公等多場景任務(wù),具備高度的通用性和可擴展性,作為業(yè)內(nèi)首個經(jīng)由多類視覺語言動作(VLA)及端到端模型充分驗證的跨本體標(biāo)準(zhǔn)化大規(guī)模數(shù)據(jù)集,為“慧思開物”提供了從任務(wù)理解到執(zhí)行的全流程數(shù)據(jù)支持。未來,隨著數(shù)據(jù)生態(tài)的持續(xù)完善,“慧思開物”將進(jìn)一步突破技術(shù)邊界,推動具身智能技術(shù)在更多高難度場景中的規(guī)模化落地與應(yīng)用。
“慧思開物”平臺的技術(shù)突破與多場景應(yīng)用能力也為生態(tài)合作與產(chǎn)業(yè)賦能奠定了堅實基礎(chǔ)。優(yōu)必選研究院大模型負(fù)責(zé)人石海林表示,在“慧思開物”的支持下,優(yōu)必選在全球范圍內(nèi)首次把群腦網(wǎng)絡(luò)(BrainNet)用于人形機器人執(zhí)行整條產(chǎn)線的工業(yè)級任務(wù)。優(yōu)必選最新發(fā)布的天工行者也是基于天工通用人形機器人母平臺,針對科研教育場景開發(fā)的人形機器人平臺。此外,中興通訊產(chǎn)業(yè)數(shù)字化方案規(guī)劃總工孟曉斌分享了與創(chuàng)新中心在自動化生產(chǎn)領(lǐng)域的規(guī)劃,展示了“慧思開物”在智能制造中的應(yīng)用潛力;配天機器人首席技術(shù)官郭濤分享了“慧思開物”平臺在特種作業(yè)場景中的實踐,凸顯了其在復(fù)雜環(huán)境下的任務(wù)執(zhí)行能力。面向教育科研、物流搬運、工業(yè)制造、特種作業(yè)、商業(yè)服務(wù)、健康養(yǎng)老等多樣化場景,“慧思開物”平臺提供了具身大小腦綜合解決方案,展現(xiàn)了其廣泛的應(yīng)用前景與戰(zhàn)略價值。
作為具身智能行業(yè)資源組織者,創(chuàng)新中心將繼續(xù)深化具身智能技術(shù)的研發(fā)與應(yīng)用,推動“慧思開物”平臺在全球范圍內(nèi)的廣泛應(yīng)用,助力智能機器人產(chǎn)業(yè)的快速發(fā)展,為全球智能化升級提供持續(xù)的核心驅(qū)動力。同時,創(chuàng)新中心也將攜手產(chǎn)學(xué)研用各方合作伙伴,構(gòu)建開放協(xié)同的產(chǎn)業(yè)生態(tài),加速具身智能技術(shù)的規(guī)?;瘧?yīng)用與產(chǎn)業(yè)化進(jìn)程,為全球智能化升級提供核心驅(qū)動力,助力人類社會邁向智能化新時代。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2024 中國高新網(wǎng)chinahightech.comAll Rights Reserved.京ICP備14033264號-5
電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證060344號主辦單位:《中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報》社有限責(zé)任公司