近期,科技界迎來了一項革命性的突破,星動紀元公司正式推出了其端到端原生機器人大模型ERA-42,這款被命名為“紀元原生機器人大模型”的創(chuàng)新成果,象征著對宇宙奧秘無盡探索的精神,同時展示了與自研五指靈巧手星動XHAND1協(xié)同作業(yè)的卓越能力。ERA-42已成功掌握了超過100種復(fù)雜精細的操作技能,且仍在不斷擴展其技能庫,如使用工具擰緊螺釘、精準敲擊釘子、扶正水杯并倒水等。
依托ERA-42的強大能力,星動XHAND1能夠靈活應(yīng)對多種新任務(wù),實現(xiàn)了五指靈巧手如人手般的多樣工具操作能力。這一成就標志著業(yè)界首次通過單一具身大模型,完成了上百種復(fù)雜精細的操作任務(wù),凸顯了ERA-42在通用性和靈巧操作方面的行業(yè)領(lǐng)先地位。無需任何預(yù)編程,僅憑其出色的泛化和自適應(yīng)能力,ERA-42能在極短時間內(nèi),通過少量數(shù)據(jù)收集學會新技能。
星動XHAND1與ERA-42的結(jié)合,展現(xiàn)了超過100種精細化、智能化的五指靈巧手操作任務(wù),標志著具身大模型通用靈巧操作新時代的到來。ERA-42不僅是全球首個真正的五指靈巧手具身大模型,更是開啟了具身智能體通用靈巧操作的大門。
要實現(xiàn)真正的具身大模型,需滿足三大核心要素:統(tǒng)一的模型泛化能力、端到端的處理流程以及規(guī)?;陌l(fā)展?jié)摿ΑJ紫?,通過構(gòu)建融合視覺、語言、觸覺和身體姿態(tài)等多模態(tài)信息的統(tǒng)一原生模型,實現(xiàn)對不同任務(wù)和環(huán)境的廣泛適應(yīng)性。其次,從接收全模態(tài)數(shù)據(jù)到生成最終輸出,通過一個簡潔的神經(jīng)網(wǎng)絡(luò)鏈路完成,無需人為干預(yù),顯著提升具身智能體的靈活性和開發(fā)效率。最后,真正的端到端算法允許模型通過持續(xù)的數(shù)據(jù)積累實現(xiàn)自我完善,數(shù)據(jù)量增長的同時,性能提升,并在未知任務(wù)中展現(xiàn)卓越的自適應(yīng)和泛化能力。
星動紀元ERA-42作為國內(nèi)首個真正意義上的端到端原生機器人大模型,其性能與世界領(lǐng)先水平比肩。早期,星動紀元與Physical Intelligence(PI)幾乎同時采用端到端算法提升原生機器人大模型性能,PI推出的π0模型通過結(jié)合大規(guī)模視覺-語言預(yù)訓練與機器人操作數(shù)據(jù)集,實現(xiàn)了機器人在人類環(huán)境中自主執(zhí)行多種復(fù)雜任務(wù)的能力,這是具身大模型領(lǐng)域的重要里程碑。星動紀元的研究成果與PI不謀而合,其論文HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers在CoRL2024上發(fā)表。
星動紀元隨后探索了另一條訓練道路,采用大規(guī)模視頻數(shù)據(jù)學習策略,涵蓋無標注視頻、各類形態(tài)機器人數(shù)據(jù)、人類活動數(shù)據(jù)及遙操作數(shù)據(jù)等。不同于直接模仿視頻中的行為,星動紀元學習行動產(chǎn)生的結(jié)果,降低了數(shù)據(jù)收集成本,解決了數(shù)據(jù)消耗巨大的行業(yè)難題。星動紀元將世界模型融入原生機器人大模型中,使模型不僅具備行動能力,還具備了對物理世界的理解能力,能夠預(yù)測未來行動軌跡,并迅速響應(yīng)外部干擾,在任務(wù)執(zhí)行過程中持續(xù)自適應(yīng)優(yōu)化行為,提升執(zhí)行任務(wù)的高效性和準確性。
相比傳統(tǒng)的夾爪,星動XHAND1基于ERA-42的能力,能夠完成更多樣化、更復(fù)雜、更精細的操作任務(wù)。五指靈巧手像人手一樣使用多種工具,實現(xiàn)了更高的通用性和靈巧性。同時,ERA-42具備對物理世界的理解和未來預(yù)測的能力,顯著提升了泛化能力和任務(wù)成功率。通過大規(guī)模視頻數(shù)據(jù)的預(yù)訓練,ERA-42在短時間內(nèi)通過少量數(shù)據(jù)就能學會新的操作任務(wù),展現(xiàn)出強大的泛化和自適應(yīng)能力。融合世界模型后,ERA-42在單任務(wù)和長序列任務(wù)上都展現(xiàn)出了業(yè)內(nèi)領(lǐng)先的抗干擾能力。
研究結(jié)果顯示,隨著模型規(guī)模的擴大,任務(wù)成功率明顯提升,初步體現(xiàn)了與大語言模型訓練中類似的“Scaling效應(yīng)”。這一發(fā)現(xiàn)進一步證明了模型規(guī)模與性能之間的正相關(guān)性。為實現(xiàn)通用具身智能體的產(chǎn)業(yè)化落地,星動紀元不僅打造了ERA-42這樣的先進模型,還推出了為AI定義的全新硬件平臺,如自研的五指靈巧手星動XHAND1。這款靈巧手具備12個主動自由度,全自主五指關(guān)節(jié)驅(qū)動,高精度作業(yè)能力,以及高分辨率觸覺陣列傳感器,為復(fù)雜靈巧操作任務(wù)奠定了基礎(chǔ)。
依托ERA-42和星動XHAND1的協(xié)同進化,星動紀元通用人形機器人執(zhí)行任務(wù)的通用性和泛化性將得到大幅提升。結(jié)合此前發(fā)布的復(fù)雜地形穩(wěn)定行走和奔跑的運動性能,以及上下肢協(xié)同作業(yè)能力,星動紀元的原生通用具身智能體將擁有更廣泛的應(yīng)用場景,真正實現(xiàn)產(chǎn)業(yè)化落地。