近期,科技界迎來了一項重大突破,星動紀元公司推出的端到端原生機器人大模型ERA-42正式亮相,該模型又名“紀元原生機器人大模型”,象征著對宇宙奧秘不懈探索的精神。ERA-42與星動自研的五指靈巧手星動XHAND1相結(jié)合,展現(xiàn)了驚人的靈巧操作能力,能夠使用多種工具完成超過100項復雜任務(wù),并且持續(xù)在同一模型框架下學習新技能。
星動XHAND1在ERA-42的賦能下,實現(xiàn)了前所未有的五指靈巧操作。無論是拿起螺釘用鉆擰緊,還是用錘子敲打釘子,甚至將傾斜的水杯扶正后再精準倒水,這些任務(wù)都顯得游刃有余。這一成就標志著業(yè)界首次通過單一具身大模型,實現(xiàn)了五指靈巧手如同人手般的多樣化工具使用能力,彰顯了ERA-42在通用性和靈巧操作上的領(lǐng)先地位。
ERA-42不僅是國內(nèi)首個真正意義上的端到端原生機器人大模型,也是全球范圍內(nèi)首個實現(xiàn)五指靈巧手具身化的模型,開啟了具身大模型在通用靈巧操作領(lǐng)域的新篇章。一個真正的具身大模型,需具備三個核心要素:統(tǒng)一的模型泛化能力、端到端的處理流程以及規(guī)?;陌l(fā)展?jié)摿Α?/p>
首先,ERA-42通過構(gòu)建統(tǒng)一的原生模型,融合了視覺、語言、觸覺和身體姿態(tài)等多模態(tài)信息,實現(xiàn)了對不同任務(wù)和環(huán)境的廣泛適應性。其次,其端到端的處理流程,從接收全模態(tài)數(shù)據(jù)到生成最終輸出,無需人為設(shè)計特征或預編程,使具身智能體能夠?qū)崟r適應各種任務(wù)和環(huán)境,顯著提升了靈活性和開發(fā)效率。最后,通過持續(xù)的數(shù)據(jù)積累,ERA-42不斷提升性能,展現(xiàn)出卓越的自適應和泛化能力。
星動紀元在探索具身大模型的發(fā)展道路上,與Physical Intelligence(PI)不謀而合。PI推出的π0模型,通過結(jié)合大規(guī)模的視覺-語言預訓練與機器人操作數(shù)據(jù)集,實現(xiàn)了機器人在人類環(huán)境中自主執(zhí)行復雜任務(wù)的能力。而星動紀元則另辟蹊徑,采用大規(guī)模視頻數(shù)據(jù)學習策略,涵蓋了無標注視頻、公開機器人數(shù)據(jù)、人類活動數(shù)據(jù)以及遙操作數(shù)據(jù)等,通過學習行動結(jié)果而非直接模仿,降低了數(shù)據(jù)收集成本,解決了行業(yè)難題。
星動紀元的技術(shù)團隊還將世界模型融入ERA-42中,使其不僅具備行動能力,還擁有了對物理世界的深刻理解和對未來行動軌跡的預測能力。這種能力使得ERA-42在執(zhí)行任務(wù)時能夠迅速響應外部干擾,持續(xù)自適應優(yōu)化行為,直至任務(wù)完成,從而提升了執(zhí)行任務(wù)的高效性和準確性。
相比傳統(tǒng)的夾爪,星動XHAND1在ERA-42的加持下,能夠完成更多精細化、智能化的復雜靈巧操作任務(wù)。五指靈巧手如同人手般靈活,能夠使用更多種類的工具,完成更通用、更復雜的操作。同時,ERA-42的融合世界模型能力,使其對物理世界有了更深入的理解,對未來行動有了更準確的預測,從而大幅提升了任務(wù)的泛化能力和成功率。
星動紀元打造的全新硬件平臺,為AI定義了全新的發(fā)展方向。以星動XHAND1為例,該靈巧手擁有12個主動自由度,采用純電驅(qū)方式,每個自由度都有獨立的驅(qū)動源,實現(xiàn)了全自主五指關(guān)節(jié)驅(qū)動。同時,每個手指都配備了高分辨率觸覺陣列傳感器,提供了精確的三維力觸覺和溫度信息。這些硬件特性為ERA-42在執(zhí)行復雜靈巧操作任務(wù)時提供了堅實的基礎(chǔ)。
隨著ERA-42與星動XHAND1的協(xié)同進化,星動紀元通用人形機器人在執(zhí)行任務(wù)時的通用性和泛化性將得到大幅提升。結(jié)合此前發(fā)布的復雜地形穩(wěn)定行走和奔跑能力,以及上下肢協(xié)同作業(yè)能力,星動紀元的通用具身智能體將擁有更廣泛的應用場景,為實現(xiàn)產(chǎn)業(yè)化落地奠定了堅實基礎(chǔ)。