星動紀元ERA-42大模型亮相：五指靈巧手開啟具身智能新篇章

發(fā)布時間：2024-12-23 13:17 來源：鈦媒體APP 作者：沈如風

在人工智能領域的一次重大突破中，星動紀元公司震撼發(fā)布了其端到端原生機器人大模型ERA-42，這一創(chuàng)新成果被命名為“紀元原生機器人大模型”，象征著對宇宙奧秘不懈探索的精神。ERA-42攜手星動自研的五指靈巧手星動XHAND1，共同展示了驚人的靈巧操作能力，成功掌握了超過100項復雜精細的任務，且持續(xù)在同一模型框架下學習新技能。

星動XHAND1在ERA-42的賦能下，能夠靈活運用多種工具，完成一系列前所未有的靈巧操作任務。從擰緊螺釘、敲打釘子，到扶正水杯并精準倒水，每一項任務都彰顯了ERA-42卓越的操作能力和學習速度。這些成就標志著業(yè)界首次通過單一具身大模型，實現了五指靈巧手如人手般的多工具操作，展現了ERA-42在通用性和靈巧性方面的行業(yè)領先地位。

更為引人注目的是，ERA-42無需任何預編程技能，僅憑其強大的泛化能力和自適應力，就能在極短時間內學會新任務。通過收集少量數據，模型能在不到兩小時內掌握新技能，并持續(xù)不斷地學習更多新技能。這種能力使得ERA-42成為世界上首個真正的五指靈巧手具身大模型，開啟了具身大模型通用靈巧操作的新紀元。

作為業(yè)界領先的端到端原生機器人大模型，ERA-42不僅在國內處于領先地位，更與世界頂尖水平比肩。星動紀元在早期就與Physical Intelligence (PI)幾乎同時采用了端到端算法來提升機器人大模型的性能。PI推出的π0模型通過結合大規(guī)模視覺-語言預訓練與機器人操作數據集后訓練，實現了機器人在人類環(huán)境中自主執(zhí)行多種復雜任務的能力，這是具身大模型領域的一個重要里程碑。星動紀元的研究成果與PI不謀而合，其論文HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers在CoRL2024上發(fā)表，進一步驗證了端到端算法的有效性。

星動紀元在探索訓練道路時，采用了大規(guī)模視頻數據學習策略，包括無標注視頻數據、公開機器人數據、人類活動數據以及遙操作數據等。這種學習方式不僅降低了數據收集成本，還解決了數據消耗量巨大的行業(yè)難題。同時，星動紀元將世界模型融入原生機器人大模型中，使模型具備了對物理世界的理解能力和對未來行動軌跡的預測能力。這一創(chuàng)新使得模型能夠迅速響應外部干擾，并在任務執(zhí)行過程中持續(xù)自適應優(yōu)化行為，提高了任務執(zhí)行的高效性和準確性。

ERA-42的發(fā)布標志著具身大模型進入通用靈巧操作時代。與傳統的夾爪相比，星動XHAND1在ERA-42的驅動下能夠完成更多樣化、更復雜、更精細的操作任務。同時，ERA-42的融合世界模型能力使其具備了更強的泛化能力和任務成功率。通過大規(guī)模視頻數據的預訓練，模型只需少量數據就能在短時間內學會新任務，并展現出強大的抗干擾能力和自適應能力。

研究結果表明，隨著模型規(guī)模的擴大，ERA-42的任務成功率也明顯提升，初步體現了與大語言模型訓練中類似的“Scaling效應”。這一發(fā)現進一步證實了模型規(guī)模與性能之間的正相關性，為未來的研究和發(fā)展提供了重要指導。

為實現通用具身智能體的產業(yè)化落地，星動紀元不僅打造了ERA-42這一卓越的機器人大模型，還推出了為AI定義的全新硬件平臺。星動XHAND1作為其中的代表，具備12個主動自由度、全自主五指關節(jié)驅動、高分辨率觸覺陣列傳感器等先進技術，為復雜靈巧操作任務奠定了堅實基礎。依托ERA-42和星動XHAND1的協同進化，星動紀元通用人形機器人在執(zhí)行任務時的通用性和泛化性將得到大幅提升，潛在應用場景也將更加多元化。

更多>同類內容