在人工智能領域的一次重大突破中,星動紀元公司震撼發(fā)布了其端到端原生機器人大模型ERA-42,這一創(chuàng)新成果被命名為“紀元原生機器人大模型”,象征著對宇宙奧秘不懈探索的精神。ERA-42攜手星動自研的五指靈巧手星動XHAND1,共同展示了驚人的靈巧操作能力,成功掌握了超過100項復雜精細的任務,且持續(xù)在同一模型框架下學習新技能。
星動XHAND1在ERA-42的賦能下,能夠靈活運用多種工具,完成一系列前所未有的靈巧操作任務。從擰緊螺釘、敲打釘子,到扶正水杯并精準倒水,每一項任務都彰顯了ERA-42卓越的操作能力和學習速度。這些成就標志著業(yè)界首次通過單一具身大模型,實現了五指靈巧手如人手般的多工具操作,展現了ERA-42在通用性和靈巧性方面的行業(yè)領先地位。
更為引人注目的是,ERA-42無需任何預編程技能,僅憑其強大的泛化能力和自適應力,就能在極短時間內學會新任務。通過收集少量數據,模型能在不到兩小時內掌握新技能,并持續(xù)不斷地學習更多新技能。這種能力使得ERA-42成為世界上首個真正的五指靈巧手具身大模型,開啟了具身大模型通用靈巧操作的新紀元。
作為業(yè)界領先的端到端原生機器人大模型,ERA-42不僅在國內處于領先地位,更與世界頂尖水平比肩。星動紀元在早期就與Physical Intelligence (PI)幾乎同時采用了端到端算法來提升機器人大模型的性能。PI推出的π0模型通過結合大規(guī)模視覺-語言預訓練與機器人操作數據集后訓練,實現了機器人在人類環(huán)境中自主執(zhí)行多種復雜任務的能力,這是具身大模型領域的一個重要里程碑。星動紀元的研究成果與PI不謀而合,其論文HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers在CoRL2024上發(fā)表,進一步驗證了端到端算法的有效性。
星動紀元在探索訓練道路時,采用了大規(guī)模視頻數據學習策略,包括無標注視頻數據、公開機器人數據、人類活動數據以及遙操作數據等。這種學習方式不僅降低了數據收集成本,還解決了數據消耗量巨大的行業(yè)難題。同時,星動紀元將世界模型融入原生機器人大模型中,使模型具備了對物理世界的理解能力和對未來行動軌跡的預測能力。這一創(chuàng)新使得模型能夠迅速響應外部干擾,并在任務執(zhí)行過程中持續(xù)自適應優(yōu)化行為,提高了任務執(zhí)行的高效性和準確性。
ERA-42的發(fā)布標志著具身大模型進入通用靈巧操作時代。與傳統的夾爪相比,星動XHAND1在ERA-42的驅動下能夠完成更多樣化、更復雜、更精細的操作任務。同時,ERA-42的融合世界模型能力使其具備了更強的泛化能力和任務成功率。通過大規(guī)模視頻數據的預訓練,模型只需少量數據就能在短時間內學會新任務,并展現出強大的抗干擾能力和自適應能力。
研究結果表明,隨著模型規(guī)模的擴大,ERA-42的任務成功率也明顯提升,初步體現了與大語言模型訓練中類似的“Scaling效應”。這一發(fā)現進一步證實了模型規(guī)模與性能之間的正相關性,為未來的研究和發(fā)展提供了重要指導。
為實現通用具身智能體的產業(yè)化落地,星動紀元不僅打造了ERA-42這一卓越的機器人大模型,還推出了為AI定義的全新硬件平臺。星動XHAND1作為其中的代表,具備12個主動自由度、全自主五指關節(jié)驅動、高分辨率觸覺陣列傳感器等先進技術,為復雜靈巧操作任務奠定了堅實基礎。依托ERA-42和星動XHAND1的協同進化,星動紀元通用人形機器人在執(zhí)行任務時的通用性和泛化性將得到大幅提升,潛在應用場景也將更加多元化。