http://m.sharifulalam.com 2025-02-21 14:36 來源:金十數據
與OpenAI決裂不久后,Figure AI正式發布Helix,號稱能讓機器人像人類一樣理解世界、執行任務,而無需專門訓練。
Figure AI于周四終于揭曉了促使其與投資方之一OpenAI斷絕關系的“重大突破”:Helix,一種全新的雙系統AI架構,使機器人能夠理解自然語言指令,并操控從未見過的物體,而無需針對每個物體進行特定的預訓練或編程。
Figure AI是一家專注于構建AI賦能仿人機器人的美國初創公司,不久前剛宣布與OpenAI徹底分道揚鑣,首席執行官Brett Adcock解釋稱,Helix在機器人智能方面的突破讓這家公司不再需要與OpenAI合作。這一決定距兩家公司去年宣布合作僅幾個月,當時Figure AI還完成了一輪6.75億美元融資,估值達到26億美元,以推動其Figure 02機器人開發。
這家人形機器人公司今年早些時候獲得6.75億美元B輪融資,投資者包括OpenAI、微軟、英偉達和杰夫·貝索斯,當時估值達26億美元。據報道,該公司正尋求額外15億美元融資,如果成功,其估值將飆升至395億美元。
這家總部位于加州桑尼維爾(Sunnyvale)的初創公司開發了一種視覺-語言-動作(Vision-Language-Action, VLA)模型,統一了感知、語言理解和學習控制能力,使其能夠進行泛化應用。
與傳統機器人必須針對每項新任務進行大量編程或示范學習不同,Helix模型結合了高級推理系統和實時運動控制系統。這兩個系統有效彌合了語義理解(知道物體是什么)與運動控制(知道如何操控物體)之間的差距。
Helix的突破在于其雙系統架構,模仿人類認知:一個擁有70億參數的“系統2”視覺-語言模型(VLM),處理高階理解能力,運行頻率7-9Hz(即每秒更新9次),用于結構化和復雜任務的推理,相當于“深思熟慮”;以及一個擁有8000萬參數的“系統1”視覺-運動控制策略(visuomotor policy),運行頻率200Hz(即每秒更新200次),將指令轉化為精確的物理動作,相當于“直覺反應”。
這一突破使機器人能夠隨著時間推移變得更加強大,而無需頻繁更新系統或訓練新數據。為了展示這一技術,Figure AI發布了一段視頻,展示兩臺Figure機器人協作整理雜貨,一臺機器人遞物品,另一臺機器人則將物品放入抽屜和冰箱。
Figure聲稱,這兩臺機器人此前并不知道它們正在處理的物品,但仍然能夠識別哪些應該存放在冰箱里,哪些需要保持干燥存放。
"Helix可以泛化至任何家居物品," Adcock在社交媒體上表示。"就像人類一樣,Helix能夠理解語音、推理問題,并能抓取任何物體——且無需訓練或額外編程。"
Figure聲稱,這一模型在機器人技術領域創造了多個首次突破。它能以200Hz(每秒200次)的速率持續控制整個仿人機器人上半身,包括手指、手腕、軀干和頭部方向的動作。它還能讓兩臺機器人協作處理從未見過的物體,共同完成任務。
與以往的方法不同,Helix不依賴任務特定的微調,而是使用同一組神經網絡權重處理所有行為。其中,一個系統解析語音和視覺數據,實現復雜決策,而另一個系統則將指令轉化為精準的運動控制,實現實時響應。
"我們已經為此研究了一年多,目標是徹底解決通用機器人問題," Adcock在社交媒體上表示。"僅靠編程無法解決這一問題,我們需要機器人能力實現質的飛躍,才能擴展至10億臺機器人級別。"
Helix這一突破開啟了機器人領域的全新“擴展法則”——不再依賴編程,而是通過大規模集體學習,使模型在無需專門訓練的情況下變得更強大。
Figure AI采用500小時的遠程操作機器人行為數據訓練Helix,并利用自動標注流程為每個示范生成自然語言指令。整個系統運行在機器人內部的嵌入式GPU上,使其能夠立即投入商業使用。
Figure AI透露,已與寶馬(BMW)制造部門以及一家未披露的美國主要客戶達成合作。該公司預計,這些合作將為未來四年內部署10萬臺機器人奠定基礎。