OpenAI 版終結者降臨!地表最強機器人 Figure 02 問世,進寶馬狂飆 20 小時
號稱 OpenAI 二代機器人「Figure 02」,真的來了!Figure AI 終于官宣了第二代人形機器人,完全換了一身新形象 —— 黑色的外觀,更加靈活的五指。
創始人 Brett Adcock 表示,「這是『地表最強』的人形機器人」!
值得一提的是,Figure 02 的設計評審耗時 18 個月完成。
據介紹,迭代后的 Figure 手部具有 16 個自由度,能夠承受與人類相當的力量。
現在的它,已經進入寶馬車廠開始打工了,可以無休止地狂干 20 個小時。
Figure 02 還可以與人類直接開啟「語音對話」,這背后依舊用上了 OpenAI 最先進的定制 AI 模型,通過語音-語音進行推理。
與初代類似,它擁有一個機載的視覺模型(VLM),可通過攝像頭,完成視覺推理。
去年,初代機器人 Figure 01,同樣在 OpenAI 大模型的加持下,能夠看、聽、遵循人類指令。
不僅如此,這家明星初創背后,還得到了英偉達、阿爾特曼、貝索斯等大佬的聯合投資。
如今,工程和設計團隊在 Figure 02 上完成了一次從零開始的硬件和軟件重新設計。
其中,在包括人工智能、計算機視覺、電池、電子設備、傳感器和執行器等關鍵技術上,取得了巨大的進步:
語音到語音:通過內置麥克風和揚聲器連接自定義 AI 模型,能夠與人類進行對話
攝像頭:由 6 個內置 RGB 攝像頭驅動的 AI 視覺系統
手部:第四代手部具有 16 個自由度和等同于人類的力量
內置 VLM:使機器人攝像頭能夠進行快速的常識性視覺推理
電池:機器人軀干內的 2.25 千瓦時定制電池組提供 50% 以上的能量
CPU / GPU:相比上一代,機載計算和 AI 推理能力提高了 3 倍
更流線型的外觀
Figure 02 機器人與其前身 Figure 01 身高相似,但在很多方面都進行了改進。最明顯的變化是機器人的「皮膚」采用了啞光黑色外觀,而不是 Figure 01 的鉻金屬飾面。
之前的機器人看起來像穿著盔甲,而 Figure 02 看起來像一輛現代跑車,擁有流線型的曲線和精致的外觀。
另一個變化部分就是電纜。在 Figure 01 中,電纜被故意布置在機身外部,以支持測試夾具、更換傳感器和電機,并加快維修速度。而在 Figure 02 中,所有電纜都集成到了四肢中,保護它們免受環境的影響,并為長時間在生產線上工作做好準備。
Figure AI 表示,新機器人的電池容量比 Figure 01 大 50%,能夠在實際部署中工作更長時間。電池已集成到人形機器人的軀干中,使其重心更接近中心線位置,使得機器人更加靈活。
Figure AI 還為其定制了電機,與關節傳動系統集成在一起,以優化每個關節的功率和性能。
機器人設計的一大難題,就是可靠地通過旋轉關節布線。我們可以看到,Figure 02 的肩部、肘部、髖部和膝部四個主要關節組設計非常簡潔,完美解決了這個難題。
準備好接收語音指令
AI 模型的訓練決定了機器人智能和能力的核心,因此 Figure AI 與 OpenAI 的合作可謂「如虎添翼」,能夠快速測試、驗證和迭代機器人的語音互動功能。
早在 GPT-4o 發布前,Figure AI 的視頻就展示了機器人如何通過語音指令與人類互動,最新發布的 Figure 02 在 OpenAI 定制模型到加持下,也可以通過麥克風和揚聲器人類進行對話。
Figure AI 表示,Figure 02 的計算和 AI 推理能力提升了 3 倍,可以在現實世界中完全自主地執行任務。
新型號配備了六個 RGB 攝像頭,用于感知物理世界,此外還配備了一個車載視覺語言模型,能夠快速進行常識性的視覺推理。
視覺模型能夠處理所有車載圖像以進行感知、避障,最重要的是進行手眼協調,以便機器人能夠識別并拾取面前的物體。
另外,比起 Figure 01,Figure 02 擁有 3 倍機載計算能力和 AI 推理能力。這使得機器人能夠完全自主地執行實際的 AI 任務。
這里 AI 數據引擎會提供最新的 AI 模型,并直接直接在設備的 GPU 上運行。
操控人手能抓的物體
自成立以來,Figure AI 已經在機器人手部的設計和功能上投入了大量資金。由此得到的最新設計,不僅具有十六個自由度(DoF),而且能夠承載最多 25 公斤(55.1 磅)的物體。
與此同時,這雙「手」的外觀也與人類都非常相似 —— 有四根手指和一個拇指。具體來說,每根手指由一個集成單元驅動,該單元包括傳感器和電機。
手腕是另一個新穎的設計,提供了與人類手腕相似的運動范圍,同時將所有電力和傳感信號線路封裝并引導到手和手指。
Figure AI 表示,他們的目標就是讓機器人能夠操控任何人類手能抓住的物體。
資金雄厚,但人形機器人賽道競爭激烈
Figure AI 最初擺脫「隱身」模式還是在 2023 年 3 月,推出了通用人形機器人 Figure 01,希望能應用于工業制造、物流、倉儲、零售等多個行業以解決全球范圍內的勞動短缺問題。
根據創始人 Adcock 的設想,機器人們可以替人類承擔不安全和不受歡迎的工作,構建一個更加自動化且高效的未來。并且他堅稱,Figure AI 的這項技術絕不會被武器化。
很難想象,Figure AI 第一代全規模機器人的構建僅花了短短 6 個月的時間,不得不說,這得益于包括 CTO Jerry Pratt 在內的 40 名行業專家組成的強大團隊。
作為 2024 年初的投資寵兒,Figure AI 目前已籌集了 6.75 億美元資金。
憑借雄厚的資金,聯合創始人兼 CEO Brett Adcock 正在全速推進,目標是在未來 2~5 年內將自主雙足機器人推向市場。
其實,今年早些時候,Figure AI 就已經在南卡羅來納州一家寶馬工廠測試了。在這里,AI 模型訓練的數據會被收集起來。
在演示中我們可以看到,機器人完全展現出了在工業環境中運行的能力,還能學習執行基本任務。
當然,這個越來越卷的賽道中,其他競爭對手也沒閑著。
Agility Robotics 的 Digit 和 Apptronik 的 Apollo,早就把自家機器人部署到了 GXO 物流公司中,執行簡單任務。
馬斯克家的 Optimus,也很早就被「下放」到了特斯拉工廠;波士頓動力,也有意在現代設施中,給最新版 Atlas 進行測試。
在科幻故事中,我們早就見識過各類人形機器人,但在商業產品的推出上,它們其實一直進展緩慢。
一方面是受限于研究環境,另一方面,設計也非常昂貴。
然而,LLM 和多模態 AI 模型的發展,改變了這一切!如果模型能快速分析實時視頻和音頻輸入,還能以類人音頻和動作進行相應,那科幻中的場景,顯然不會很遙遠了。
擁有 Optimus 的馬斯克最近大膽預言,地球上有超過 100 億臺人形機器人的市場,這意味著未來每個人會擁有不止一臺機器人。
此外,英偉達的 GR00T 項目也在進行時,展示了 AI 在指導人形機器人方面的進展。
Jim Fan 發布的這個視頻中,人類遠程操作員可以通過佩戴 Apple Vision Pro 來引導機器人完成正確動作。
快速 QA
由于官方并沒有透露太多信息,因此外媒 IEEE Spectrum 找到了 Figure 的控制總監 Michael Rose 和硬件總監 Vadim Chernyak,并做了一波快速的 QA。
問:Figure 02 有多少個部件?這些是全部嗎?
答:有幾百個獨特的部件,總共有幾千個部件。不,這不是全部。
問:Figure 02 每走一步都會留下 Figure 標志嗎?
答:如果表面足夠柔軟的話,是的。
問:「可更換的腿」是很難做到的嗎,還是因為只需要做一條腿而更容易呢?
答:我們選擇制作可更換的腿是為了便于制造。
問:電池包也是可更換的嗎?
答:我們的電池是可更換的,但這不是一個快速更換的過程。
問:Figure 02 膝蓋后面和肘關節處那個看起來軟軟的東西是什么呢?
答:這些是軟限位器,它們以受控的方式限制運動范圍,并防止機器人夾傷。
問:你們把拇指的馬達藏哪了?
答:拇指現在完全包含在手中。
問:脖子上的「皮膚」是什么?
答:這種皮膚是一種柔軟的織物,即使機器人移動頭部,也能保持干凈無縫的外觀。
問:當 Figure 02 的頭部轉動時,它的身體也會轉動,手臂也會移動。這是必要的,還是只是出于美學考慮?
答:只是出于美學考慮。
問:上半身和肩膀看起來比其他人形機器人窄得多。為什么設計成這樣?
答:我們認為將機器人設計成與人類相似的比例非常重要。這使我們能夠完成目標使用場景,并更容易適應環境。
問:Figure 02 的步態是如何設計的?
答:機器人使用模型預測控制器來確定腳步位置和維持平衡所需的力量,從而跟隨預定的軌跡。
問:2.25 千瓦時的電量在視頻中的那些任務中能運行多長時間?
答:我們的目標是讓產品運行 5 小時。
參考資料:
https://x.com/Figure_robot/status/1820791819023909031
https://www.therobotreport.com/figure-02-humanoid-robot-is-ready-to-get-to-work/
https://spectrum.ieee.org/figure-new-humanoid-robot
https://venturebeat.com/ai/openai-backed-startup-figure-teases-new-humanoid-robot-figure-02/