"數據"在具身智能中的價值超10萬億美元,是互聯(lián)網數據價值的三倍...
2024/06/19
具身人工智能(EAI)是將人工智能(AI)集成到機器人等物理實體中,賦予它們感知、學習并與環(huán)境動態(tài)交互的能力,使這些機器人能夠在人類社會中有效地提供商品和服務。在本文中,我們將與互聯(lián)網領域的數據價值進行比較,以估計EAI中數據的潛在價值。此外,我們深入研究了EAI開發(fā)中數據瓶頸帶來的重大挑戰(zhàn),并研究了旨在克服這些障礙的創(chuàng)新數據捕獲和生成技術。
1.
數據是一種變現工具
數據是互聯(lián)網和機器人領域變現的重要工具。在此,我們以互聯(lián)網行業(yè)為歷史標桿,探討數據在EAI中的戰(zhàn)略價值。
在互聯(lián)網領域,公司利用用戶數據主要是進行精準的廣告和提供個性化內容。這種精準的方法不僅可以增加銷量,還可以提高用戶的參與度,從而導致訂閱費更高或使用量增加。與此同時,在EAI領域,數據對于訓練深度學習模型至關重要,這些模型可以增強和優(yōu)化機器人的能力。
從財務上來說,用戶數據對互聯(lián)網公司來說代表著巨大的價值,估計每個用戶價值600美元,考慮到大規(guī)模商業(yè)化后估計每個機器人的成本為35,000美元,我們保守預測機器人公司愿意投資約占機器人成本的3%用于數據收集和生成。這項投資旨在開發(fā)先進的EAI功能,預計EAI數據的市場價值將超過10萬億美元,是互聯(lián)網行業(yè)的三倍。
這凸顯了EAI數據的巨大潛力,而如今EAI的數據收集和生成行業(yè)仍處于起步階段。
2.
具身人工智能的數據瓶頸
雖然EAI數據行業(yè)的未來看起來很光明,但如今EAI系統(tǒng)的可擴展性受到嚴重數據瓶頸的巨大阻礙。與互聯(lián)網數據不同(主要由用戶生成的輸入組成且收集和聚合相對簡單),EAI數據涉及機器人與其動態(tài)環(huán)境之間的復雜交互。這一根本區(qū)別意味著,互聯(lián)網數據可以從數字平臺上的用戶活動中挖掘,而EAI數據必須捕獲種類繁多且通常不可預測的環(huán)境中的大量物理交互。
例如,雖然易于訪問的聊天數據允許ChatGPT 4使用570GB的文本進行訓練,展示出對聊天任務的出色熟練程度,但訓練EAI模型需要更多的機器人數據,因為其多模態(tài)的性質。這些機器人數據包含各種感官輸入和交互類型,不僅極具挑戰(zhàn)性,而且收集成本高昂。
訓練EAI的第一個挑戰(zhàn):是獲取廣泛、高質量和多樣化的數據集。例如,自主導航機器人需要處理大量環(huán)境數據,以增強其路徑規(guī)劃和避障能力。此外,數據的精度直接影響機器人的性能;從事高精度任務的工業(yè)機器人需要極其準確的數據,其中微小的錯誤可能會導致生產質量出現重大問題。此外,機器人在不同環(huán)境中的適應和泛化能力取決于其處理數據的多樣性。例如,家庭服務機器人必須適應各種家庭環(huán)境和任務,要求它們從廣泛的家庭環(huán)境數據中學習,以提高其泛化能力。
訓練EAI的第二個挑戰(zhàn):是“數據孤島”。獲取如此全面的數據充滿挑戰(zhàn),包括成本高、時間要求長以及潛在的安全風險。大多數EAI機器人企業(yè)僅限于在特定的受控環(huán)境中收集數據。實體之間缺乏數據共享加劇了這種情況,導致重復工作和資源浪費,并形成“數據孤島”。這些孤島極大地阻礙了EAI的進展。
3.
數據捕獲和生成
為了解決EAI開發(fā)中的數據可用性瓶頸,強大的數據捕獲和生成管道至關重要。圖2展示了此類管道的架構。
該管道的第一個組成部分涉及捕獲真實世界的數據。這包括收集人類與物理環(huán)境交互的數據以進行模仿學習,如Mobile-Aloha(捕獲復雜的交互任務)和PneuAct(專注于捕獲與人類手部動作相關的數據)等研究項目中所見。此外,該管道還涉及從多模式機器人傳感器收集數據,以捕獲機器人對其物理環(huán)境的感知。
其次,鑒于獲取大量高質量和多樣化的EAI數據的成本過高,基于數字孿生的仿真已被證明是一種有效的解決方案。這種方案顯著降低數據采集成本,提高開發(fā)效率。例如,為自動駕駛汽車捕獲一小時的多模式機器人數據的成本為180美元,而模擬相同數據的成本僅為2.20美元,減少了近100倍。此外,Sim2Real技術的進步促進了技能和知識從模擬環(huán)境到現實世界應用的轉移。這項技術在虛擬空間中訓練機器人和人工智能系統(tǒng),使它們能夠安全有效地學習任務,而不受現實世界的物理風險和限制。因此,現實世界數據和合成數據的結合是克服EAI中數據可用性挑戰(zhàn)的戰(zhàn)略方法。
最后,收集和生成的數據都必須經過時間和空間的對齊,這一點至關重要。這確保了來自各種傳感器的數據準確且同步,從而提供對機器人環(huán)境和動作的統(tǒng)一且詳細的了解。只有經過這些過程之后,數據才能有效地用于訓練EAI系統(tǒng)。
結論
本文探討了數據在EAI中的作用,并估計EAI中數據收集和生成的市場可能超過10萬億美元,可能是互聯(lián)網數據市場價值的三倍。與直接收集互聯(lián)網數據不同,收集EAI數據涉及動態(tài)環(huán)境中的復雜交互,使其成為一項昂貴且具有挑戰(zhàn)性的工作。為了應對這些挑戰(zhàn),我們引入了利用Sim2Real技術的數據捕獲和生成管道,將現實世界的數據收集與基于數字孿生的模擬相結合,以降低成本并提高開發(fā)效率。目前,應用Sim2Real技術的主要障礙是“現實差距”——模擬環(huán)境與現實世界之間的差異,包括物理、光照和意外交互的差異。克服這一差距需要創(chuàng)新技術,例如領域隨機化(將各種場景納入模擬)和領域適應(調整人工智能的響應以更好地適應現實世界的條件)。這些策略對于有效彌合模擬訓練和現實應用之間的差距至關重要。
https://cacm.acm.org/blogcacm/the-value-of-data-in-embodied-artificial-intelligence/