“全球超5000萬的勞動力缺口”與“三分之二人口無法獲得基礎醫(yī)療影像服務”的現(xiàn)實,揭示了AI的發(fā)力方向。
近期,NVIDIA在GTC 2025的兩大發(fā)布——全球首個開源人形機器人基礎模型Isaac GR00T N1,以及聯(lián)合GE醫(yī)療推出的醫(yī)療AI仿真平臺——給出了一個回應:物理AI(Physical AI)。通過將物理規(guī)律嵌入AI訓練、用合成數(shù)據(jù)替代稀缺的人類經(jīng)驗,NVIDIA正在證明:機器人不僅能看得懂世界,更能理解世界如何運轉(zhuǎn)。
GR00T N1基礎模型,賦予人形機器人通用技能與推理技能
NVIDIA Isaac GR00T N1是一個開源且可定制的基礎模型,可支持通用人形機器人實現(xiàn)推理及各項技能,有助于加速行業(yè)轉(zhuǎn)型。據(jù)了解,它是一系列可完全定制模型中的首個模型,NVIDIA將對該系列模型進行預訓練,并面向全球機器人開發(fā)者發(fā)布。同時推出的新技術還包括仿真框架和藍圖:如用于生成合成數(shù)據(jù)的NVIDIA Isaac GR00T Blueprint,以及和Google DeepMind及Disney Research共同開發(fā)的、專為機器人開發(fā)而構建的開源物理引擎Newton。
黃仁勛指出,通用機器人的時代已經(jīng)到來,借助NVIDIA Isaac GR00T N1以及新的數(shù)據(jù)生成和機器人學習框架,全球機器人開發(fā)者將開啟 AI 時代的全新篇章。
據(jù)介紹,GR00T N1 基礎模型采用雙系統(tǒng)架構,這是受到人類認知原理的啟發(fā)?!跋到y(tǒng)1”是一個快速思考的動作模型,反映人類的本能反應或直覺?!跋到y(tǒng)2”是慢思考模型,用于進行經(jīng)過深度思考的決策制定。
其中,系統(tǒng)2由視覺語言模型提供支持,它會對所處環(huán)境和接收到的指令進行推理,從而規(guī)劃行動。系統(tǒng)1隨后將這些規(guī)劃轉(zhuǎn)化為精確、連續(xù)的機器人運動。系統(tǒng)1基于人類演示數(shù)據(jù)和 NVIDIA Omniverse平臺生成的海量合成數(shù)據(jù)進行訓練。
根據(jù)演示來看,GR00T N1可輕松適應并完成通用任務,如單手或雙手抓取、移動物體,將物體從一只手臂轉(zhuǎn)移到另一只手臂,或執(zhí)行需要長語境和通用技能組合的多步驟任務。這些功能可應用于物品搬運、包裝和檢查等各種使用場景中。值得一提的是,開發(fā)者和研究人員可使用真實數(shù)據(jù)或合成數(shù)據(jù)針對特定人形機器人或任務對GR00T N1進行后訓練。
在GTC主題演講中,黃仁勛展示了1X的人形機器人自主執(zhí)行室內(nèi)清理任務的過程,該過程就是基于GR00T N1的后訓練策略。
據(jù)了解,這款機器人自主能力是1X與NVIDIA AI協(xié)作訓練的成果。1X Technologies首席執(zhí)行官Bernt B?rnich認為,人形機器人未來的開發(fā)重點在于適應能力和學習能力。由于GR00T N1模型在機器人推理和技能方面實現(xiàn)突破,因此僅需最少量的后訓練數(shù)據(jù),就能在 NEO Gamma上全面部署。全球其他優(yōu)先使用 GR00T N1 的領先機器人公司還包括 Agility Robotics、波士頓動力、Mentee Robotics 和 NEURA Robotics。
為了讓機器人學習如何以更高精度處理復雜任務,NVIDIA 還與Google DeepMind、Disney Research展開合作,共同開發(fā)開源物理引擎Newton。
據(jù)介紹,Newton基于NVIDIA Warp框架而構建,將針對機器人學習進行優(yōu)化,并與Google DeepMind MuJoCo和NVIDIA Isaac Lab等仿真框架兼容。此外,三家公司還計劃讓Newton能夠利用迪士尼的物理引擎。
Disney Research將成為首批使用Newton以推動其機器人角色平臺發(fā)展的公司之一,該平臺為下一代娛樂機器人提供支持,比如此次 GTC 主題演講中和黃仁勛一起登臺、以星球大戰(zhàn)為靈感設計的富有表現(xiàn)力的 BDX 機器人,就是該平臺的成果。
此外,應對機器人后訓練發(fā)展的數(shù)據(jù)問題,NVIDIA宣布了用于合成運動生成的 NVIDIA Isaac GR00T Blueprint。它基于Omniverse 和 NVIDIA Cosmos Transfer 世界基礎模型構建,讓開發(fā)者可以通過少量的人工演示生成大量合成運動數(shù)據(jù),以用于操作任務。
利用為藍圖提供的首批組件,NVIDIA 能夠在11小時內(nèi)生成780,000個合成軌跡,相當于 6,500 小時或連續(xù)九個月的人類演示數(shù)據(jù)。然后,通過將合成數(shù)據(jù)與真實數(shù)據(jù)相結合,與僅使用真實數(shù)據(jù)相比,NVIDIA將GR00T N1性能提高了40%。
據(jù)介紹,為進一步為開發(fā)者社區(qū)提供有價值的訓練數(shù)據(jù),NVIDIA 將發(fā)布 GR00T N1 數(shù)據(jù)集,作為更大的開源物理 AI 數(shù)據(jù)集的一部分,現(xiàn)在可通過 Hugging Face 下載。
此外,NVIDIA還宣布推出了個人AI超級計算機NVIDIA DGX Spark,為開發(fā)者提供一站式系統(tǒng),可將GR00T N1功能擴展到新機器人、任務和環(huán)境中,而無需進行大量自定義編程。
NVIDIA與GE醫(yī)療合作,引入物理AI推進自主診斷成像開發(fā)
醫(yī)療AI方面,則傳來NVIDIA與GE醫(yī)療合作的消息,雙方將共同推進自主成像技術創(chuàng)新,重點開發(fā)自主X射線技術與超聲應用。GE醫(yī)療采用了全新的 NVIDIA Isaac for HealthCare 醫(yī)療設備仿真平臺,該平臺包含預訓練模型及基于物理的傳感器、解剖結構與環(huán)境仿真,可加速研發(fā)流程,使GE醫(yī)療能夠在部署前通過虛擬環(huán)境訓練、測試與驗證自主成像系統(tǒng)能力。
醫(yī)療行業(yè)作為AI重要的應用領域之一,其實當前醫(yī)療服務需求遠超供給。超聲與X射線作是最常見且廣泛使用的診斷成像系統(tǒng),然而全球仍有近三分之二人口無法獲得這類檢查服務。通過為成像系統(tǒng)增加機器人能力,有助于擴大醫(yī)療服務覆蓋范圍。
NVIDIA將通過Isaac for Healthcare支持更多客戶構建仿真環(huán)境用例。仿真環(huán)境使機器人系統(tǒng)能夠在物理精確的虛擬環(huán)境中安全學習技能,以應對手術等現(xiàn)實場景,這些場景通常難以復現(xiàn)。
Isaac for Healthcare 是基于NVIDIA三大機器人計算平臺(NVIDIA DGX,NVIDIA Omniverse以及 NVIDIA Holoscan)構建的物理 AI 平臺,包含專為醫(yī)療機器人優(yōu)化的AI模型,可通過增強視覺與語言處理能力實現(xiàn)理解、行動與觀察功能。平臺還提供仿真框架,供開發(fā)者精確仿真醫(yī)療環(huán)境,并通過邊緣AI計算平臺NVIDIA Holoscan實現(xiàn)實時機器人決策。
借助 Isaac for Healthcare,醫(yī)療傳感器仿真選項有限的問題有望得到解決。開發(fā)者可訪問基于物理的醫(yī)療環(huán)境數(shù)字孿生,導入定制傳感器、器械甚至解剖結構,訓練機器人應對多樣化場景。此類虛擬環(huán)境有助于縮小仿真與現(xiàn)實的差距,支持快速數(shù)字原型設計。
據(jù)介紹,該平臺支持從微觀結構、手術室到完整醫(yī)院設施的多尺度仿真。通過仿真策略訓練,機器人系統(tǒng)可學習如何在手術室的各種醫(yī)療場景中做出反應,以及如何以最佳方式輔助醫(yī)生做出決策和為患者提供護理服務。
Isaac for Healthcare 將會通過仿真復雜醫(yī)療場景、訓練AI模型及優(yōu)化手術、內(nèi)窺鏡與心血管介入等機器人應用,加速醫(yī)療機器人解決方案開發(fā)。目前,Moon Surgical、Neptune Medical 以及Xcath等機構已經(jīng)提前開始使用這一平臺。這些合作伙伴可以將其仿真工具、傳感器、機器人系統(tǒng)與醫(yī)療探針無縫集成至專用仿真環(huán)境。Ansys、Franka、ImFusion、Kinova 與 Kuka 在內(nèi)的生態(tài)合作伙伴已經(jīng)提前開始部署這一功能。
NVIDIA機器人布局:打通全鏈條能力
NVIDIA在機器人領域的布局已經(jīng)展現(xiàn)了一條清晰的戰(zhàn)略路徑:通過底層技術堆棧的垂直整合,正在打通從數(shù)據(jù)生成到硬件落地的全鏈條能力,同時以開源協(xié)作加速生態(tài)建設。
用于合成數(shù)據(jù)生成的全新 Omniverse Blueprint和開源數(shù)據(jù)集,正在快速開啟物理AI的數(shù)據(jù)飛輪。通過將Omniverse與合成數(shù)據(jù)生成的深度結合,解決了機器人訓練中數(shù)據(jù)稀缺與多樣性的核心痛點。特別是對于人形機器人這類需要高度動態(tài)適應的領域,為算法優(yōu)化提供了更大的試錯空間。
并且,GR00T N1模型、Newton引擎等開源舉措,將有助于吸引開發(fā)者與合作伙伴共建生態(tài)。通過開放物理仿真核心能力,開發(fā)者可以低成本接入高精度仿真環(huán)境,同時社區(qū)貢獻的插件與擴展,將反哺工具鏈的完善。這種開放協(xié)作的模式,不僅降低了中小企業(yè)的創(chuàng)新門檻,還有望催生跨行業(yè)應用(如工業(yè)機器人與醫(yī)療機器人的技術遷移),形成良性循環(huán)的創(chuàng)新生態(tài)。
另一方面,NVIDIA面向醫(yī)療領域推出的Isaac for Healthcare 醫(yī)療設備仿真平臺,作為基于NVIDIA三大機器人計算平臺(NVIDIA DGX,NVIDIA Omniverse以及 NVIDIA Holoscan)構建的物理 AI 平臺,通過引入物理AI推進自主診斷成像開發(fā),體現(xiàn)了對行業(yè)需求的精準洞察。這種“通用+垂直”的并行策略,既保證了技術底座的可擴展性,又能在細分市場快速建立競爭優(yōu)勢。
有望重新定義機器人技術邊界
NVIDIA正在通過AI與物理仿真為核心,重構機器人開發(fā)范式。從數(shù)據(jù)生成、算法訓練到硬件部署,其技術堆棧覆蓋了機器人開發(fā)全生命周期,而開源策略則打破了傳統(tǒng)封閉系統(tǒng)的局限性,推動行業(yè)向協(xié)作式創(chuàng)新邁進。
在AI與機器人深度融合的當下,這一戰(zhàn)略不僅加速了從實驗室到工廠、醫(yī)療場景的落地進程,更預示著一個更廣闊的未來:機器人將不再是被動執(zhí)行指令的工具,而是具備自主感知、學習和適應能力的“智能體”。這一進化,或?qū)⒅匦露x機器人的技術邊界,開啟新一輪創(chuàng)新變革。