NVIDIA Research ICRA 2026 में 28 पेपर प्रस्तुत कर रहा है जिनमें से 8 विशेष रूप से simulation-to-real ट्रांसफर को लक्षित करते हैं, वह बाधा जिसने embodied AI को demo अवस्था में रखा है। नामित पेपरों से ठोस संख्याएँ: COMPASS Isaac Lab में residual RL के माध्यम से imitation learning के मुकाबले औसत सफलता दर में 4.5× सुधार दिखाता है, वास्तविक रोबोटों पर ~80%, बिना वास्तविक-दुनिया डेटा के। Grasp-MPC वास्तविक रोबोटों पर 41% बेसलाइन के मुकाबले 75% समग्र सफलता रिपोर्ट करता है, cuRobo और GraspGen का उपयोग करते हुए 8,000 वस्तुओं पर 2 मिलियन सिमुलेटेड ट्रैजेक्टरीज पर प्रशिक्षित। PEEK sim-only नीतियों पर 41× वास्तविक-दुनिया accuracy सुधार रिपोर्ट करता है और VLA मॉडलों के लिए 2-3.5× लाभ, छवि स्तर पर vision-language model गाइडेंस के माध्यम से।
इन संख्याओं के नीचे की stack कहानी वह है जो embodied AI पर विचार करने वाले बिल्डर्स के लिए मायने रखती है। NVIDIA का Isaac Lab सिमुलेशन environment है; cuRobo motion planning को संभालता है; GraspGen grasping डेटासेट प्रदान करता है; Jetson on-robot inference चलाता है। 8 पेपर इस stack को "महंगी PhD परियोजना" से "औद्योगिक प्रक्रिया" तक ला रहे हैं — फार्मा मल्टी-आर्म समन्वय 3× speedup पर (Jetson पर ScheduleStream), सटीक असेंबली 38% सफलता-दर सुधार और 30% साइकिल-टाइम कमी के साथ (SPARR), मल्टी-स्टेप असेंबली 91% सिमुलेशन सफलता और baselines पर ~11% सुधार पर (Refinery), runtime कैंडिडेट एक्शन सत्यापन के साथ 15% तक के लाभ (SEAL), और जैविक विकास समीकरणों से उत्पन्न सिंथेटिक पेड़ों के माध्यम से वास्तविक पेड़ की शाखाओं में zero-shot ट्रांसफर (Deformable Cluster Manipulation)। प्रशिक्षण compute गैर-तुच्छ है (2M ट्रैजेक्टरीज × 8K ऑब्जेक्ट्स) लेकिन परिणामी नीतियाँ वास्तविक-दुनिया डेटा संग्रह के बिना ट्रांसफर करती हैं, जो वास्तविक लागत-बचत है।
बिल्डर्स के लिए इकोसिस्टम रीडिंग: "सिमुलेशन में रोबोट आसान हैं, वास्तविकता में रोबोट कठिन हैं" अंतर बंद हो रहा है, और methodology एक सामान्य stack पर अभिसरण कर रही है। डोमेन रैंडमाइज़ेशन नींव बनी रहती है, लेकिन क्षेत्र residual policy learning (COMPASS), रीयल-टाइम मोशन सुधार (SPARR, Grasp-MPC), और VLM-गाइडेड धारणा (PEEK) को परत कर रहा है। NVIDIA stack वास्तविक संदर्भ कार्यान्वयन है क्योंकि घटक खुले या उपलब्ध हैं, vendor lock-in के कारण नहीं। ईमानदार चेतावनियाँ: PEEK 41× संख्या उन sim-only नीतियों पर है जो वास्तविक दुनिया में शून्य के करीब थीं, इसलिए पूर्ण शुरुआती बिंदु मायने रखता है; अधिकांश baselines NVIDIA के पिछले काम के अपने आंतरिक संख्याएँ हैं, अन्य रोबोटिक्स फ्रेमवर्क के against head-to-head नहीं; और पेपर blog-summarized हैं, लेखन के समय अभी तक peer review से नहीं गुज़रे हैं। ICRA चर्चा में कौन सी संख्याएँ बचती हैं ट्रैक करने लायक।
यदि आप सोमवार सुबह रोबोटिक्स एप्लिकेशन बनाते हैं: sim-to-real रेसिपी अब इतनी पुनरुत्पादन योग्य है कि domain-randomization-plus-VLM-guidance एक डिफ़ॉल्ट शुरुआती बिंदु है, अनुसंधान दिशा नहीं। यदि आप रोबोटिक्स startup को फंड करते हैं: इस साल manipulation या grasping नीति को sim से deployable तक ले जाने की लागत वक्र सिकुड़ गई — clutter में नई वस्तुओं पर 75% वास्तविक-दुनिया grasping सफलता चिह्नित करने योग्य व्यावहारिक मील का पत्थर है।
