في إطار محاكاة عالية AI2-THOR، تريد أن تجعل تعزيز التعلم بسرعة في العالم الحقيقي

الصيف B مترجم الانتهاء

إنتاج و qubit | عدد ملفه QbitAI

AlphaGo من الانتصارات، للتدليل على قوة تعزيز التعلم. ولكن إذا كنت تريد يتم تطبيق هذه الطريقة إلى العالم الحقيقي، القائد الروبوت لاستكمال الباب، وتأخذ الأشياء، أشياء وضع الخ للبشر مهمة سهلة، ولكن أيضا حاجة لمعالجة هذه المشكلة:

نموذج تعزيز التعلم للخضوع لتكرار التجربة والخطأ عملية لتتلاقى، ولكن لجعله في التجربة والخطأ والتوقيت العالمي الحقيقي، ومرة أخرى أمر غير عملي واضح.

من أجل سد هذه الفجوة في الظاهرية والعالم الحقيقي، وهو رجل اسمه AI2-THOR يتم إنشاء إطار جديد.

AI2-THOR من قبل معهد ألين للذكاء الاصطناعي (AI2)، جامعة ستانفورد، جامعة كارنيجي ميلون، جامعة واشنطن، جامعة جنوب كاليفورنيا الانتهاء منها في التعاون. ويوفر هذا الديكور الداخلي تأثير عامل الذكاء الاصطناعي الرسم الرياح في العالم، ودرجة عالية من المحاكاة، وكيل ويمكن أن تتفاعل مع مجموعة متنوعة من الأثاث والأجهزة داخل - مثل فتح الثلاجة، وهدم الكرسي، وضع جهاز الكمبيوتر على الطاولة، وهلم جرا.

من أجل التفاعل مع وكيل أقرب إلى مشهد حقيقي، AI2-THOR بالإضافة إلى بما في ذلك السطح العلوي يمكن أن نرى ذات جودة عالية 3D المشهد الخارج، وكذلك وراء محرك الوحدة 3D، والذي يسمح الكائنات إلى اتباع القواعد من العالم الحقيقي لحركة البدنية ، وهذا جعل التفاعل واقعية قدر الإمكان.

وعلاوة على ذلك، يوفر AI2-THOR مزيد من بيثون API.

مقارنة مع نفس الإطار، - وكيل وجوه قابلة للتشغيل في المشهد، هو تسليط الضوء الرئيسي للAI2-THOR. أصالتها والتكامل المادي للقواعد، وهناك أيضا إطارا القليل منها.

في حين أن هذا الإطار المقترح، وتعزيز هؤلاء الباحثين أيضا تعلم نموذج من أجل تحسين القدرة تعميم أهداف جديدة قدم الممثل مع وظيفة لحالة وأهداف الحالي للسياسة - نموذج الناقد.

هذا مزيج من الاثنين، بلغ أكثر تقدما من عمق طريقة تعزيز التعلم ومعدل أسرع التقارب، ولكن أيضا لتعميم لمجموعة متنوعة من الأهداف والسيناريوهات.

في مشهد القطار نموذج المحاكاة بعد كمية صغيرة من ضبط، حتى تعميمها على المشهد النشط الروبوت الحقيقي. وبالإضافة إلى ذلك، يمكن أن نموذجهم يكون نهاية للتدريب نهاية، لا ملامح الهندسة، ومطابقة ميزة بين الصورة والبيئة إعادة الإعمار 3D.

الصفحة الرئيسية المشروع:

المصدر المفتوح:

https://github.com/allenai/ai2thor

مقالات ذات صلة:

التخطيط البصري الدلالية باستخدام التمثيل خليفة العميقة

Yuke تشو، دانيال غوردون، اريك Kolve، ديتر فوكس، لي في في، ابهيناف غوبتا، روزبه متقي، علي فرهادي ICCV 2017

https://arxiv.org/pdf/1705.08080.pdf

الملاحة البصرية يحركها هدف في المشاهد الداخلية باستخدام تعزيز التعلم العميق

Yuke تشو، روزبه متقي، اريك Kolve، جوزيف ليم، ابهيناف غوبتا، في في لي، وعلي فرهادي ICRA 2017

- انتهى -

التوظيف الصادق

المكدسة تقوم بتجنيد محرر / مراسل، ومقرها في تشونغ قوان تسون في بكين. نتوقع الموهوبين والطلاب المتحمسين للانضمام إلينا! مزيد من التفاصيل، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "تجنيد" كلمة.

و qubit QbitAI عناوين على التوقيع

' " تتبع تقنيات AI دينامية جديدة والمنتجات

جدي من أجل البقاء في تاريخ معظم الوضع الصعب القادمة! شاشة كاملة من الثلج، والعدو خلفكم لا يمكن أن نرى!

سعر 109800 يوان من 5E يي Ruize 450 مدرجة رسميا الأقصى 500km التحمل

في البحر: الدفاع إلى تحسين، وميزة يان جونلينغ! يان جونلينغ عبارة المعرض الذكاء العاطفي عالية

اللاعبين الصينيين أكثر قوة؟ كان فخر لا النسخة الصينية من العمل اللعبة، هرعت الى لا الآن الانتهاء!

فى تشونغتشينغ كاي روي تشنغ CC عندما آمنة سيارة "ملثمين الأبطال"

إيطاليا الحارس الخبرة الجماعية في الخارج، "البرد مقاعد البدلاء"

الأخطاء كيم مين زي في البكاء والصين وكوريا الجنوبية بعد المباراة أن أشكر مجال المشجعين، شميت لله الإنقاذ سخاء

تتركز MPV البرد سوق أوشان COSMOS أو الإنقاذ من السوق الراقية؟

انضم البالغ من العمر 19 عاما بايرن ميونيخ الالماني المهنية في اليابان المهاجم الموهوب الفشل الثانوي

تشين شنغ الإفلات من العقاب؟ شمال الأخضر: ولم يشارك في سماع اسم آخر لكرة القدم الدوري الممتاز: يعتبر معيار "متسرع"

X المسيل للدموع أكبر حدث سنوي حلقة DOTA! RNG وLGD عشيرة الاستيلاء على الناس، لكنها ثمانية سيد!

الهيكل مرة أخرى! الدب + الوقف ون جيون اليابانية يمكن أن تنجح؟ كاواساكي اول مرة في هونج كونج أفرجت VS