بيركلي البحث الجديد: الروبوتات لحركة الإنسان تقليد تعلم، ولكن أيضا إعطاء أولوية قصوى

الصيف B من الجزء السفلي من راحة غير معبد،

إنتاج و qubit | عدد ملفه QbitAI

تجلس على كرسي، والتقطت بطة عود والأعلاف المغلي الحساء الأحمر، والانتظار لمدة 8 ثواني، مقطع من ...... العمل لملء الفجوة دفعة واحدة. المهارات البشرية لسيده تناول وعاء الساخنة، لا يمكن فصلها عن قصد أو عن غير قصد تقليد.

ومع ذلك، تناول وعاء ساخن للروبوتات، وأكثر صعوبة بكثير. تريد أن تتعلم هذه السلسلة من الإجراءات، غالبا ما تحتاج إلى تحديد الأهداف والمكافآت وظائف معقدة بالنسبة لهم.

والخبر السار هو أن التدريس البحثية لهم لتعلم عن طريق التقليد قد تقدم، والروبوتات أكثر ذكاء وأكثر مرونة.

جامعة كاليفورنيا، بيركلي، وقد اقترح العلماء في الأوراق الأخيرة التكيف عنصر التعلم (المجال-التكيف ميتا التعلم) دعونا الروبوت أثناء مشاهدة الفيديو لسلوك الإنسان تقليد، يمكن أن تتكيف مع تغير المجال. وبعبارة أخرى، حتى لو كان منظور إنساني للروبوت، والبيئة، وسلامتهم البدنية وأشرطة الفيديو تختلف في جوهرها، فإنه أيضا يمكن مشاهدة الفيديو للتعرف بسرعة السلوك البشري فيها.

على سبيل المثال، والفيديو 1 أعلاه دقيقة 07 ثانية من الكائن اختبار يوضع أمام الروبوت لوحة وضعت مع مختلف الفيديو التوضيحي الإنسان. ولكن في الزاوية اليمنى السفلى مع أحدث أساليب تدريب الروبوت، أو بسرعة العثور على الموضع الصحيح.

هذا السلوك الدراسة أظهرت وبطبيعة الحال، لم يأكل وعاء ساخن هو أقل تعقيدا، وقال فقط بالإضافة إلى كائنات مكان في حاوية، وهي الهيئة الرئيسية ويشمل أيضا دفعة، والتقاط الأشياء وثم وضعت في مكان ما وهلم جرا.

مكان الأجسام

دفع أشياء

التقاط كائن وفي مكان ما ثم توضع

ومع ذلك، مع الفيديو، يمكنك تعلم، ولكن أيضا إعطاء أولوية قصوى؟ ويمكن أيضا أن تكون قوية جدا.

ونتيجة لسنوات التعليم عشرة البشرية، وتعلم الكثير من المعرفة، ويعتقد المكدسة يجب أن تكون قادرا على تخمين: لديك هذه القدرة، ويجب أن يكون أساس متين من احتياطيات المعرفة الكافية.

دراسة بيركلي هو الحال. قبل معظم الفترة الحرجة من الفيديو، والعلماء لأول مرة تستخدم الكثير من التدريب الفيديو خوارزمية مختلف المهام للمساعدة في بناء روبوت " معرفة مسبقة "وتسمى هذه العملية" الفوقية التعلم. "في هذا الوقت المهمة المستخدمة في الفيديو هناك بشرا، هناك الروبوتات.

مع بعد معرفة مسبقة، جنبا إلى جنب مع الفيديو مظاهرة البشري مهمة، الروبوت سوف تكون قادرة على تعلم لإنجاز هذه المهمة.

من أجل إثبات فعالية هذا النهج، فإنها تستخدم اثنين من سبع درجات من الحرية (دائرة المالية) الذراع الآلية للقيام بهذه التجربة، هو واحد PR2، والآخر هو سوير.

وقد أظهرت التجارب أن استخدام فقدان مؤقت (خسارة الزمنية) من المجال-التكيف ميتا التعلم لرؤية الفيديو من الاختبار تقليد جميع أنواع السلوك حققت أعلى معدلات النجاح في ذراع الروبوت PR2.

سوير استخدام ذراع روبوتية، فمن لتجربة التدريس حركي الروبوت لتسجيل العرض التقديمي.

وبالرغم من أن هذه الدراسة للسماح للروبوت للبشر تقليد، ولكن قال عدد من العلماء في ورقة، لا يكرس هذا الأسلوب لمفهوم العمل الإنساني يمكن أن تستخدم أيضا للحيوانات تقليد، أو السماح روبوت لمحاكاة كيان في العالم الحقيقي الظاهري الروبوت.

وأخيرا، والفوائد (مخصصة لصنع الروبوتات تساعدك شابو شابو) طالبا وطالبة ترى الصحيفة:

تقليد شوت واحد من مراقبة البشر عبر المجال-التكيف ميتا التعلم

تيانخه يو وتشيلسي فين، آني شيه، سوديب Dasari، TIANHAO تشانغ، بيتر Abbeel، سيرغي ليفين

https://arxiv.org/abs/1802.01557

- انتهى -

التوظيف الصادق

المكدسة تقوم بتجنيد محرر / مراسل، ومقرها في تشونغ قوان تسون في بكين. نتوقع الموهوبين والطلاب المتحمسين للانضمام إلينا! مزيد من التفاصيل، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "تجنيد" كلمة.

و qubit QbitAI عناوين على التوقيع

' " تتبع تقنيات AI دينامية جديدة والمنتجات

قد يكون جيانغواي تنقية إنتاج خط والعامة S4 أكثر من مجرد نوعية اشكنازي

اللاعبين دوري أبطال آسيا هذا العام وهذا الرقم هو على وشك أن تختفي

أغلقت تسوى كانغ التدريب، وفقا لثلاثة المساعدات الخارجية حصة تجفيف معا! حزب poster'm برئاسة انتصارات السيف

الدوري S8: انقر نقرا C أرسلت فريقا للنجاح؟ فاز EDG في المباراة الافتتاحية، المدير الجديد آخر من جذع!

Hengda إذا ديربي تفقد، اسمحوا تشين شنغ كبش فداء؟ كان الهدف 5 درجات انفجرت، لاو مقعد وجه الأسف

ضد اللاعبين البرد الحالية يجب التسرع في التعدين؟ ألعاب جانبية في حين كسب المال، Sicong خائف من العودة إلى!

سيارات الدفع الرباعي جديد يدعى تشانغ CS75 PLUS

كرة القدم الهولندية التين مشاركة ورقة -Ajax

الحزب السابق مدرب الاستبداد! لونينغ غير راض مع السحب، وفريق لا أحد على الجلوس ضيق في معظم الأحوال، لاتخاذ عاء الأرز الحديد

أنا أيضا Emaki ترقية الاختصار، لم صديقا مقربا من وادي لا نتوقع الكثير جدا! رابع ترتيب مهارات الاعتماد عليها التعلم

أطلقت شركة شيري الطلقة الأولى من السيارات في الصين مارس راء قوة صاعدة قوية

، وقالت جوجل لا داعي للذعر AutoML لا يقصد به أن يحل محل المهندسين، AI لا تزال الفجوة موهبة كبيرة