لي Feifei: لماذا من المهم جدا أن رؤية الكمبيوتر الروبوت؟ | IROS 2017

شبكة لى فنغ حسب: سبتمبر 26، مؤتمر أكاديمي كبير في مجال الروبوتات IROS 2017 في اليوم الثاني. الصباح، والصينية خبير رؤية الكمبيوتر الشهير، ستانفورد أستاذ مشارك لى Feifei، والتقارير الخاصة للخبراء والعلماء المشاركين جعل كل ما يصل إلى ساعة واحدة في مركز المؤتمرات فانكوفر.

وفقا لتصنيف Guide2Research، يأتي في المرتبة الرابعة IROS في مجال المؤتمر رؤية الكمبيوتر، وكانت أعلى ثلاث CVPR، ICCV، ECCV. الكمبيوتر الرؤية تلعب دورا هاما جدا في تاريخ الروبوتات، ويرتبط مع "تصور" هو أيضا جزء مهم من السنة التقويمية IROS الجمعية العامة، ولكن أيضا في مجال البحوث الروبوتات، المزيد والمزيد من العلماء منذ ذلك الحين الكمبيوتر المعترف بها أهمية الرؤية لالروبوتات الصناعة برمتها. لى شبكة فنغ ذلك، سيتم أيضا الدخول في حقبة جديدة، وهي الجمعية العامة لهذا العام ودعا في السنوات الأخيرة مع اختراق التعلم في عمق مجال الرؤية الكمبيوتر، والتطبيقات رؤية الكمبيوتر في مجال الروبوتات البروفيسور لى Feifei IROS أن تفعل تقرير مؤتمر IROS الأسباب.

لي Feifei فتح كما قال، وهذا هو أول عودتها للمشاركة في IROS، لكنها تأمل في جعل الروبوتات والأصدقاء على التواصل، لتقاسم ما يعنيه أن الرؤية كمبيوتر الروبوت في عينيها، وعرضت بعد ImageNet، وستانفورد للأبحاث في وفرق بحثية أخرى تعمل على مشاريع، وهذه المشاريع لمستقبل التصور الروبوتية وفهم بيئتنا أهمية خاصة.

وقال لى Feifei هلم جرا تويتر "آمل أن تتمكن من إقناع أحد الأصدقاء للقيام الروبوتات، (الكمبيوتر) الرؤية هو تطبيق قاتل الروبوت." وفي كلمة ألقاها في اليوم السابق.

نظرا لضيق المكان، وينقسم التقرير إلى قسمين. يتبع الجزء العلوي. كانت لى فنغ شبكة يسوا على استعداد لتغيير المعالم.

لي Feifei في IROS 2017

لي Feifei: سوف أشارك مؤخرا بعمل البصري معك، والدردشة مع الخلفية التاريخية للمجال الرؤية الحاسوبية ذكي الرؤية. هذه الدراسات لا تزال جارية، ونرحب في النقاش الحر.

رؤية كيف مهمة؟

صديق اقترح I، خطاب الروبوت في الجمعية العامة على الأقل لوضع صورة لالروبوت. التقطت المفضلة:

والسؤال هو: لماذا هذه قطعة من رسومات الأطفال، والروبوتات لها عيون؟

أعتقد أنه حان التطور والتطور. إذا كان من الحكمة أو ذكاء جسم الحيوان، والعين / الرؤية / الرؤية هي أكثر الأشياء الأساسية (الأطفال يعتقدون شعوريا نحو ذلك). دعونا نعود 540 مليون سنة من العصر الكمبري - قبل وقوع الانفجار الكمبري، والأنواع على الأرض ليس كثيرا حقا، كل يعيش في الماء، والوصول السلبي في الغذاء. ولكن في قبل نحو 5.4 مليون سنة، حدث شيء غريب جدا (كما هو موضح أدناه): فترة قصيرة من الزمن 10 ملايين سنة، ظهرت مجموعة متنوعة من الأنواع الجديدة، وهذا هو "الكمبري اندلاع ".

ما هو السبب وراء ذلك؟

في الآونة الأخيرة، وقد وضع العلماء الاستراليين عليها نظرية مؤثرة جدا، وذلك بفضل الانفجار الكمبري - الرؤية. في العصر الكمبري، تطورت أقرب ثلاثية الفصوص وأنظمة الرؤية بدائية للغاية، حيث أن الكاميرا ديكو الأكثر بدائية، لالتقاط قليلا من الضوء. ولكن هذا كل شيء تغير: بعد "رؤية" بدأت الحيوانات لاتخاذ فريسة. بين الصياد والفريسة بدأ مئات مستمرة الملايين من السنين من "تتبع - اخفاء" لعبة، والسلوك أكثر تعقيدا. من هذه العقدة في وقت لاحق، تطورت تقريبا جميع الحيوانات على الأرض شكلا من أشكال نظام الرؤية. واليوم، بعد 540 مليون سنة، وأصبح للعين البشرية من معظم أجهزة الاستشعار مهمة، أكثر من يشاركون نصف الدماغ في وظيفة البصرية.

في عملية تطور الحياة على الأرض إلى مستوى أعلى من الذكاء، والرؤية هي حقا قوة دافعة هامة للغاية.

هذا هو جهاز الإدراك الحسي مدهش جدا، هو موضوع أريد أن أتحدث عنه اليوم. هذا هو سعينا للآلة - آلة لديها مثل هذه المعلومات الاستخباراتية البصري الإنسان.

من إنسان لرؤية الجهاز

الآن، وأنا أقول قصة قصيرة، فهو يقع في حوالي النظام البصري البشري هو مكان رائع.

هوليوود في 1960s، ولادة معلما جدا الفيلم التاريخي "والمرتهن" (زاوية الرأس إلى الناجين من المحرقة في الحرب العالمية الثانية، وأداء الأفلام الأميركية). مع هذا الفيلم ولادة جديدة مقاطع الفيديو إدراج للتكنولوجيا الفيلم، قام به مدير سيدني لوميت تجربة مثيرة جدا للاهتمام - إدراج الصور في حاجة لإظهار كم من الوقت يستغرق الجمهور للاستيلاء على محتوياته.

ويتابع لتقصير التشغيل في الوقت الإطار، من ثانية عشرة لبضع ثوان، وأخيرا إلى ثلث من الثانية - وجد أن تكون كافية طويلة جيدة للغاية لإلقاء نظرة على الجمهور وفهم كامل الصورة.

تعترف مستوحاة قام علماء النفس وعلماء من تجارب أخرى: في كل مرة عرض الإطار هو فقط 100 ميكروثانية للمشاركين تلعب عدة إطارات متتالية. من بينها، لا يوجد سوى صورة لشخص، وطلب من المشاركين لتحديد هذا الشخص.

ونحن قادرون على معرفة الحقيقة. هذا أمر مثير للإعجاب للغاية، على بعد 100 ميكروثانية، وكان لدينا النظام البصري يمكن الكشف الناس لم يسبق له مثيل من قبل.

في عام 1996، في الطب العصبي النفسي سيمون J. ثورب في "الطبيعة" نشرت الدراسة، لاحظ تصنيف السرعة لصورة معقدة عن طريق موجات الدماغ الدماغ البشري. ووجد أن 150 فقط ميكروثانية، والدماغ سوف ترسل إشارة إلى التمييز بين، على الشاشة لقاض ما إذا كان الكائن حيوان.

وفي وقت لاحق، كتب البشري البصرية هارفارد عالم جيريمي وولف في ورقة، على الرغم من أنه من الصعب قياس شخص في الواقع نرى ما صورة إلى أي مدى الفهم، ولكن الحدس يخبرنا أن الصورة يجب أن يكون الهدف من ملاحظتنا كائن واحد.

ويبدو واضحا، ولكنه يذكرنا أن تحديد الأجسام هو واحد من أكثر جزء أساسي من رؤية، والرؤية الكمبيوتر أيضا في هذا المجال من البحث لسنوات عديدة. من 2010-2017، وقد تم تحديد الهدف ImageNet التحدي (الاعتراف الكائن) نسبة الخطأ في الانخفاض. بحلول عام 2015، وصلت نسبة الخطأ خفض مستوى حتى من البشر.

لن أقول أن الهدف هو تحديد تم التغلب المناطق. العديد من القضايا الرئيسية التي يتعين دراستها، وكثير منها ذات الصلة، والروبوتات بشكل وثيق. مثل كفاف 3D تقدر أن تفهم الهدف الجزئي، وفهم المواد، والملمس، وما شابه ذلك. البحث في هذه المناطق نشطة جدا، وأنا لا أشعر أن هذه المنظمات من المهام تصنيف ImageNet التحدي أكثر إثارة للاهتمام.

بعد التعرف على الأشياء عصر رؤية الكمبيوتر

وبعد ذلك، أود أن أشاطركم بعض الجديدة، والعمل الاستكشافي، بدلا من البحوث الأساسية هذه القوائم لتحديد الكائنات في المخزون (قائمة جرد من الكائنات). دعونا نعود أوراق جيريمي وولف، وقال انه لا يزال :. "العلاقة بين الكائنات، يجب أن تكون مكتوبة في جوهر"

لنفترض أن هناك صورتين: علبة من الحليب في كوب، علبة من الحليب لأسكب (مرة أخرى في الهواء)، وقفت بجانب الزجاج. وهما ليسا نفس الشيء. صورتين من وجوه هي نفسها، ولكن مختلفة العلاقات بينهما.

قائمة الصور الأجسام وحدها لا يمكن تسليم محتوياته بالكامل. هنا مثال آخر:

والألبكة هما الصور، ولكن ما حدث هو مختلف تماما. وبطبيعة الحال، في الماضي في هذا المجال، وهناك العديد من الدراسات، بما في ذلك العلاقات المكانية، والعلاقة بين السلوك والعلاقات احتمال وهلم جرا، ليست واحدة من التفصيل. هذه هي العمل الأساسي لتطوير اختبار في بيئة مغلقة صغيرة، ولكن أيضا لاستكشاف أكثر من اثني عشر، عشرين العلاقة. ونحن نريد أن دراسة العلاقة البصرية في نطاق أوسع.

ونحن نعمل جنبا إلى جنب مع التعبير البصري والنفوذ النموذج القائم، عن طريق دمج مساحة الصورة، واللغة الطبيعية على العلاقة بين الكائنات وصفها في وسيلة ذكية للجمع بين يتجنب العلاقات بين الأشياء والكائنات جلب تتضاعف الأعباء الحسابية .

الرقم المبين هو جودة بصرية النتائج. وإزاء هذه الصورة، يمكن أن أنظمتنا تحديد العلاقات المكانية، مقارنة العلاقات، العلاقات المكانية غير المتماثلة، والأفعال العلاقات، وحروف الجر السلوك والعلاقات.

حتى أكثر إثارة للاهتمام هو أن لدينا خوارزمية يمكن أن يحقق (صفر التعلم العينة) وجوه العلائقية الاعتراف صفر النار. على سبيل المثال، الشخص الذي يجلس على كرسي مع صنبور النار في الصورة بجانب خوارزمية التدريب. وتأتي بعد ذلك مع صورة أخرى، وهو رجل يجلس على صنبور النار. على الرغم من أن الخوارزمية لم يسبق له مثيل هذه الصورة، ولكن يمكن التعبير عن هذا هو "رجل يجلس على صنبور النار."

وبالمثل، يمكن للخوارزمية التعرف على "الحصان يرتدي قبعة"، على الرغم من أن مجموعة التدريب، فقط "رجل على ظهور الخيل" و "يرتدي قبعة رجل،" الصورة. بالطبع، هذا الأسلوب هو أبعد ما يكون عن الكمال. على سبيل المثال، عندما كائنين مماثلة (على سبيل المثال، وهما) جزئيا التداخل، فمن السهل الأخطاء تقرير الخوارزمية. الرسم البياني التالي، اعتبر خطأ الحسابي ليكون الرجل على اليسار في رمي UFO:

وهذا مجال التنمية السريعة للرؤية الكمبيوتر أدناه. بعد ECCV 2016 ورقة فريقنا، وهناك الكثير من الأوراق ذات الصلة المنشورة من هذا العام، وبعضها لديها حتى قريبة إلى نتائج نموذجنا. أنا مسرور جدا لرؤية هذا الازدهار المنطقة.

(يتبع التي نشرت IROS Feifei المعلم النصف العلوي، وأكثر حول البصرية الجينوم الإدراجات لا تنزعج)

لو وى بينغ: Redmi لاحظ خط النسخة الدولة 7 برو والعديد من أكثر المفاجآت! ماذا تتوقع؟

مؤسسة التخزين: ATA، SATA، SCSI، SAS، FC

"على قذيفة كسر" الإشراف على إنشاء "لعبة سوبر مجنون"، وأعلن أربعة عمل جديد

أعجوبة "الكابتن المعجزة" الانفجار الاول الصور الاستوديو، وبري لارسون الكابتن المعجزة جيرسي النمذجة لاول مرة

ما الشعور هو ان هناك بداية بدون مفتاح؟

للثلج جنوب شرق منطقة عالي السرعة الثقيلة في جميع المجالات أكثر من تنفيذ عالية السرعة لمراقبة حركة المرور في الاتجاهين

سيارات خفيفة الوزن هو في الواقع ذريعة لقطع زوايا لا؟

"صوت نداء مجنون،" Ximeng ياو التحدي "Shuangmianjiaowa": من نموذج من الجهات الفاعلة عبر الحدود، وتحاول أن تفعل الحدود الخاصة بها

اقول لكم بالتأكيد لا أعرف سر: الروبوت يمكن القيام بالفعل على خشبة المسرح السحر! | IROS 2017

بسعر 300000 يوان تنغ المحتملين 400 شراء قيمتها؟

"رحلة إلى ابنة" ملك أنقى المرضى الحب راهب المخدرات، واعتراف ومنغ الفنية على الانترنت

MWC 2019: ممن لهم جهود متواصلة لإظهار R & D قوية ونتطلع تخطيط التكنولوجيا