تعلم الكائن البصرية AI المنطق، "ملحق الدماغ" لا يرى | لى لى جيا Feifei وغيرها من الأوراق CVPR

لى لين من الجزء السفلي من راحة غير معبد،

إنتاج و qubit | عدد ملفه QbitAI

البشر لديهم قدرة قوية جدا: ملحق الدماغ.

هذه الصورة الفوتوغرافية عيون الانسان، وقطعة صغيرة من لطخة البني الزاوية اليسرى السفلى هي الحصان الحقيقي - وهذا موقف ومشاهد، وبطبيعة الحال، هو ركوب ذلك!

لكن بالنسبة لمعظم من الخوارزمية، وهناك وجهات نظر شخصين، شخصين، من يدري ما ترك الجزء السفلي من هذه المجموعة هو الشيء الذي يعرف ما اثنين منهم في الأراضي الجافة ~ ~ ~ عليه

ورقة CVPR 2018 الطازج تكرارية البصرية المنطق وراء الإلتواءات ، وهي تحاول أن الإنسان "ملحق الدماغ" لقدرة الخوارزمية.

سوف الدماغ ملء خوارزمية

في دراسة قامت بها جامعة كارنيجي ميلون (CMU) والمؤلفين المشاركين جوجل لديها الفيسبوك الباحث تشن XINLEI (تم الانتهاء أطروحة الدكتوراه قبل تخرجه)، لي جيا جوجل ولي Feifei، وChenxin لي معلمه ابهيناف غوبتا.

ودرس الباحثون قدرة "ملحق الدماغ"، وفقا لأوراق رسمية حجة الأكاديمية أكثر صرامة، بل هو مساحة من التفكير البصري والدلالي. مع هذه القدرة، سيقوم الكمبيوتر يكون قادرا على تحديد أكثر دقة الكائنات في الصورة.

على سبيل المثال، واجه مع مثل هذا السيناريو، ليس هناك غرفة المنطق الدلالي خوارزمية يمكن الاعتماد فقط على شكل كفاف من السيارة لتحديد ذلك هي سيارة أو حافلة، في النوافذ المذكورة أعلاه، والاعتراف فقط أولئك الذين لا تحجب.

مع الاستدلال المكاني، وثلاث نوافذ على التوالي تم حجب الكائنات التي تعيش محليا، سيتم اعتبار نافذة، مع المنطق الدلالي، Tongshen أعلاه أيضا مضيئة بطاقة صفراء من الحافلة، سيتم التعرف على أنها حافلة مدرسية ؛ المنطق المكاني والدلالي معا، يمكن للخوارزمية التعرف على نوافذ السيارات التي الظل غامضة، في الواقع، هو شخصي.

دعونا ننظر مزيد من الأمثلة محددة:

على سبيل المثال، على الخريطة، تميز الأزرق الداكن "الماوس" ليس من الشبكة العصبية العادية، وهذا النهج الجديد يجعل الدماغ يمكن التعرف بها. ومن غامض جدا في الشكل، والقرار هو منخفض جدا، ويمكن الاستدلال على ذلك وفقا لالكائنات المحيطة بها.

الغسالة وفقا لFIG.، ويمكن الاستدلال العميق المنظفات الأزرق ملحوظ الأخدود.

أيضا صورة، فإن الدماغ ملء الخوارزميات التي التعرف على الأشياء، بل وأكثر من الشبكة العصبية المتوسط. وهذا يعني أنه هو قدرة كل كتلة الجسم وتحديد أفضل من الصورة.

استخدمت الكتاب جدا "للخروج من مربع والكائن الاعتراف" مهمة تصنيف المنطقة من الورق، إلى الدماغ جعل هذه الخوارزمية ركض فرعية هي:

مقارنة مع الشبكة العصبية التلافيف التقليدية، وبيانات نموذج تعيين على ADE، كل مجموعة المتوسط لتعزيز دقة 8.4، في حين أن زيادة شبكة يمكن أن تعزز فقط على عمق حوالي 1. على مجموعة البيانات COCO، وهذا النموذج يمكن تعزيز دقة 3.7.

كيف؟

فهي عادية التفاف الشبكة العصبية، جنبا إلى جنب مع إطار التفكير البصري الذي يتكون من وحدتين أساسية هي: وحدة نمطية غير المحلية، ونعرف قبل استخدام الذاكرة المكانية للتخزين، والالتواء العصبي الاستدلال الشبكة؛ واحد هو عالمي وحدة، بناء على FIG المنطق، والمنطقة تلك الفئة كما عقد في الرسم البياني، من خلال المنطق لتمرير المعلومات فيما بينها.

في التفاصيل، وحدة عالمية من ثلاثة عناصر، ومعرفة فئة التعيين إلى عقدة إلى عقدة في صورة المنطقة، إلى العلاقة المكانية بين المنطقة الحدودية منطقة التين، وتخصيص منطقة للطبقة تعيين FIG.

في النهاية، كل وحدات كل التنبؤ والاهتمام آليات التكرار جنبا إلى جنب للحصول على النتائج المتوقعة النهائية.

ويبرز فشل

وبطبيعة الحال، عندما يكون هناك فشل.

على سبيل المثال، منضدة قد وضعت جهاز التحكم عن بعد ذلك، الخوارزمية والتفاف الشبكة العصبية العامة والحصول على أقل من ذلك.

تعلم الله (الذي)

أربعة مؤلفي هذه الورقة في الثانوي والعالي كما كنت مألوفة جدا مع اثنين من آلهة لي جيا لى Feifei لك، الآن جوجل الحوسبة السحابية القطاع. اثنين من التاريخ والإنجازات، وربما لا يحتاج إلى و qubit أقول مرة أخرى.

أربعة لابهيناف غوبتا هو أستاذ مشارك في علوم الحاسوب في جامعة كارنيجي ميلون، وذلك أساسا في دراسة كيفية تميز بين العالم المرئي، واللغة البصرية والسلوك وكيفية الاتصال بين الكائن وغيرها من القضايا.

واحد لChenxin لى، هي واحدة من العديد من الطلاب من المحتمل أن يكون عبادة جدا من الله مدرسة نموذجية.

الأخ الصغير في فبراير من هذا العام في جامعة كارنيجي ميلون (CMU) حصل على درجة الدكتوراه، وهو الآن باحث الفيسبوك معهد AI. كطالب جامعي في جامعة تشجيانغ، وقام بنشر أكثر من الجزء العلوي أوراق AAAI، CVPR، CIKM الانتظار.

أثناء الدراسة دكتوراه، كان يعمل في مايكروسوفت للبحوث، مجموعة VisCAM جوجل وجوجل الغيمة AI فريق متدرب.

اطروحة دكتوراه البصرية التعلم للمعرفة، درست أهمية الصور الخلفية في رؤية الكمبيوتر صورة نظام عملية التفاهم. هذه الورقة تناقش منهجية كيف الآلي الكمبيوتر، وتعلم قابلة المعرفة البصرية الصريحة والضمنية، وكذلك معرفة كيفية استخدام المنطق البصري.

هنا، يمكنك أن تتعلم بشكل منهجي عن عبادة الله: HTTP: //xinleic.xyz/

الشيء الأكثر أهمية هو

عناوين أطروحة، بطبيعة الحال، من الضروري ~ الشبكي: //www.arxiv-vanity.com/papers/1803.11189/

والأخ الأصغر الدكتوراه عنوان الرسالة: HTTP: //xinleic.xyz/papers/thesis.pdf

- انتهى -

التوظيف الصادق

المكدسة تقوم بتجنيد محرر / مراسل، ومقرها في تشونغ قوان تسون في بكين. نتوقع الموهوبين والطلاب المتحمسين للانضمام إلينا! مزيد من التفاصيل، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "تجنيد" كلمة.

و qubit QbitAI عناوين على التوقيع

' " تتبع تقنيات AI دينامية جديدة والمنتجات

80000 لشراء "مرسيدس" على الوطن بيل وجها، ويخشى أن يجتمع الناس الذين يفهمون السيارة!

وبما أن الشباب الأوروبي كان الدولي الهدف الوطني التجنس لكرة القدم، والبطالة التي مزقتها الآن

8 نانبينغ 14 في عجلة دورة 1-3، شو شين فان زيندونغ تفقد، كاي فوز كفافي!

سوف المطورين TensorFlow القمة: دعم سويفت، دعم أفضل للجافا سكريبت

التاريخ من أكثر فوضوية لعبة نيتياس! دخل اللاعبون المباراة، كان لقتل الله تثبيت مستوى كامل NPC خدمة كاملة!

هذه السيارة تبدو الدجاج ضعيفة، وحصلت في السيارة ولكن فوجئت والداخلية قيمة الصف 150000!

التصنيف العالمي فبراير: "ما Dingning" زعيم، زانج جيك ليو شيون مؤقتا "تختفي"!

جعل أعلنت طويل 1.5 مليار يورو استثمارات AI، DeepMind سيتم قريبا تقبيل باريس

لعبة الصين أنجح! اعتمد نيتياس ثروة، وأنتقل الآن في الواقع النار 15 عاما إزالة

70000 أربع سيارات المجردة معلقة وحدها في وقت سابق من GS4، وقوانغتشو للسيارات الدوس قلقا، لماذا لا أحد يشتري؟

"فو"، ولكن ثلاثة أجيال، مالديني III C الفريق هو المأوى نادرة،

ليو شيون، راو جينغ ون مئة في المئة راحة البال ووهان النادي بطل القصة!