AAAI 2020 | المقترحة شانغ تقنية إطارا جديدا للكشف عن وجوه من ضعف الرقابة

الكاتب | شانغ سلالة تقنية تحرير | جيا وى

توضح هذه المقالة الأوراق في العلوم والتكنولوجيا شانغ AAAI 2020 على "كائن مثيل التعدين للكشف عن وجوه WeaklySupervised".

واقترحوا نهاية إلى كائن في هذه الحالة حفر العمل في الكشف عن وجوه من ضعف الإطار الإشراف، على أساس اعتماد وجهة نظر خارجية الخرائط والمعلومات آلية نشر العملية التعليمية التكرارية الشبكة، كل صورة في محاولات لإجراء الحفريات جميع أمثلة من الكائنات. وبالإضافة إلى ذلك، أيضا كائن يدخل الحالات ظيفة فقدان الوزن تعديل (خسارة reweighted)، حتى أن الشبكة يمكن أن تتعلم أكثر في نفس الوقت لاستكمال مثيل كائن، بحيث ضعيفة الهدف الرقابة طريقة الكشف للحصول على إطار الكشف عن أكثر دقة.

عنوان ورقة: الشبكي: //arxiv.org/pdf/2002.01087.pdf

مجال الكشف عن الهدف على المدى الطويل من رؤية الكمبيوتر اهتمام المشكلة، الطيار الآلي، فهم الصورة، والمراقبة بالفيديو وغيرها من المجالات لديها مجموعة واسعة من التطبيقات. ومع ذلك، استنادا إلى تقنيات التعلم المحيط مربع عمق الكائن في التدريب الكشف عن الهدف الشبكة يتطلب الكثير من العلامات دقيق، والعمل هذه التسميات تعيق تطبيق سريع وعلى نطاق واسع لهذه التكنولوجيا في المنتج الفعلي، ولكن أيضا الكثير من علامات اليدوية تستغرق وقتا طويلا جدا تحسين تكلفة المنتج.

للتغلب على هذا القيد، ومستوى الصور فقط ملحوظ (كل من الفئة ملحوظة يحتوي فقط على صورة الكائن) ضعف الرقابة تكنولوجيا الكشف عن الهدف في السنوات الأخيرة على نطاق واسع اهتمام والبحث له أهمية كبيرة.

ويستند القائمة طريقة الكشف ضعف الهدف الرقابة على معظم متعددة سبيل المثال تعلم الإطار، لكل فئة الكائن وأساليب متعددة مثيل إطار التعلم القائم تميل للتعلم في هذه الصورة الطبقة يتميز معظم وجوه بارزة، ولكل صورة تحديد كائن ليسجل أكبر تدريب مربع، يتم تجاهل مثيل كائن آخر حتى يسقط بسهولة في شبكة التعلم الأمثل المحلية، مما يؤثر على أداء ضعف الرقابة والكشف عن الهدف.

هذا ويعرض ورقة مثال الصنبور نهاية الكائن (كائن مثيل التعدين، OIM) ضعيف إشراف إطار الكشف عن وجوه. إدخال إطار بناء على النمط المكاني (المكانية الرسم البياني) والمظهر ( التطبيق earance الرسم البياني) آلية نشر المعلومات، وعملية التعلم متكررة في الشبكة، كل من مثيلات الكائن محاولة للاستفادة من كل صورة. ذلك أن عملية التعلم في طريقة التعلم متعدد المثال القائم على الشبكة، مثيلات الكائن ميزة كبيرة لا يمكن الكشف عن واضاف التدريب، وبالتالي تعزيز التعبير ومتانة خصائص.

وبالإضافة إلى ذلك، قدم فريق الفيديو شانغ سلالة تقنية أيضا مثيلات الكائن البيانات وظيفة فقدان الوزن تعديل الكبيرة (فقدان reweighted)، حتى أن الشبكة يمكن أن تتعلم أكثر في نفس الوقت لاستكمال مثيل كائن، بحيث ضعف أساليب الرقابة والكشف للحصول على كشف الأهداف أكثر دقة مربع. أمثلة للتعدين الكائن مقرها (في OIM) ضعف الكائن إشراف هيكل الإطار كشف كما هو مبين أدناه:

أمثلة الكائنات التعدين (وOIM) ضعف الرقابة إطار الكشف عن وجوه.

تم الكشف عن الإطار الرئيسي من متعدد المثال (كشف مثيل متعددة)، والحفر المثال الوجهة (كائن مثيل التعدين) جزأين. في عملية تكرارية تدريب الشبكة، وذلك باستخدام الورقة الأولى الكشف عن الطبقات المتعددة مثيل كل منطقة التنبؤ مرشح، والإخراج تقوم بعد ذلك على سمة من سمات المنطقة مرشح الكشف، عن طريق إنشاء النمط المكاني ومظهر كافة مثيلات الكائن التعدين الصورة قدر الإمكان، و أنها ستنضم إلى التدريب. أمثلة عملية التعدين حيث الكائن كما هو مبين أدناه:

ومن أمثلة نموذجية كائن عملية التعدين

التكرار شبكة التدريب، في رقم واحد، وتعلم أولا / كشف مثيل كائن من أكثر فطنة، وتداخل العلاقة علاقة الموضعية على أساس هذا المثال، فإن كلا من الإطار ومرشح آخر هذا المثال، إنشاء مخطط مساحة (المكانية الرسم البياني )، كما هو مبين في الفقرة (أ). وبناء على هذا المثال، بعد ذلك، عن طريق حساب التشابه بينه وبين ظهور الإطار مرشح آخر، فإن الصورة قد حفر مثيلات الكائن تنتمي إلى نفس الفئة، وإنشاء جهة النظر الخارجية ( التطبيق earance الرسم البياني)، لكل مثيل من الصنبور جديد في نفس المكان لإقامة FIG كما (ب) و (ج). في هذه الخطوة التدريب متكررة حتى كل ما يمكن لانتشال كائن صورة وأضيف التدريب (د) كما هو مبين في المثال.

المصنف وبالإضافة إلى ذلك، لأن الشبكة متكررة عملية التعلم، وخاصة بالنسبة مثيل كائن غير جامدة، والمستفادة CNN استنادا عموما هو الأكثر المميزين محلية بدلا من الجسم كله من مثيل كائن ،، ول في هذه الأطروحة، وظيفة الأوزان مثيل كائن تعديل خسارة (فقدان reweighted)، من أجل تعلم أكثر دقة إطار الكشف عن وجوه. الفريق المقترح لإطار مرشح مختلفة يجب تعيين أوزان مختلفة للثقة تصنيف المرشحين ارتفاع درجة إطار تعيين أوزان أقل، في حين لحقوق التوزيع العالي المرشحين إطار أعلى نقطة في جميع أنحاء الوزن إطار المرشح، وبذلك تعلم أكثر اكتمالا أمثلة من إطار الكشف عن وجوه.

فريق مثيل كائن ضعيف عملية الإشراف في التعدين PASCAL VOC 2007 تصور مجموعة التدريب، كما هو مبين أدناه (من اليسار إلى اليمين)، مع شبكة التعلم متكررة، يمكن الكشف عن حالات الكائن أكثر وأكثر دقة و وأضاف التدريب.

فريق واستخدام باسكال VOC 2007 VOC تم اختبار 2012 بيانات للمقارنة بين طريقة التعدين مثيل كائن (OIM) مع الآثار الأخرى ذات الصلة من ضعف أساليب الرقابة والكشف. وأظهرت النتائج أن ضعف الرقابة من مثيل الكائن في التعدين الأساليب ودقة تحديد المواقع من معدل دقة الكشف لتلبية أو تجاوز الأساليب الأكثر تقدما.

OIM وغيرها من معظم الكشف المتقدمة طريقة المقارنة دقة (AP) () على PASCALVOC مجموعة اختبار 2007

OIM وغيرها من طريقة الأكثر تقدما لتحديد المواقع مقارنة دقة (CorLoc) () على مجموعة التحقق من صحة PASCALVOC 2007 تدريب

OIM البعض مع معظم سيلة متقدمة للكشف عن دقة المقارنة (AP) () على مجموعة التحقق من صحة PASCALVOC 2012 / اختبار مجموعة

مقارنة OIM مع أساليب حاليا الأكثر تقدما أخرى من دقة تحديد المواقع على PASCALVOC 2012 المصادقة تدريب مجموعة (CorLoc) ()

وسيتم نشر ML & NLP أعلى الأوراق في إجمالي الترتيب: جوجل معظم جنون، شمال واضحا في المراكز العشرة الأولى، تشو مينغ، تشانغ يو، وليو تينغ ثلاثة صينيين

ورقة اليوم | نموذج التوازن الوسائط، مزيج من التحليل الدلالي، التعبير عال من الاستعلام SQL، والناس تشكل نماذج تقدير

الفيسبوك اكبر جسم مواز مفتوحة المصدر، الإحضار 4500000000، وتغطي 576 نوعا من لغة، أو أن تصبح معايير التقييم NMT

بعد الوباء، وسوف أعود إلى المدينة الكبيرة تفعل؟

رأس السنة الميلادية يوم وهانغتشو، وهو رجل في السيارة إلى النوم، ويستيقظ XingJu

حالة القتل القديمة، ويبكي كريهة 30 مجموعة: ثلاثة "الجناة" ليسوا على دراية، سلطت الضوء ليسوا خائفين من قتلك؟

الدموع الرأس! 3 ساعات أكثر من 400 توقيعا، الطاقم الطبي شنغهاي على مكافحة السارس فرونت لاين Qingzhan الطوعي

لم خمسة لا اجمع؟ جاء في النقطة، هناك مفاجآت

تينسنت زارة Joox وإدارة بايت فاز Resso وجنوب شرق آسيا قد يكون هذا العام المعركة على أشده؟

تدفق الملايين من الناس، والأقنعة الانتاج اليومية للبلاد 200 مليون، وكيفية القيام به بعد اندلاع؟

أثناء اندلاع الخاصية فجأة "الشعبية"

"المهرج" آه يي: يبلغ من العمر 9 سنوات تسربوا من المدرسة الانجراف الشمالية البالغ من العمر 14 عاما، وقال انه يريد كل طفل سعيد والهم | الصورة الإعلامية التيتانيوم "الانترنت"