AAAI 2020 | DIoU وCIoU: آيو تصحيح في الكشف عن الهدف المفتوحة

الكاتب | VincentLee

تحرير | الجمل

أتى هذا المقال من عدد الجمهور قناة الصغرى: الملاحظات الهندسية خوارزمية شياو

في هذه الورقة، نشرت ورقة في AAAI 2020: تفسير "المسافة عبر آيو فقدان أسرع وتعلم أفضل للالمربع المحيط الانحدار".

عنوان ورقة: الشبكي: //arxiv.org/abs/1911.08287

عنوان الرمز: الشبكي: //github.com/Zzh-tju/DIoU

ويعرض ورقة DIoU الخسارة وفقدان CIoU آيو المستندة، وأوصت لتحل محل الطريقة التقليدية باستخدام NMS DIoU-NMS، والاستفادة الكاملة من الخصائص آيو الأمثل. وهذه الطريقة يمكن أن هاجرت بسهولة إلى الخوارزميات الموجودة جلب تحسينات في الأداء، وتعزيز التجارب على YOLOv35.91mAP، والتعلم قيمتها.

I. مقدمة

1، آيو

الكشف عن الهدف آيو مهم جدا كمؤشر التي، من خلال التقاطع بين كتلة توقع وجامع الحالي ونسبة GT تحسب لتقييم مزايا BBOX في كثير من الأحيان. ولكن عموما لBBOX صقل تستخدم L2 القاعدة، وأظهرت بعض الدراسات أن هذه الطريقة ليست الأمثل آيو، حيث كان هناك فقدان آيو.

2، وفقدان آيو

عندما خرج اثنين من مربع منفصلتين، آيو = 0، وكتل منفصلتين وثيقة وكتل متصلتين من ذلك بكثير: تشير آيو الخسائر اسم يتم تنفيذ مباشرة من خلال IOU حساب الانحدار الانحدار، ذكر مساوئ المادة خسارة آيو أمر لا مفر منه مثل، وبالتالي فقدان الاتجاه التدرج، فإنه لا يمكن أن يكون الأمثل. خسارة تحقيق آيو هناك الكثير، بالإضافة إلى المعادلة 2، هناك UnitBox السلس-L1 شكل عبر الكون من النموذج وIoUNet.

ناقشت YOLO شبكة كشف مماثلة أطروحة هنا، وفقا لما إذا كان GT الحالي في الخلية يحدد ما إذا كان BBOX حاجة للعودة، لذلك قد تكون هناك حالات منفصلة. شبكة مرحلتين العامة، في BBOX بطاقة التراجع سيكون، لن مربع منفصلة الانحدار.

3، وفقدان GIoU

فقدان GIou تزيد مدة العقوبة على أساس فقدان آيو، وحجم الحد الأدنى من المنطقة المحيطة كتلة توقع وعندما BBOX أكبر بعد، وكلما زاد المدى عقوبة.

وعلى الرغم من GIoU حل آيو التدرج المشكلة، لكنه لا يزال لديه العديد من القيود:

1، مربع إحاطة من فقدان العودة GIoU خطوة (الصف الأول) وفقدان DIoU (الصف الثاني). الأخضر والأسود تمثل صناديق الهدف وصناديق مرساة. صناديق زرقاء وحمراء تشير إلى توقع خسارة GIoU وفقدان DIoU. يزيد فقدان GIoU عموما حجم كتلة التنبؤ بحيث يتراكب مع كتلة الهدف، وأن نقطة خسارة مركز DIoU مباشرة من تطبيع الحد الأدنى.

كما هو موضح، أثناء عملية التدريب، Giou 1 يميل إلى زيادة حجم التقاطع مع BBOX يتم زيادة GT، وتعظيم دليل BBOX منطقة تداخل آيو مدة المعادلة 3.

2، في هذه الحالة، سيتم تخفيض الخسارة إلى Giou آيو الخسارة، وفقدان DIoU لا يزال يمكن تمييزها. الأخضر والأحمر تمثل الإطار الهدف والإطار المتوقعة.

ويتضمن الحال في FIG 2، GIoU تتحول إلى آيو.

نظرا إلى حد كبير يعتمد على العناصر آيو، تحتاج GIoU المزيد من التكرارات أن تتلاقى، وخاصة في BBOX الأفقي والعمودي (يحلل في وقت لاحق). بشكل عام، وفقدان GIoU ليس على ما يرام سوتا خوارزمية التقارب، ولكنه تسبب نتائج سيئة.

4، DIoU

الشامل التحليل السابق، وتقترح هذه الورقة المسافة عبر آيو الخسارة (DIoU)، ببساطة إضافة المدى عقوبة فقدان آيو الأساس، على المدى عقوبة تستخدم لتقليل المسافة من نقطة المركز من اثنين BBOX. 1، وDIOU معدل التقارب الآثار هي جيدة، ولكن يمكن استخدامها لحساب NMS DIOU في الاعتبار ليس فقط منطقة التداخل، والتفكير أيضا التباعد نقطة المركز. وبالإضافة إلى ذلك، والنظر في العناصر الثلاثة BBOX الورق، منطقة متداخلة، والمسافة نقطة المركز ونسبة الارتفاع، مما المقترحة كاملة فقدان آيو (CIoU)، تتلاقى بشكل أسرع، كلما كان ذلك أفضل.

الثاني، تحليل آيو الخسارة وفقدان GIoU

من أجل تحليل كامل وفقدان GIoU آيو الأداء، ورقة محاكاة التجربة، محاكاة العودة إلى الوضع المسافة BBOX مختلفة، وحجم ونسبة الارتفاع.

1، محاكاة تجربة

FIG 3، محاكاة تجربة

كما هو مبين، والتجارب سبعة مختلفة لتحديد نسبة الارتفاع 3 (1: 4، 1: 3، 1: 2، 1: 1، 2: 1، 3: 1، 4: 1) وحدة مربع (المساحة = 1 ) مثل GT، نقطة المركز من وحدة المضمونة الإطار (7، 7)، في حين تحتوي التجريبية 5000 7 7 تشرين BBOX، والتوزيع غير موحد:

  • المسافة: 3 في مجموعة من نقطة المركز من دائرة نصف قطرها من نقطة المركز 5000 من توزيع الزي الرسمي، لتحقيق كل المقاييس نقطة و 7 سبعة أنواع من نسبة الارتفاع.

  • الحجم: حجم كل من نقطة المركز هي 0.5، 0.67، 0.75، 1، 1.33، 1.5، 2،

  • نسبة العرض إلى الارتفاع: نقطة وسط كل جانب من جوانب نسبة 1: 4، 1: 3، 1: 2، 1: 1، 2: 1، 3: 1، 4: 1.

نظرا لفقدان وظيفة، ويمكن محاكاة عن طريق BBOX التدرج أصل الإجراء الأمثل. لBBOX التنبؤ، نتيجة المرحلة، على التدرج تستخدم لتسريع التقارب. BBOX الأمثل التقييم باستخدام -norm، أي ما مجموعه 200 التدريب ومنحنى الخطأ هو مبين في الشكل 3B

2، حدود آيو وGIoU الخسائر

الشكل (4)

ستكون أوراق BBOX على نقطة مركزية 5000 وتصور في المرحلة النهائية من الخطأ الكلي. فقدان آيو فقط تتقاطع مع مربع الهدف من BBOX فعالة، لأنه لا يوجد BBOX تقاطع هي 0. وGIoU نظرا لزيادة وظيفة عقوبة، زادت مساحة الحوض بشكل ملحوظ، ولكن لا يزال المناطق الرأسي والأفقي الحفاظ على نسبة الخطأ عالية، والذي يرجع إلى فترة عقوبة GIoU في كثير من الأحيان صغيرة أو حتى الصفر، مما يؤدي إلى التدريب يحتاج الى مزيد من التكرار أن تتلاقى .

الثالث، وطريقة

عموما، يمكن تعريف فقدان مقرها آيو كما هو المعادلة 5، وهو مربع التنبؤ على المدى عقوبة.

1، وفقدان المسافة عبر آيو

وتقترح الورقة لتقليل المسافة بين مركز شروط عقوبة مربع اثنين، وتمثل ونقطة المركز. هي المسافة الإقليدية، هو أصغر إرفاق اثنين من كتلة BBOX طول قطري.

فقدان DIoU تعرف تماما كما معادلة 7.

الرقم 5

يمكن DIoU المدى فقدان عقوبة تقليل مباشرة المسافة بين نقطة المركز، ويقصد فقدان GIoU للحد من إطار خارجي المنطقة المحيطة فقدان DIoU احتياطيات بعض الممتلكات آيو الخسارة وفقدان GIoU من:

  • فقدان DIoU لا يزال هو حجم غير ذي صلة، والحجم الكبير لايوجد خسارة كبيرة، صغيرة الحجم تنتج خسارة صغيرة.

  • فقدان GIoU مماثلة، يمكن تقديم DIoU الاتجاه فقدان التدرج لBBOX منفصلتين.

  • عندما BBOX صدفة كاملة ،، عندما BBOX بعيدا جدا،

في المحاكاة، وجدنا فقدان DIoU أيضا بعض خصائص فريدة من نوعها:

  • 1 و 3، وفقدان DIoU يمكن التقليل BBOX مباشرة من نقطة المركز. لذلك، انه التقارب في وقت قريب؛

  • في حالة احتواء، أو الحالة التي يكون فيها فقدان التقارب DIoU الرأسي والأفقي سريعة جدا، وتحولت تقريبا إلى فقدان GIoU فقدان آيو.

2، وفقدان آيو كاملة

مع الأخذ بعين الاعتبار BBOX عودة رقة لم تؤخذ ثلاثة عناصر من نسبة الارتفاع في الاعتبار في حساب، لذلك، اقترح CIoU أخرى على أساس DIoU. المعادلة (8) الذي المدى عقوبة، وهي وظيفة الترجيح، ونسبة الارتفاع لقياس التشابه.

خسارة كاملة من وظيفة على النحو المحدد في المعادلة (10).

ويعرف كما معادلة 11، يمكن للمنطقة تداخل السيطرة على حجم الأوزان.

وأخيرا، وفقدان CIoU من التدرج مماثل لفقدان DIoU، ولكن أيضا النظر في التدرج. في الحالة التي يكون فيها طول وعرض، هو عادة صغيرة يؤدي التدرج إلى انفجار، وبالتالي عند تنفيذ استبدال واحد.

3، غير الحد الأقصى قمع باستخدام DIoU

في NMS الأصلية، لقمع غير المرغوب فيها IOU إطار كشف مؤشر، ولكن فقط تعتبر منطقة تداخل، وغالبا ما تسبب قمع الخطأ، ولا سيما في حالة BBOX المدرجة. ولذلك، فإن NMS يمكن استخدامها بوصفها DIoU القياسية، والنظر ليس فقط في منطقة متداخلة، والتفكير أيضا التباعد نقطة المركز.

حيث الثقة والتصنيف، وقيمة عتبة NMS، وهو أعلى إطار الثقة. DIoU-NMS تميل إلى نقطة وسط مربع هناك الأشياء البعيدة مختلفة، ولكن خطوط قليلة فقط من تغيير الرمز، DIoU-NMS يمكن دمج ببساطة إلى خوارزمية الكشف عن الهدف.

رابعا: النتائج التجريبية

1، V3 YOLO على VOC باسكال

أجريت على YOLOv3 مقارنة التجريبية، وفقدان DIoU وCIoU آثار هامة حسب ما أوردته ورفع 3.29 و 5.67 على التوالي، وأثيرت AP75 التي كتبها 6.40 و 8.43 على التوالي، وذلك باستخدام DIoU-NMS يمكن تحسينها، بلغ معدل 5.91 و 9.88.

2، SSD على VOC باسكال

يقوم على المقارنة التجريبية SSD-FPN، لأن النموذج نفسه كانت دقة جيدة جدا، وCIoU DIoU فقدان التأثير ليس كبيرا جدا، ولكن لا يزال هناك مجال للتحسين. خريطة رفع 0.59 و 0.84 على التوالي، في حين أن رفع AP75 هو 1.77 و 2.59 على التوالي، وذلك باستخدام DIoU-NMS قادرة على تعزيز التأثير.

3، أسرع R-CNN على MS COCO

في أسرع R-CNN ResNet-50-FPN، منذ BBOX أسرع R-CNN نفسه يوفر كل من جودة عالية (أي في حوض FIG 4)، وبالتالي فإن Giou الأمثل صغيرة جدا، ولكن هذه المرة DIoU وCIoU جيدة الأداء النتائج الأمثل. يلاحظ أن الأداء CIoU على أشياء صغيرة قد انخفضت، وربما يعود ذلك إلى الجانب نسبة مساهمة أشياء صغيرة لم يتم الكشف، لأن النقطة المركزية للأهمية من نسبة الارتفاع.

6

وتصور 6 و Ciou Giou النتائج، يمكن أن ينظر إليه على الكشف عن وجوه كبيرة، يؤدي إلى تكون دقيقة من Ciou GIoU.

4، مناقشة DIoU-NMS

الشكل 7

كما هو مبين في الشكل 7، القضاء DIoU-NMS إلى أفضل دليل BBOX.

الرقم 8

لمزيد من التحقق من تأثير ينفذ DIoU-NMS مقارنة التجارب. كما هو مبين، والأداء العام DIoU-NMS من NMS الأم أفضل من 8.

V. ملخص

ويعرض ورقة اثنين وظيفة جديدة على أساس آيو الخسارة، خسارة DIoU وفقدان CIoU: المسافة بين نقطة وسط DIoU فقدان تقليل BBOX، حتى أن وظيفة التقارب السريع، يضاف فقدان CIoU في نسبة الارتفاع على أساس فقدان DIoU الاعتبارات، يمكن زيادة تحسين الأداء والتقارب السريع. في الهدايا ورقة بالإضافة DIoU-NMS NMS بدلا من الأصلي، والاستفادة الكاملة من الخصائص الأمثل آيو، من النتائج التجريبية، وتأثير جيد جدا.

تقرير AAAI 2020:

تحت وباء فيروس كورونا الجديد، AAAI2020 أيضا الانتقال إلى اللقاء؟

منع من دخول الولايات المتحدة، انخفض المشاركين موقع AAAI2020 من خلال ورقة كيفية المشاركة؟

نشرت AAAI أفضل ورقة

وقائع AAAI 2020: AAAI 2020 @ وانغ جينغ رقة ستفسر (PPT تنزيل)

ما يدرس NLP اتجاه الرياح على AAAI 2020 هناك؟

ظهرت مايكروسوفت ست ورقات AAAI 2020

AAAI سلسلة رقة 2020 القراءة:

خطاب أفضل الاعتراف والترجمة نماذج 01. بناء عن طريق الترجمة التفاعلية

02. منظور جديد لاستكشاف "الكشف عن وجوه" علاقة متبادلة المنفعة مع "تقسيم مثيل" من

03. أين تنبع منظور المترابط تجميع، والتكرار، والطبيعة المفاجئة جديدة للمشكلة من؟

04. قصة باستخدام الرسم البياني المشهد لتوليد سلسلة من الصور ل

05.2100 مجد مجال الملك 1V1 الفوز نسبة 99.8، ويجب أن يدرك تينسنت تفسير التقني لمنظمة العفو الدولية

06. متعددة المهام التعلم، وكيفية تصميم آلية أفضل تقاسم المعلمة؟

07. لسانه وننسى؟ هذا النموذج يمكن أن تساعدك | متعدد القنوات القاموس نموذج العكس

08. DualVD: إطار جديد الحوار البصري

09. مع BabelNet بناء متعدد اللغات للمعرفة سيميم

10. اخدود سهلة لملء: الترجمة نهاية إلى كلام، قبل التقارب طريقة التدريب وصقل

11. فقد يكون الوقت قد اثنين من أنت؟ شرائح محتوى الفيديو على أساس توقيت مخطط ثنائي الأبعاد الكشف

12. آليات كرة الثلج للتعليم الشبكة العصبية وأقل علاقة الوقت

13. خلال الكشف عن نموذج فصل التوصيف الدلالي والنحوي آليات الدماغ

14. متعدد الوسائط صيغة التوجيه الإيمانية المتعدد الوسائط خلاصات التلقائي

15. استخدام آلية الاهتمام طويلة لتوليد الترجمة التنوع

16. صفر عينة تعلم لتوسيع خريطة المعرفة (فيديو التفسير)

17. الفيديو كود الاستعلام استرجاع الصورة القائمة مفتوحة المصدر!

استنادا NAS-18. تصميم الشبكة GCN (القراءة فيديو)

19. التشخيص العصبي بسبب نظام التعليم الذكي، والتعلم من البيانات البيني وظيفة

الرقم 20. ومتعددة المراحل الإلتواء خوارزمية التعلم تحت إشراف النفس

21. النموذج الجديد، وتوليد حوار أكثر مرونة، وأكثر شخصية (فيديو التفسير، وتعلق PPT)

22. التعرف على النص لفصل اهتمام الشبكة

23. الدراسة صفر العينة على أساس الخصائص البصرية ضد طريقة المتبقية

24. هو عرض وحدة التقييم، وآلة رفع الترجمة الإخلاص الطلاقة (مفتوحة بالفعل)

25. كاميرا متعددة المساعدة الموقف التعاوني في إطار مبادرة لتحقيق مسار الهدف

26. إعادة النظر في تقييم الصورة الجمالية وتجد يسلط الضوء على نقطة محورية

27. تحسين أهداف التدريب، لتعزيز جودة الترجمة من نموذج غير autoregression (مفتوحة بالفعل)

28: المزدوج عرض علامات التصنيف باستخدام عدد وافر من ضعف تحسين الأداء تصنيف

29. وبناء على سياسة شجرة تعزيز التعلم التدريجي

30. تمثيل مشترك على أساس الترجمة الآلية العصبية (تفسير الفيديو)

31. هو عرض وحدة التقييم والطلاقة آلة رفع الترجمة الإخلاص (القراءة فيديو)

32. A العصبية آلية شبكة كرة الثلج عدة مرات علاقة التعلم (تفسير الفيديو)

33. غير المتمتعة بالحكم الذاتي العائد الترجمة الآلية (تفسير الفيديو) على أساس التدريب الهدف ن الصفوف

مجموعة 34. فحص القضائية البيانات (تفسير الفيديو، مع رابط التحميل)

35. ضعف الرقابة تجزئة الدلالية (القراءة فيديو)

36. الشبكات العصبية الثنائية متفرق، لا يتطلب أي مهارة، جعلت الدقة SOTA (تفسير الفيديو)

45. الكشف عن هدف جديد من ضعف الإطار إشراف

AAAI 2020 الافتتاح الرسمي، و 37 من الأوراق المقبولة من الصين، صدارة لثلاث سنوات متتالية الاستحواذ

أفضل ورقة صدر بهدوء، AAAI 2020 بالإضافة إلى "سحابة مؤتمر" وضع الفيديو، ولكن أيضا كيف تلعب؟

296 الانتخابات، معهد بحوث مايكروسوفت آسيا AAAI 2020 ورقات مختارة، ويجب أن نرى

AAAI 2020 | المقترحة شانغ تقنية إطارا جديدا للكشف عن وجوه من ضعف الرقابة

كيف مهرجان المصابيح في وباء قد انتهت؟ مع AI لجعل لم شمل الأسرة العشاء دايتون

وسيتم نشر ML & NLP أعلى الأوراق في إجمالي الترتيب: جوجل معظم جنون، شمال واضحا في المراكز العشرة الأولى، تشو مينغ، تشانغ يو، وليو تينغ ثلاثة صينيين

ورقة اليوم | نموذج التوازن الوسائط، مزيج من التحليل الدلالي، التعبير عال من الاستعلام SQL، والناس تشكل نماذج تقدير

الفيسبوك اكبر جسم مواز مفتوحة المصدر، الإحضار 4500000000، وتغطي 576 نوعا من لغة، أو أن تصبح معايير التقييم NMT

بعد الوباء، وسوف أعود إلى المدينة الكبيرة تفعل؟

رأس السنة الميلادية يوم وهانغتشو، وهو رجل في السيارة إلى النوم، ويستيقظ XingJu

حالة القتل القديمة، ويبكي كريهة 30 مجموعة: ثلاثة "الجناة" ليسوا على دراية، سلطت الضوء ليسوا خائفين من قتلك؟

الدموع الرأس! 3 ساعات أكثر من 400 توقيعا، الطاقم الطبي شنغهاي على مكافحة السارس فرونت لاين Qingzhan الطوعي