شبكة الفروع الثلاثة - أداء كشف إطار الشبكة الحالية من أفضل

تغيير حجم هي واحدة من التحديات الرئيسية للكشف عن الهدف. اليوم نقول هذه التكنولوجيا هي قوية بشكل خاص، الكشف عن وجوه في الميدان، في الوقت الراهن أقوى أداء الإطار. دعونا معا ليشهدوا مزاياه تحت.

وصف الإطار الخوارزمية:

على نطاق وإدراكا شبكات ترايدنت للكشف عن الكائنات

تحميل: الشبكي: //arxiv.org/abs/1901.01892

في إطار هذه الشبكة، ويتم تجربة السيطرة أولا لدراسة الخبرة الميدانية تأثير على مختلف كشف جداول الهدف. وفقا لنتائج التجربة الاستكشاف، اقترحنا شبكة ثلاثية الفروع الجديدة ( Triddnet )، والهدف من هذه الشبكة هو لتوليد جدول موحد ميزة تمثيلية FIG.

~ بطل الرواية اليوم هو أدنى شبكة ترايدنت ولكنه هو استعار من المادة 2018 في CVPR متعدد مقياس الفكر، لذلك فإنني بحاجة ليأخذك إلى العثور على قطعة المقبل من الورق ذات جودة عالية وإطارها، وهذا هو - SNIP . ثم بدأنا لتنظيف تحت SNIP هو كيفية استهداف الكشف.

أوراق تحتوي على وصلة: الشبكي: //arxiv.org/abs/1711.08189

هذا الإطار هو نقطة البحوث مشكلة الكشف عن الهدف من الأهداف الصغيرة. وقد تم الكشف عن الهدف صغيرة المشكلة الكشف عن الهدف، إذا كانت تمارس تعيين شركاء صغير يجب معرفة البيانات الأساسية طبقة صغيرة من AP هو أدنى، والأسباب الرئيسية هي كما يلي:

  • التناقض بين شبكة CNN استخراج الخصائص الدلالية وحلها؛
  • RCNN تبنت الحالي الكشف عن الهدف أسرع فكرة مرساة، مرساة تسببت حتى الأهداف الصغيرة داخل النطاق، وأيضا بسبب مساحة صغيرة آيو منخفض جدا.

يتبين من هذا الرقم، وحجم البيانات عينة تعيين COCO سبيل المثال في 90 من 0.472 أو أقل، والفرق هو ImageNet كبيرة جدا.

  • يوضح COCO مماثل هذه البينات. هناك الكثير من الأشياء الصغيرة؛
  • كما يظهر نموذج ImageNet المهاجرة مسبقا-تدريبهم على اختلافات كبيرة في مجموعة البيانات حجم COCO عينة، فإنه قد يكون هناك بعض الانحراف التحول المجال.

لذا، فإنه أنجبت مثل هذا الدافع:

  • الآن الكشف عن الهدف من أجل تعزيز تأثير الأهداف الصغيرة، وتستخدم upsample الأسلوب، وخير نرى الحكمة من ذلك، فإنه لا يمكن استخدامها مباشرة منخفضة الدقة الصورة لا upsample لتدريب الشبكة؟
  • يمكنك أخذ عينات عن طريق التقاط سيلة لزيادة تأثيرات الشبكة، مثل upsample حجمها في وقت لاحق، إلا أن قطار مع أرضية الحقيقة 64x64 ~ 256x256 من؟ مع كل GT لتدريب حقا أفضل؟

في الواقع، هناك العديد من الأهداف الصغيرة لتحسين والتدابير، على النحو التالي:

  • والأكثر شيوعا هو Upsample إلى Rezie حجم الشبكة المدخلات الصورة؛
  • مع خاص من هذا القبيل تلفيفي المتوسعة / strous مثل تحسين حساسية قرار كاشف.
  • FPN هذه الميزة مع الضحلة والانصهار ميزة عميق، أو عند التنبؤ الماضي، جنبا إلى جنب مع التنبؤ عميقة وسطحية ملامح مميزة.
  • هناك نسبيا واضحة تجعل مستقل التنبؤات مباشرة على الضحلة والعميقة ميزة خريطة، وهذا هو ما نحن غالبا ما نقول إن حجم المشكلة.

الفكرة الرئيسية:

في التدريب ونشر المعلمات تحديث العكسي، الذي أهداف فقط ضمن نطاق معين من المقاييس النظر فيها، وبالتالي يعرض أساليب التدريب المتعددة النطاقات الخاصة، وهي SNIP (مقياس التطبيع للصورة الأهرامات).

كما هو مبين أعلاه، عندما الثلاثة مقسمة على نطاق والتدريب، المقابلة لثلاثة قرارات صورة مختلفة. العائد على الاستثمار في كل قرار له مجموعتها المحدد، إذا كان حجم مربع GT في هذا النطاق، فإنه يتم وضع علامة لجعل صالحة، وإلا فإنه يتم وضع علامة أنها غير صالحة.

وعندما توليد مرساة مرساة المخصصة لالتسمية، يتحقق مرساة ما إذا كان مربع GT صالح التداخل يتجاوز 0.3، إذا كان موجودا، سيتم اعتبار مرساة مرساة صالح، وإذا لم يكن كذلك، سوف ينظر صالح مرساة .

مما أدى إلى هذه invalie مرساة في القطار عندما يفسد الإرادة، لن يتم إضافته إلى وقف انتشار نفوذ المعلمات عملية، أي ما يعادل على كل قرار، إلا أن حجم هدفا مناسبا للتدريب، وهو ما يتماشى مع وقد تم تصميم إطار الشبكة أصلا. وفقا لذلك، في الوقت الاستدلال، إذا كان سيتم تجاهل أيضا منطقة خارج نطاق قرار معين، وأخيرا وأثناء وعمليات إعادة مقياس NMS.

بعد قراءة بعناية، وسوف تجد الكثير من التفاصيل للنظر في عناصر الإطار:

  • باستخدام جهاز الكشف عن تشوه RFCN، بدلا من التفاف المعتاد، لإجراء تغييرات معينة وفقا لاحتياجاتها.
  • هيكل الشبكة شبكات مزدوجة المسار (DPN) وResNet-101، حيث هناك حاجة إلى ذاكرة كبيرة، من أجل التكيف مع ذاكرة GPU، أخذ عينات من الصورة، وطريقة محددة هو اختيار المنطقة التي تحتوي على ما يصل إلى 1000x1000 الكائن كما فرعي الصورة، ثم تكرار وقد تم اختيار الخطوة حتى عن الأهداف؛
  • من أجل تعزيز تأثير RPN، حاول نطاق استخدام الناتج 7، ويرتبط conv4 من conv5.
  •  تحدث وظيفيا، ولكل طبقة من صورة الهرم، والهدف كشف هم من مختلف الأحجام، وصورة الهرم الأكبر، أصغر حجم الهدف الكشف.
  • من يهتم هيكل الشبكة، ثلاثة فروع تقاسم المعلمة، وذلك بالضبط نفس هيكل الشبكة، إلا أن معلمات مختلفة تتجاوز حجم معين.
النتائج التجريبية

يمثل MS متعددة النطاق

المصدر: فريق الحاسوب الرؤية

(هذا المقال هو طبع أو مقتطفات الشبكة، وينتمي إلى المؤلف الأصلي أو نشرت في وسائل الإعلام على الإطلاق. كما تنطوي على العمل قضايا حق المؤلف، يرجى الاتصال لنا التعامل معها.)

وقد تم اعتقال ذلك! السرعة، الذي يعيش في نانتشانغ في هذه الأماكن لنبدأ في رؤية تحقيقات الشرطة شامل لهذه المسألة

الولايات المتحدة تعليقات وسائل الإعلام وفيات تصادم النماذج العشرة الأوائل شو اشكنازي بدون قائمة والولايات المتحدة واليابان استخدام الخاص!

2 CPI للعودة إلى عصر والخنازير الصينية أو على وشك أن الجبن البترودولار الخطوة

التعرف على الصور المستقبل: الفرص والتحديات

العشرة الأوائل تجمع أروع في العالم، ومشاهدة يريد القفز على الفور في الماء

وحدث الملك أو انعطاف النقطة، لقد حان الأموال النقدية الصينية إلى أسفل من الثمن؟

الشجعان! لا يعرف الخوف! تبدأ!

في حالة سكر القيادة أذى للآخرين، وذلك للحد من قسم شرطة المرور، وحتى هذه التحذيرات يريد أن يخرج!

يذكر الجارديان "الجميع" يتحمل المسؤولية!

أكتوبر التسعة الأكثر بلدة فرار مناسبة، قلة من الناس مجموعة جينغمى، واختيار بضعة أيام لقضاء بعض الوقت على مهل

الحصول على أدنى إلى 150،000، الرجل القوي SUV ضروري! التي تبدو غير الطبق الخاص بك

باندا تعيش من خط التجميع، Sicong غير موثوق بها للغاية!