AAAI 2020 | مصقول مع التدريجي كشف كبير الهدف من أجل تحقيق النتائج المثلى

ون | BBuf

إد | يانغ فان

تاريخ النشر: التقدمي ميزة الشبكة تلميع للكشف عن وجوه البارزة

عنوان ورقة: الشبكي: //arxiv.org/abs/1911.05942

هذه المقالة ورقة AAAI2020 الاستقبال

تفسير: BBuf

الخلاصة: خصائص الصورة مهمة جدا لكشف كبير الهدف. أساسا في الطريقة التقليدية تهدف إلى دمج الميزات الهيكلية المعقدة وتصفية متعددة المراحل من الخلط بين الميزات. هذا ويعرض ورقة الخصائص الجديدة التقدمية شبكة طحن (PFPN)، يمكن الكشف عن أهداف كبيرة مع التفاصيل غرامة الرملي تتميز باستخدام عدد وافر من تكرار وحدات (التيار الوطني الحر)، ودون أي ما بعد العلاج. عن طريق دمج كل التيار الوطني الحر المباشر رفيع المستوى سياق المعلومات التي تم تحديثها في موازاة ذلك، وحيث يمكن الاحتفاظ بها لكل مستوى من مستويات التسلسل الهرمي وحجم الخرائط الميزة، مما يجعله يمكن تطبيقها في أي هيكل CNN. PFPN على 5 مجموعات البيانات التي تم الحصول عليها معيارا SOTA.

1. مقدمة ومساهمة

تم تصميم كشف الهدف كبير في صورة لاستخراج المنطقة الأكثر جاذبية، كان قد تم استخدامها على نطاق واسع في رؤية الكمبيوتر، مثل ضغط الفيديو، وتتبع البصرية واسترجاع الصور. صورة اختبار أهمية يعتمد على ملامح الدلالي، بما في ذلك ميزات على مستوى أدنى وميزات مستوى عال.

وفقا لذلك، من أجل الاستفادة من ميزة التفاصيل الدلالي، وميزات مختلفة من الانصهار الناشئة. ومع ذلك، نظرا إلى بعض الميزات على مستوى الميزة ليست دقيقة، تبعيات على المدى الطويل بين الميزات، شاهقة ميزات غير مستغلة تؤثر على القدرة على الكشف عن سبب ما تبقى مشكلة التحدي. للاستفادة الكاملة من المعلومات الدلالي والتفصيل، فإن هذه الورقة هدايا بسيطة وفعالة التقدمية خصائص الشبكة الرملي. مساهمة من هذه المادة على النحو التالي:

  • في هذه الورقة، حيث نوع واحد من أهمية تقدمية لطحن شبكة الكشف عن الهدف بشكل متكرر تحسين تدريجيا الخصائص.
  • لكل خطوة طحن، تقترح ورقة لتحسين خصائص التيار الوطني الحر، وبالتالي الإبقاء على حجم ميزة والهيكل الهرمي للFIG. انها تقدم معلومات الدلالي إدماجها مباشرة في جميع الميزات على مستوى منخفض لتجنب المشاكل الاعتماد على المدى الطويل.
  • في 5 معيارا يتم الحصول على مجموعات البيانات دقة SOTA.

2، طريقة

2.1 الهيكل العام

ميزة كبيرة التقدمية للكشف عن وجوه مصقول التكوين العام للشبكة كما هو مبين في Figure2.

أولا، يتم تغذية الصورة المدخلة في شبكة العمود الفقري وافر من ميزات جداول المستخرج. اختارت ورقة للقيام ResNet-101 شبكة العمود الفقري. في حين أن شبكة العمود الفقري تفعل أظهرت النتائج VGG16 الورقة أيضا في قسم تجريبي.

على وجه التحديد يمكن تقسيم ResNet-101 الشبكة إلى 5 كتل مع خطوة = 2 من عملية أخذ العينات. ويمكن التعبير عن هذه الخاصية إخراج FIG 5 باسم كتلة: التحويل-1، الدقة، 2، 3 الدقة، الدقة، 4، 5 الدقة. للحد من حجم ملامح الشخصية FIG وذلك لتحقيق أكثر من ذلك، ملامح يمر أولا من خلال FIG حدة التحويل (Figure2 في TM1)، حيث يتم تحويل كل مستوى من خلال التفاف 1X1 إلى ميزة نفس الأبعاد، على سبيل المثال، في تنفيذنا 256.

بعد الحصول على عدد وافر من المزايا من نفس الأبعاد، وترتبط سلسلة التيار الوطني الحر من وحدات وراء كل الخصائص الميزة لتكرير FIG. يظهر Figure2 مثال على T = 2. في كل من التيار الوطني الحر، وقدم ملامح رفيع المستوى مباشرة إلى ميزة مستوى منخفض للجميع أن تتحسن، والتي هي أكثر كفاءة من الطريقة غير المباشرة وبشكل ملحوظ يقلل من فقدان المعلومات. مدخلات ومخرجات التيار الوطني الحر لها نفس الأبعاد وجميع تقاسم نفس FPMs هيكل الشبكة.

نحن نستخدم معايير مختلفة لكل من التيار الوطني الحر، من أجل أن يتمكنوا من معرفة تدريجيا أكثر وأكثر تركيزا على التفاصيل. تبين التجارب أنه عند الساعة T = 2، أظهر نموذج SOTA ودقة وسرعة 20FPS.

ثم، وذلك باستخدام نموذج تحويل ثاني وحدة (TM2 Figure2 في)، وهو بعد ذلك أخذ عينات من قبل التفاف شبه خطيه تتكون من 1X1، وأخذ العينات مباشرة دقة وضوح الصورة الأصلي وعدد من القنوات على الهدف مضغوط 32.

وأخيرا، يتم استخدام وحدة الانصهار (FM) للحصول على التعددية الانصهار النهائية من ميزة خرائط FIG كبير. نظرا لخصائص استخدام التيار الوطني الحر بعد تمثيل أكثر دقة، لذلك يستخدم FM استراتيجية بسيطة لتحقيق هذه السلسلة، والاستخدام النهائي طريقة لتمرين الشبكة.

2.2 حيث طحن وحدة

تتميز طحن وحدة (التيار الوطني الحر) هو العنصر الأساسي للشبكة في ورقة PFPN المقترحة، التيار الوطني الحر هي بسيطة وفعالة وحدة نمطية، وأي التفاف يمكن استخدامها لتحسين الهندسي تمثيل ميزة الشبكة.

فإنه يحتفظ متعدد المستويات CNN ملامح ولدت، على سبيل المثال، أو الجذع أو إخراج الأمامي من التيار الوطني الحر، وتعلم لاستخدام اتصال المتبقية تحديثها. لN حيث FIG. F = {فاي، ط = 1، ...، N}، التيار الوطني الحر إنتاج نفس حجم بعد طحن N الرسم البياني المميزة F ^ {ص} = {فاي ^ ع، ط = 1، .. .، N}، كما هو مبين في Figure2، التيار الوطني الحر التيار الوطني الحر التي تضم وحدات موازية N، كل المقابلة لسمة واحدة ويعبر عنه FIG التيار الوطني الحر-ك.

على وجه التحديد، وذلك باستخدام المتبقية على اتصال من جانب واحد على الجانب أعمق من سطحية. ونتيجة لذلك، فإن المعلومات ميزة رفيعة المستوى وجود العالمي حقنها مباشرة في مستوى أدنى ملامح لمناطق مساعدة جدت لتكون أفضل بكثير. في FPM1-3 Figure2 هو، الدقة-3، الدقة-4، وتتميز الدقة 5 تم تحديثها لاتصال اختصار الدقة-3. أيضا استيعاب مزايا التيار الوطني الحر شبكة المتبقية (وآخرون 2016)، لذلك يمكن تحديثها وتصفيتها تدريجيا FIG تتميز الخلط بين المعلومات.

ويتضح ذلك من خلال الاتصالات المختلفة في Figure2. قد تصاغ $ التيار الوطني الحر-ك $ حدات ينفذ على النحو الاتي:

أنها تقبل N-ك + 1 الخاصية على FIG {FJ، ي = ك، ..، N}. لميزة FIG FJ، كنا أول التفاف 3X3 + مكونات BN + ReLU لالتقاط المعلومات الدلالي، وهو بعد ذلك محرف لحجم كيه. بعد هذه الخصائص عينة بعد الاستيفاء باستخدام الانصهار CONCAT، ومن ثم من خلال 1X1 التفاف تخفيض أبعاد كيه تم الحصول عليها. ثم يتم التعامل كيه وظائف المتبقية لتحديث الميزات الأصلية FIG كيه حساب الختامي ميزة FIG f_k ^ ص. عندما فترة من 3 ك = سبيل المثال كما هو مبين في Figure3.

وحدة التكامل 2.3

ورقة وحدة باستخدام الانصهار (FM) لصهر وافر من المزايا وللكشف عن الأجسام FIG كبيرة. كما هو مبين في Figure2، أول متعددة المستويات يتميز TM2 هو CONCAT، ثم 3X3 التفاف إلى طبقتين. ثم وأهميتها النهائية تعيين التفاف 1X1 في الطبقة الأخيرة.

2.4 تفاصيل التنفيذ

الورق باستخدام فقدان عبر الكون لتحسين خريطة البروز النهائية وتميز خريطة كبيرة. المؤلفون ثم استخدام فقدان الثانوية، خاصة الأمثل هو سلسلة من النتائج المتوسطة قبل وحدة FM، ومجموع صافي الخسارة النهائية على النحو التالي:

3. النتائج التجريبية

وقد تم الحصول على عروض TABLE1 التالية وصفت وسائل هنا في خمس مجموعات من البيانات دقة SOTA، علينا أن نظهر مدى فعالية هذا الأسلوب.

4، العرض البصري

5. الخاتمة

للاستفادة الكاملة من المعلومات الدلالات والتفاصيل، تقدم هذه الورقة بسيطة وفعالة التقدمية طحن خصائص الشبكة (PFPN). ميزات PFPN تسهم في تقدمية صقلها من قبل وسيلة عودي إلى تحسين متعددة المستويات الاداء المميز الرسم البياني، لكل خطوة من تلميع الخصائص، تتميز طحن وحدة (التيار الوطني الحر) المعلومات الدلالي رفيع المستوى إدماجها مباشرة في مستوى أدنى من كافة الميزات في الرسومات، مما يقلل من فقدان المعلومات. وأخيرا، PFPN في 5 الاداء القياسي هو أفضل بكثير من 16 نوعا من أحدث الأساليب.

كيف تحكي الالتهاب الرئوي عهد جديد والأنفلونزا التي التعلم العميق؟ من الفحص المبكر للتنبؤ حالة حرجة

تعلم الاتحادية أحدث الاتجاهات في مجال البحوث

هل يغير بحث Microsoft AI المدربين ، ويخلق وظائف جديدة ، ويروج للمحاربين القدامى ليحلوا محل Shen Xiangyang؟

ICLR2020 | جوجل أحدث الأبحاث: نموذج كمي ل"الاختلاف معقدة" تعميم الاصطناعية

BYD للحصول على 1.3 مليار يوان الدعم للمركبات جديدة للطاقة، والطاقة، تطوير السيارة الجديدة طريق طويل لنقطعه

غزوة الأولى في السوق في الخارج، وتأمل أن تنفق 140 مليون $ اقتناء المؤسسات التعليمية في ماليزيا

الفيروسات والمضيف "غرام الحب"

تكنولوجيا الحجر دراسة الانتقال العصر الجليدي المناخ حوض NIHEWAN المرحلة الأولى تقدم وون

منكب الجوزاء غير المنفجرة، "المذنب يوم القيامة" تقريبا؟

بعد بضع مسرحية "شقيقة لينة" لقاء الأصدقاء نسأل عن "1314" ذهب

الضباب في "والدورف"

المؤسسات الطبية "البنية التحتية الجديدة" ما هي الفرص؟ وباء جلب دواء قوي