DilatedNet - التفاف التوسع (تجزئة الدلالي)

هذا المقال هو عبارة عن تجميع للAI Yanxishe بلوق التكنولوجيا، والعنوان الأصلي:

مراجعة: DilatedNet - المتوسعة الإلتواء (الدلالي تجزئة)

الكاتب | سيك-هو تسانغ

الترجمة | ستيفن اثنين Gouzi

تصحيح التجارب المطبعية | صلصة الكمثرى فان مراجعة | جونسون لي يثير التشطيب | الأسماك وانغ لي

الرابط الأصلي:

https://towardsdatascience.com/review-dilated-convolution-semantic-segmentation-9d5a5bd768f5

ملاحظة: الروابط في هذه المقالة، قم بزيارة نهاية النص قراءة [الأصل]

هذه المرة، للمادة المتوسعة الإلتواء من جامعة برنستون وإنتل مختبرات استعرض بإيجاز. أفكار التوسع من الإلتواء من التحلل المويجات. ويسمى أيضا "التفاف عتروس"، "algorithmetrous" و "خوارزمية حفرة". لذا، إذا نحن قادرون على تحويلها إلى إطار التعلم العميق، يمكن أن نفكر أية أفكار في الماضي لا تزال مفيدة.

عندما كنت أكتب هذه القصة، وقد تم نشر هذا التوسع في ICLR التفاف عام 2016، واستشهد أكثر من 1000 مرة. (SH تسانغ @ متوسط)

تغطية ل

  • التوسع الإلتواء

  • السياق البلمرة المتعددة النطاقات (وحدة السياق)

  • نتيجة

  • 1. التوسع الإلتواء

    الإلتواء القياسية (يسار)، والتوسع في الإلتواء (يمين)

    اليسار هو التفاف القياسية. والحق هو توسيع الإلتواء. يمكننا أن نرى أنه عندما المبلغ، ق + لتر = ص نحن تخطي بعض نقطة خلال التفاف.

    عندما = 1 لتر، وهو التفاف القياسية.

    عندما ل >  01:00، هو توسيع الإلتواء.

    الإلتواء القياسية (ل = 1)

    الإلتواء التوسع (ل = 2)

    مثال إعطاء أعلاه عند ل = 2 عندما توسعت الإلتواء. يمكننا أن نرى أنه بالمقارنة مع التفاف القياسية، أكبر حقل تقبلا.

    ل = 1 (إلى اليسار)، ل = 2 (وسط)، ل = 4 (R)

    ويوضح الشكل ثلاثة أمثلة من حقل تقبلا.

    2. متعددة النطاقات السياق البلمرة (وحدة السياق)

    الإلتواء حدة التوسع القائم على بناء وحدة نمطية السياق السياق، على النحو التالي:

    قاعدة وحدة السياق، ووحدة السياق كبيرة

    كما هو مبين، وحدة السياق طبقة 7، والتوسع في طبقات مع نسبة التوسع مختلفة من 3 3 نواة حجم التفاف، وكانت معدلات التوسع 1،1،2،4،8،16،1.

    الطبقة الأخيرة مع التفاف من 1 1، تعيين عدد من القنوات لنفس العدد من القنوات من حجم المدخلات. وهكذا، فإن قنوات المدخلات والمخرجات لديها نفس العدد. ويمكن إدراجها في أنواع مختلفة من الشبكة العصبية التلافيف.

    وحدة السياق الأساسية وحدة السياق الأساسي هو واحد فقط قناة (1C، 1 قناة) في وحدة كاملة، ووحدة السياق كبيرة من وحدة السياق كبير 1C حيث وصل عدد قنوات إدخالها إلى طبقة 7 من 32C.

    3. نتائج

    3.1. PASCAL VOC 2012

    VGG-16 وحدة نمطية الأمامية (قبل التدرب). إزالة الطبقة النهائية وحمامات اثنين سائرين طبقة، حيث السياق وحدة السياق إدراج. خصائص FIG المتوسطة أيضا إزالة الحشو. فقط ملامح المدخلات FIG بالإضافة إلى عرض الحشو 33. صفر الحشو (الحشو 0) والحشو انعكاس (ملء باستخدام مدخلات انعكاس الحدود يعني الحشو) الحصول على نتائج مماثلة في تجاربنا. وبالإضافة إلى ذلك، فإن العدد الصحيح من قنوات قنوات المدخلات والمخرجات باستخدام الأوزان بدلا من الطريقة القياسية لتهيئة المعلمات نموذج التهيئة عشوائية.

    VOC باسكال مجموعة 2012 اختبار

    مقارنة مع الأصلي تدريب نموذج مؤلف مشترك، والتوسع في أداء طريقة التفاف على مجموعة الاختبار هو أفضل من نموذج ونموذج DeepLabv1 FCN-8S حوالي 5 نقاط مئوية.

    فاز 67.6 من متوسط آيو (ومتوسط نسبة الأجر)

    VOC باسكال مجموعة 2012 التحقق من صحة

    من قبل صورة من بيانات التدريب مايكروسوفت -COCO، كما هو مبين أعلاه، والتفاف الاجتثاث توسيع الدراسة التجريبية نفسها.

    • الواجهة الأمامية: وحدة الواجهة الأمامية

    • الأساسية: وحدة السياق الأساسية

    • وحدة السياق كبيرة: كبير

    • CRF: استخدام DeepLabv1 DeepLabv2 والشروط المذكورة في عملية عشوائية نموذج المدخلات خطوة افعل

    • RNN: خطوة بعد العلاج باستخدام المجال عشوائي مشروط من قبل الشبكة العصبية المتكررة

    يمكننا أن نرى أن الاستخدام الموسع الإلتواء (الأساسي أو كبيرة) لتحسين النتيجة الإجمالية، ويمكن أن تستمر في استخدام خطوات المعالجة اللاحقة الأخرى، مثل CRF.

    فاز 73.9 من متوسط آيو (ومتوسط نسبة الأجر)

    VOC باسكال مجموعة 2012 اختبار

    على طاولة وحدة الأمامية ولكن أيضا من مجموعة بيانات Microsoft COCO التي تم الحصول عليها عن طريق التدريب. استخدام CRF-RNN (أي، وRNN في الجدول)، للحصول على 75.3 من متوسط آيو. شبكة شبكة شبكة لى فنغ لى فنغ لى فنغ

    3.2 النتائج النوعية

    VOC باسكال 2012

    وتستخدم كافة طرازات VGG-16 يقوم استخراج ميزة، والالتواء التوسع مع نتائج أفضل في النتيجة تجزئة

    VOC باسكال 2012

    CRF-RNN استخدام مثل خطوات المعالجة التالية للحصول على نتائج أفضل. لكن CRF-RNN يجعل عملية لا نهاية التعلم.

    الفشل

    بعض النماذج هو مبين أعلاه حالة مقسمة خطأ، عندما يتم حظر الكائن، الخطأ المقسمة.

    إعطاء مجموعات مختلفة من البيانات في نتائج الاختبار الملحق أن CamVid، كيتى ومناظر المدينة، لا تتردد في قراءة هذا المقال. أطلقوا سراح أيضا شبكة المتبقية الشبكات المتبقية المتوسعة توسيع تطبيق الإلتواء. آمل أن أتمكن من الكتابة إليه في المستقبل. :)

    إشارة

    متعدد مقياس السياق تجميع من قبل المتوسعة الإلتواءات

    I التعليقات ذات الصلة

    أريد الاستمرار لعرضها روابط ذات صلة والمراجع؟

    انقر على [ DilatedNet - التوسع الإلتواء (تجزئة الدلالي)] للوصول إلى:

    https://ai.yanxishe.com/page/TextTranslation/1538

    آلة التعلم فورة

    تقتصر حرة \ 18 الكتب الكلاسيكية / ستانفورد كتاب كلاسيكي + أوراق

    انقر على الرابط لتحصل على:

    https://ai.yanxishe.com/page/resourceDetail/574

    تتبعت 36 مؤسس ممثلي وسائل الإعلام التيار الرئيسي الأرز تجمعوا للاستماع إلى خبراء المنتدى مؤسس لماذا الدجال عبق الأرز

    نماذج أودي TT 1.8T مدرجة رسميا: بيع 499800 يوان

    مساعدة ليغو جعل تاريخ باتمان مقرها العاصمة، ولكن بدأ الفيلم لعبة الثلاثة الكبار المعركة فقط

    هناك أكثر من الملابس الداخلية فيكتوريا السرية! مرادفا مثير مع كالفن كلاين رفض قبول؟

    HE كاي المجموعة ثم الخروج النظرية الأساسية: مرحلة واحدة مماثلة مثيل تجزئة عملية مرحلة مزدوجة

    دوائر | سراح فريق تسينغهوا AMiner 53 رسومات الحاسوب البحث التقرير

    سباق مع الزمن جينشى، السكرتير الأول للمجتمع: "لزجة قدم الطين وأكثر، من الناس الأقرب إلى القلب."

    "ليغو باتمان" في شباك التذاكر اللحاق بالركب "علب من العالم" فيلم الرسوم المتحركة الاقتتال الداخلي

    FAW - فولكس واجن T-روك المرسى من خط التجميع، سيتم إطلاق سيارة جديدة العام المقبل

    عصابات اللعب، الذي معظم حقول الغاز؟ غير إيكن تشنغ تشو يون فات، لقد خدمت فقط أليكس رجل!

    تكامل الأدوات للثقافة والموسيقى الإلكترونية التي مقبولة بالنسبة لك؟ Carhartt WIP س UR اظهار جماليات الموسيقى تحت الأرض!

    199 يورو لشراء صحية، وقيمة جدا! هواوي ساعة GT / سوار 3 برو هواوي رسميا