هذا المقال هو عبارة عن تجميع للAI Yanxishe بلوق التكنولوجيا، والعنوان الأصلي:
مراجعة: DilatedNet - المتوسعة الإلتواء (الدلالي تجزئة)
الكاتب | سيك-هو تسانغ
الترجمة | ستيفن اثنين Gouzi
تصحيح التجارب المطبعية | صلصة الكمثرى فان مراجعة | جونسون لي يثير التشطيب | الأسماك وانغ لي
الرابط الأصلي:
https://towardsdatascience.com/review-dilated-convolution-semantic-segmentation-9d5a5bd768f5
ملاحظة: الروابط في هذه المقالة، قم بزيارة نهاية النص قراءة [الأصل]
هذه المرة، للمادة المتوسعة الإلتواء من جامعة برنستون وإنتل مختبرات استعرض بإيجاز. أفكار التوسع من الإلتواء من التحلل المويجات. ويسمى أيضا "التفاف عتروس"، "algorithmetrous" و "خوارزمية حفرة". لذا، إذا نحن قادرون على تحويلها إلى إطار التعلم العميق، يمكن أن نفكر أية أفكار في الماضي لا تزال مفيدة.
عندما كنت أكتب هذه القصة، وقد تم نشر هذا التوسع في ICLR التفاف عام 2016، واستشهد أكثر من 1000 مرة. (SH تسانغ @ متوسط)
تغطية ل
التوسع الإلتواء
السياق البلمرة المتعددة النطاقات (وحدة السياق)
نتيجة
1. التوسع الإلتواء
الإلتواء القياسية (يسار)، والتوسع في الإلتواء (يمين)
اليسار هو التفاف القياسية. والحق هو توسيع الإلتواء. يمكننا أن نرى أنه عندما المبلغ، ق + لتر = ص نحن تخطي بعض نقطة خلال التفاف.
عندما = 1 لتر، وهو التفاف القياسية.
عندما ل > 01:00، هو توسيع الإلتواء.
الإلتواء القياسية (ل = 1)
الإلتواء التوسع (ل = 2)
مثال إعطاء أعلاه عند ل = 2 عندما توسعت الإلتواء. يمكننا أن نرى أنه بالمقارنة مع التفاف القياسية، أكبر حقل تقبلا.
ل = 1 (إلى اليسار)، ل = 2 (وسط)، ل = 4 (R)
ويوضح الشكل ثلاثة أمثلة من حقل تقبلا.
2. متعددة النطاقات السياق البلمرة (وحدة السياق)
الإلتواء حدة التوسع القائم على بناء وحدة نمطية السياق السياق، على النحو التالي:
قاعدة وحدة السياق، ووحدة السياق كبيرة
كما هو مبين، وحدة السياق طبقة 7، والتوسع في طبقات مع نسبة التوسع مختلفة من 3 3 نواة حجم التفاف، وكانت معدلات التوسع 1،1،2،4،8،16،1.
الطبقة الأخيرة مع التفاف من 1 1، تعيين عدد من القنوات لنفس العدد من القنوات من حجم المدخلات. وهكذا، فإن قنوات المدخلات والمخرجات لديها نفس العدد. ويمكن إدراجها في أنواع مختلفة من الشبكة العصبية التلافيف.
وحدة السياق الأساسية وحدة السياق الأساسي هو واحد فقط قناة (1C، 1 قناة) في وحدة كاملة، ووحدة السياق كبيرة من وحدة السياق كبير 1C حيث وصل عدد قنوات إدخالها إلى طبقة 7 من 32C.
3. نتائج
3.1. PASCAL VOC 2012VGG-16 وحدة نمطية الأمامية (قبل التدرب). إزالة الطبقة النهائية وحمامات اثنين سائرين طبقة، حيث السياق وحدة السياق إدراج. خصائص FIG المتوسطة أيضا إزالة الحشو. فقط ملامح المدخلات FIG بالإضافة إلى عرض الحشو 33. صفر الحشو (الحشو 0) والحشو انعكاس (ملء باستخدام مدخلات انعكاس الحدود يعني الحشو) الحصول على نتائج مماثلة في تجاربنا. وبالإضافة إلى ذلك، فإن العدد الصحيح من قنوات قنوات المدخلات والمخرجات باستخدام الأوزان بدلا من الطريقة القياسية لتهيئة المعلمات نموذج التهيئة عشوائية.
VOC باسكال مجموعة 2012 اختبار
مقارنة مع الأصلي تدريب نموذج مؤلف مشترك، والتوسع في أداء طريقة التفاف على مجموعة الاختبار هو أفضل من نموذج ونموذج DeepLabv1 FCN-8S حوالي 5 نقاط مئوية.
فاز 67.6 من متوسط آيو (ومتوسط نسبة الأجر)
VOC باسكال مجموعة 2012 التحقق من صحة
من قبل صورة من بيانات التدريب مايكروسوفت -COCO، كما هو مبين أعلاه، والتفاف الاجتثاث توسيع الدراسة التجريبية نفسها.
-
الواجهة الأمامية: وحدة الواجهة الأمامية
-
الأساسية: وحدة السياق الأساسية
-
وحدة السياق كبيرة: كبير
-
CRF: استخدام DeepLabv1 DeepLabv2 والشروط المذكورة في عملية عشوائية نموذج المدخلات خطوة افعل
-
RNN: خطوة بعد العلاج باستخدام المجال عشوائي مشروط من قبل الشبكة العصبية المتكررة
يمكننا أن نرى أن الاستخدام الموسع الإلتواء (الأساسي أو كبيرة) لتحسين النتيجة الإجمالية، ويمكن أن تستمر في استخدام خطوات المعالجة اللاحقة الأخرى، مثل CRF.
فاز 73.9 من متوسط آيو (ومتوسط نسبة الأجر)
VOC باسكال مجموعة 2012 اختبار
على طاولة وحدة الأمامية ولكن أيضا من مجموعة بيانات Microsoft COCO التي تم الحصول عليها عن طريق التدريب. استخدام CRF-RNN (أي، وRNN في الجدول)، للحصول على 75.3 من متوسط آيو. شبكة شبكة شبكة لى فنغ لى فنغ لى فنغ
3.2 النتائج النوعيةVOC باسكال 2012
وتستخدم كافة طرازات VGG-16 يقوم استخراج ميزة، والالتواء التوسع مع نتائج أفضل في النتيجة تجزئة
VOC باسكال 2012
CRF-RNN استخدام مثل خطوات المعالجة التالية للحصول على نتائج أفضل. لكن CRF-RNN يجعل عملية لا نهاية التعلم.
الفشل
بعض النماذج هو مبين أعلاه حالة مقسمة خطأ، عندما يتم حظر الكائن، الخطأ المقسمة.
إعطاء مجموعات مختلفة من البيانات في نتائج الاختبار الملحق أن CamVid، كيتى ومناظر المدينة، لا تتردد في قراءة هذا المقال. أطلقوا سراح أيضا شبكة المتبقية الشبكات المتبقية المتوسعة توسيع تطبيق الإلتواء. آمل أن أتمكن من الكتابة إليه في المستقبل. :)
إشارة
متعدد مقياس السياق تجميع من قبل المتوسعة الإلتواءات
I التعليقات ذات الصلة
أريد الاستمرار لعرضها روابط ذات صلة والمراجع؟
انقر على [ DilatedNet - التوسع الإلتواء (تجزئة الدلالي)] للوصول إلى:
https://ai.yanxishe.com/page/TextTranslation/1538
آلة التعلم فورة
تقتصر حرة \ 18 الكتب الكلاسيكية / ستانفورد كتاب كلاسيكي + أوراق
انقر على الرابط لتحصل على:
https://ai.yanxishe.com/page/resourceDetail/574