تطور تردد الشبكة الاتجاه التفاف المجال: OctConv تحقيق أعلى قدر من الدقة مع السلطة أقل الحوسبة

شبكة لى فنغ منظمة العفو الدولية تكنولوجي ريفيو: في الأيام الأخيرة، تسبب في تحسين شبكات التفاف الورق قلق لا صغير والمناقشة. وباختصار، فإن عملية رقة التفاف التقليدية للقيام التحسن العام بسيط، فإنه فاز أيضا أقل الحوسبة استهلاك الطاقة وأعلى قدر من الدقة. المعروف الباحث تعلم الآلة، "الأب GANS من" إيان غودفلوو فقط بالتغريد أشاد علنا ورقة.

واحد لهذه الورقة تشن يون بنغ، والقراءة حاليا طالب دكتوراه في السنة النهائية في جامعة سنغافورة الوطنية (NUS)، وكان معلمه عندما فنغ جيا يان، أستاذ مساعد وأستاذ مشارك في الماء. سابقا، وتشن يون بنغ درجة البكالوريوس في جامعة هواتشونغ للعلوم وعمل باحثا مساعدا في جامعة هونغ كونغ، هل باحث في قسم الجهاز التطبيقية تعلم الفيسبوك (الفيسبوك AML). بعد تخرجه من الجامعة الوطنية في سنغافورة، وهذا العام انضم تشن يون بنغ رسميا الفيسبوك، أصبح عالم أبحاث.

شبكة لى فنغ التالية AI تقنية مراجعة لفترة وجيزة شرح المحتوى الرئيسي للورقة.

(واحد اوكتاف: الحد من التكرار المكاني من خلال الشبكة العصبية التلافيف أوكتاف Convoluation)

وتتحقق الشبكة العصبية التلافيف (CNN) في العديد من المهام الرؤية الحاسوبية نجاحا غير مسبوق، ومع دراسة حديثة في التكرار المتأصل في تحسين معلمات نموذج مكثفة وأبعاد الميزة خريطة القناة، وكانت كفاءة CNN أيضا زيادة. ومع ذلك، ميزة خريطة لدت CNN هناك التكرار المكاني لا يزال كبيرا، على وجه التحديد، خريطة سمة من سمات كل موقع تخزين فقط بنفسك واصف ميزة مستقل، ولكن في واقع الأمر سيتم تخزين موقف مجاور لبعض من نفسه المعلومات؛ هذه المعلومات يمكن تخزينها بشكل جماعي ومعالجتها.

FIG 1 - (أ) نقطة البداية: نموذج المجال المكاني حسب التردد صورة الطبيعي بصريا يمكن أن تتحلل إلى جزء التردد المنخفض وجزء عالية التردد

الشكل 1 - حيث (ب) من طبقة الإنتاج الإلتواء قد تتحلل وتجميعهم وفقا لترددات مكانية مختلفة. سمة متعدد التردد (ج) تميز ورقة اقترحت التردد المنخفض خاصية الرسم البياني المخزنة في دقة منخفضة بسلاسة موتر متفاوتة، مما يقلل من التكرار المكاني. (D) المقترحة في ورقة مباشرة على عملية أوكتاف Convoluation هذا الوصف، فإنه سيتم تحديث المعلومات في كل مجموعة، وكذلك يسمح بتبادل المعلومات بين مختلف المجموعات.

كما رأس FIG 1 - (أ) كما هو مبين، صورة طبيعية يمكن أن تتحلل إلى انخفاض نسبة التردد المكاني ومكونات تردد مكانية عالية، ويصف السابق هيكل متفاوتة على نحو سلس، والذي يصف المتغيرة بسرعة تفاصيل الصورة. وبالمثل، فقد اقترح الكتاب حيث يمكن أيضا أن يقسم الناتج FIG طبقة التلافيف إلى أجزاء وجود ترددات مكانية مختلفة، واقترح تميز متعددة تردد جديد، التي يتم تخزينها في ارتفاع منفصل والجماعات ذات التردد المنخفض FIG مميزة، FIG 1 - (ب) هو مبين في الشكل. وهكذا، فإن القرار المكانية للمجموعة التردد المنخفض يمكن أن تخفض بشكل آمن، والحد من التكرار المكاني عن طريق تبادل المعلومات بين مواقع مجاورة، كما هو مبين في الشكل 1 - (ج) هو مبين في الشكل. لتمثيل هذه الميزة الجديدة من الأسلوب غير متوافق، من واضعي تعميم التفاف الأصلي المقترح أوكتاف الإلتواء (OctConv)، مدخلاته وخصائص التردد العالية والمنخفضة من FIG تحتوي على الموتر، ومن ثم مباشرة من لا يحتاج ميزة FIG استخراج المعلومات ذات التردد المنخفض لفك مرة أخرى إلى الترددات العالية، كما هو مبين في الشكل 1 - (د) هو مبين في الشكل.

كبديل للالتفاف على عملية الأصلي والتخزين وموارد الحوسبة تستهلك OctConv أقل بكثير. وفي الوقت نفسه، استخدمت المعلومات ذات التردد المنخفض عند معالجة التردد المنخفض OctConv التفاف المقابلة، وهذا النهج زيادة كبيرة في حجم ينظر للمجال الفضاء بكسل الأصلي، فإنه يمكن تحسين الأداء الاعتراف.

وضعت الكتاب تصميم OctConv لنهج مشترك، يمكن استخدامه كبديل مباشر لتشغيل شبكة التفاف التفاف القائمة. منذ يتم معالجتها التركيز OctConv على مختلف سمة التردد المكاني وFIG تخفيض التكرار المكاني، وأنها تشكل عنصرا مكملا لمختلف التعديلات الأخرى القائمة الاتجاه CNN مخطط الشبكة؛ الطريقة التقليدية طوبولوجيا أفضل تتألف هيكل، والحد من قناة التكرار التلافيف يتميز في الرسومات، للحد من المعلمات نموذج التكرار مثل كثافة.

ناقش الكتاب أيضا كيفية زيادة إدماج OctConv في حزمة، متعمقة الأول، وثلاثية الأبعاد حالة الإلتواء. وبالإضافة إلى ذلك، محاولات لاستغلال أساليب متعددة النطاق ومعلومات مختلفة، يمكن OctConv بسهولة استبدال عملية التفاف الأصلية، الضرورية لتغيير بنية الشبكة أو تعديل المعلمة عظمى.

وأظهرت التجارب أن ورقة ببساطة استبدال التفاف الأصلي هو OctConv، يمكننا تحسين أداء مجموعة متنوعة من مستقرة ثنائية الأبعاد شبكة CNN العمود الفقري الشعبية، بما في ذلك ResNet، ResNeXt، DenseNet، MobileNet، سي نت على ImageNet الاعتراف الأبعاد صورة، وC2D، والتعرف على الحركة I3D على ثلاثي الأبعاد الفيديو مجموعة البيانات حركية. ResNet-152 OctConv بعد عملية شد وجه يمكن أن يحقق أداء معظم تصميم اليدوي المتقدم للشبكة والتخزين والحوسبة في حين أن استهلاك يجب أن يكون أقل من ذلك بكثير.

الورقة الأصلية: الشبكي: //arxiv.org/abs/1904.05049، رمز ذات الصلة في المستقبل القريب سوف تفتح على جيثب. لى فنغ شبكة جمعتها منظمة العفو الدولية تكنولوجي ريفيو

"علقت الأمازون الصين عن" البحث الساخنة على صافي تعرض اليوم التخليص تعزيز! كنت انتزاع ذلك؟

رسم الأفلام الأجنبية، والقرود بها، تسعة المسلسل ...... 9 دبلوماسيين الاستماع إلى الطلاب يتكلمون قصة صينية

ادا كلمة فضح الوضع الاقتصادي، والأصدقاء هو خائفة الكلام، بخزي هوانغ

قبل مئة عام، هناك صور وهمية، وكانت الإمبراطورة الأرملة تسيشي، يوان PS

معظم امرأة سوداء جميلة في العالم، مع شخصية الشيطان وجه دقيق، مثل الجان!

طالبات الجامعات تبدو غريبة، غرابيل متطلبات مزيل سيارة، تم تعليق!

! لم يسبق له مثيل مجمع مع تذاكر 4 فيلم والأعجوبة الرجل الحديدي سلب كل من الروبوتات تنفجر!

قرية الملكية "البدر"، يمكن أن تجعل البيئة "التحضر" | وتش الملكية؟

توفير إشاعة على الملصق! "التالي" و "السابق 4" كسر نظيف

روي لحسن الحظ، بيتا سوق الولايات المتحدة، نشرت لأول مرة فشيئا رسمها يتناسب، أكد المحامي LiuJiangDong الشقق فيديو | لى فنغ الصباح

لانغ لانغ ينصح بشدة، وبطولة هيو يونيو! "الموسيقيين" لعبت أغنية البجعة للنهر الأصفر

تشاو يينغ هوانغ بن أصدقاء تقلع: في النهاية ماذا حدث؟