الأكاديمية | تطور تردد الشبكة الاتجاه التفاف المجال: OctConv تحقيق أعلى قدر من الدقة مع السلطة أقل الحوسبة

تقنية مراجعة AI حسب: في الأيام الأخيرة، تسبب في تحسين شبكات التفاف الورق قلق لا صغير والمناقشة. وباختصار، فإن عملية رقة التفاف التقليدية للقيام التحسن العام بسيط، فإنه فاز أيضا أقل الحوسبة استهلاك الطاقة وأعلى قدر من الدقة. المعروف الباحث تعلم الآلة، "الأب GANS من" إيان غودفلوو فقط بالتغريد أشاد علنا ورقة.

واحد لهذه الورقة تشن يون بنغ، والقراءة حاليا طالب دكتوراه في السنة النهائية في جامعة سنغافورة الوطنية (NUS)، وكان معلمه عندما فنغ جيا يان، أستاذ مساعد وأستاذ مشارك في الماء. سابقا، وتشن يون بنغ درجة البكالوريوس في جامعة هواتشونغ للعلوم وعمل باحثا مساعدا في جامعة هونغ كونغ، هل باحث في قسم الجهاز التطبيقية تعلم الفيسبوك (الفيسبوك AML). بعد تخرجه من الجامعة الوطنية في سنغافورة، وهذا العام انضم تشن يون بنغ رسميا الفيسبوك، أصبح عالم أبحاث.

شبكة لى فنغ التالية AI تقنية مراجعة لفترة وجيزة شرح المحتوى الرئيسي للورقة.

(واحد اوكتاف: الحد من التكرار المكاني من خلال الشبكة العصبية التلافيف أوكتاف Convoluation)

وتتحقق الشبكة العصبية التلافيف (CNN) في العديد من المهام الرؤية الحاسوبية نجاحا غير مسبوق، ومع دراسة حديثة في التكرار المتأصل في تحسين معلمات نموذج مكثفة وأبعاد الميزة خريطة القناة، وكانت كفاءة CNN أيضا زيادة. ومع ذلك، ميزة خريطة لدت CNN هناك التكرار المكاني لا يزال كبيرا، على وجه التحديد، خريطة سمة من سمات كل موقع تخزين فقط بنفسك واصف ميزة مستقل، ولكن في واقع الأمر سيتم تخزين موقف مجاور لبعض من نفسه المعلومات؛ هذه المعلومات يمكن تخزينها بشكل جماعي ومعالجتها.

FIG 1 - (أ) نقطة البداية: نموذج المجال المكاني حسب التردد صورة الطبيعي بصريا يمكن أن تتحلل إلى جزء التردد المنخفض وجزء عالية التردد

الشكل 1 - حيث (ب) من طبقة الإنتاج الإلتواء قد تتحلل وتجميعهم وفقا لترددات مكانية مختلفة. سمة متعدد التردد (ج) تميز ورقة اقترحت التردد المنخفض خاصية الرسم البياني المخزنة في دقة منخفضة بسلاسة موتر متفاوتة، مما يقلل من التكرار المكاني. (D) المقترحة في ورقة مباشرة على عملية أوكتاف Convoluation هذا الوصف، فإنه سيتم تحديث المعلومات في كل مجموعة، وكذلك يسمح بتبادل المعلومات بين مختلف المجموعات.

كما رأس FIG 1 - (أ) كما هو مبين، صورة طبيعية يمكن أن تتحلل إلى انخفاض نسبة التردد المكاني ومكونات تردد مكانية عالية، ويصف السابق هيكل متفاوتة على نحو سلس، والذي يصف المتغيرة بسرعة تفاصيل الصورة. وبالمثل، فقد اقترح الكتاب حيث يمكن أيضا أن يقسم الناتج FIG طبقة التلافيف إلى أجزاء وجود ترددات مكانية مختلفة، واقترح تميز متعددة تردد جديد، التي يتم تخزينها في ارتفاع منفصل والجماعات ذات التردد المنخفض FIG مميزة، FIG 1 - (ب) هو مبين في الشكل. وهكذا، فإن القرار المكانية للمجموعة التردد المنخفض يمكن أن تخفض بشكل آمن، والحد من التكرار المكاني عن طريق تبادل المعلومات بين مواقع مجاورة، كما هو مبين في الشكل 1 - (ج) هو مبين في الشكل. لتمثيل هذه الميزة الجديدة من الأسلوب غير متوافق، من واضعي تعميم التفاف الأصلي المقترح أوكتاف الإلتواء (OctConv)، مدخلاته وخصائص التردد العالية والمنخفضة من FIG تحتوي على الموتر، ومن ثم مباشرة من لا يحتاج ميزة FIG استخراج المعلومات ذات التردد المنخفض لفك مرة أخرى إلى الترددات العالية، كما هو مبين في الشكل 1 - (د) هو مبين في الشكل.

كبديل للالتفاف على عملية الأصلي والتخزين وموارد الحوسبة تستهلك OctConv أقل بكثير. وفي الوقت نفسه، استخدمت المعلومات ذات التردد المنخفض عند معالجة التردد المنخفض OctConv التفاف المقابلة، وهذا النهج زيادة كبيرة في حجم ينظر للمجال الفضاء بكسل الأصلي، فإنه يمكن تحسين الأداء الاعتراف.

وضعت الكتاب تصميم OctConv لنهج مشترك، يمكن استخدامه كبديل مباشر لتشغيل شبكة التفاف التفاف القائمة. منذ يتم معالجتها التركيز OctConv على مختلف سمة التردد المكاني وFIG تخفيض التكرار المكاني، وأنها تشكل عنصرا مكملا لمختلف التعديلات الأخرى القائمة الاتجاه CNN مخطط الشبكة؛ الطريقة التقليدية طوبولوجيا أفضل تتألف هيكل، والحد من قناة التكرار التلافيف يتميز في الرسومات، للحد من المعلمات نموذج التكرار مثل كثافة.

ناقش الكتاب أيضا كيفية زيادة إدماج OctConv في حزمة، متعمقة الأول، وثلاثية الأبعاد حالة الإلتواء. وبالإضافة إلى ذلك، محاولات لاستغلال أساليب متعددة النطاق ومعلومات مختلفة، يمكن OctConv بسهولة استبدال عملية التفاف الأصلية، الضرورية لتغيير بنية الشبكة أو تعديل المعلمة عظمى.

وأظهرت التجارب أن ورقة ببساطة استبدال التفاف الأصلي هو OctConv، يمكننا تحسين أداء مجموعة متنوعة من مستقرة ثنائية الأبعاد شبكة CNN العمود الفقري الشعبية، بما في ذلك ResNet، ResNeXt، DenseNet، MobileNet، سي نت على ImageNet الاعتراف الأبعاد صورة، وC2D، والتعرف على الحركة I3D على ثلاثي الأبعاد الفيديو مجموعة البيانات حركية. ResNet-152 OctConv بعد عملية شد وجه يمكن أن يحقق أداء معظم تصميم اليدوي المتقدم للشبكة والتخزين والحوسبة في حين أن استهلاك يجب أن يكون أقل من ذلك بكثير.

الورقة الأصلية: الشبكي: //arxiv.org/abs/1904.05049، رمز ذات الصلة في المستقبل القريب سوف تفتح على جيثب. لى فنغ شبكة جمعتها منظمة العفو الدولية تكنولوجي ريفيو

انقر على قراءة النص الأصلي انظر وان كلمة النص الذي ترى كل شيء وعلى عمق التعلم في مجموعة متنوعة من التفاف الشبكة

الجيل الأول تراكم! الظل سر مخفي "4 ربط إعادة" أحدث بالأبيض والأسود صورة ظلية ملصق

صناعة | جوجل MorphNet: دعونا الشبكة العصبية الخاص بك هو أصغر ولكن أسرع

عام 2017، والتبت عن الربيع!

وتشمل "عصر 1800" مقدمة تذاكر الموسم علم النبات ثلاثة DLC!

ما هي الأشياء الهامة لمشاهدة PAKDD 2019 و؟ قراءة هذا يكفي!

ديناميكية | تمهيدا لإطلاق رسمي من السوق؟ بوسطن ديناميكس الروبوت نظموا "العزل" لا سيارة

يتحدث في حوزة الطريق التجريح وخط التبت تساتسا بروبان

أعلنت بانداي "أبطال السوبر التنين الكرة: بعثة العالمي" دفع تجريبي مجانا

بيك أب أجبر على تجاوز! بحيرة لوقو حافلة سياحية Zhuihe، تسيقونغ السياح معظمهم من كبار السن على متن الطائرة

أيضا حقيقية "اسم المخبر الحقيقي بيكاتشو" محاكاة ساخرة "شيرلوك بيكاتشو" السينما

ماو Weining أول فيلم قصص حب الشباب لا توافق على الحكم على سير العمل

"رون: راجناروك" سيتم تخطي أول تجربة مرحلة بيع خلال العام 2019