الإلتواء شبكة الجيل عمق المواجهة (DCGAN)

التفاف الشبكات العصبية لديها الأداء الجيد في مهام الإشراف التعلم، ولكن في مجال التعلم غير خاضعة للرقابة، من أقل. توضح هذه المقالة الخوارزمية سيكون CNN والإشراف التعلم غير خاضعة للرقابة التعلم في GAN مجتمعة معا.

في الظروف غير CNN، LAPGAN تعزيز دقة وضوح الصورة جعلت أيضا نتائج جيدة.

هنا بمثابة CNN امتداده، كما أنه يمتد إلى GAN كما CNN الفن. الخوارزمية GAN الأساسي، والرجوع إلى الشبكة العصبية مواجهة.

GAN لا وظيفة تكلفة محددة ومزايا عملية التعلم يمكن أن تتعلم التمثيل ميزة جيدة، ولكن التدريب GAN غير مستقر للغاية، وكثيرا ما جعل مولد ينتج الانتاج لا معنى له. مساهمات هذه الورقة هي أن:

  • تعيين طوبولوجيا شبكة CNN سلسلة من القيود تجعل من الممكن لتحقيق الاستقرار في التدريب.

  • باستخدام الناتجة تمثيل ميزة تصنيف الصور للحصول على نتائج أفضل للتحقق من القدرة على التعبير عن التمثيل ميزة صورة ولدت

  • علمت GAN لتصفية التحليل النوعي.

  • عروض مميزة ناقلات تحسب لدت تمثيل الميزة.

هيكل نموذج

نحن بحاجة إلى إجراء بعض التغييرات في هيكل نموذج على النحو التالي:

  • بدلا من ذلك تجميع تلافيف طبقة، حيث أن يستبدل تلافيف strided على الممي عن طريق استبدال تلافيف كسور-strided على المولد.

  • على مولد والممي استخدام batchnorm.

  • حل مشكلة ضعف التهيئة

  • التدرج تساعد على نشر كل طبقة

  • لمنع مولد جميع العينات تتقارب إلى نفس النقطة.

  • تطبيق BN مباشرة إلى جميع طبقات العينة يمكن أن يؤدي إلى صدمة ونموذج عدم الاستقرار، لم يتم استخدامه من قبل BN في طبقة الناتج المولد وطبقة المدخلات الممي يمكن منع هذه الظاهرة.

  • إزالة طبقة مرتبطة ارتباطا كاملا

  • تجميع العالمي يزيد من استقرار النموذج، ولكن يضر معدل التقارب.

  • ReLU المستخدمة في جميع الطبقات ما عدا طبقة الناتج المولد، وطبقة الانتاج باستخدام تان.

  • تستخدم LeakyReLU على جميع طبقات من الممي.

هيكل الشبكة DCGAN المولد:

حيث الطبقات هنا التحويل أربعة التفاف strided فركأيشنلي، في ورقة أخرى قد يكون كما يشار إلى إزالة التفاف.

تفاصيل التدريب

  • تجهيزها المرحلة، وحجم الصورة إلى تان .

  • تدريب مصغرة دفعة وحجم الدفعة 128.

  • ثم تهيئة كافة المعلمات تم الحصول عليها من (0، 0.02) من التوزيع الطبيعي

  • LeakyReLU المنحدر هو 0.2.

  • وعلى الرغم من السابق استخدام GAN الزخم لتسريع التدريب، DCGAN باستخدام معلمات فائقة تعديل آدم محسن.

  • معدل التعلم = 0.0002

  • بيتا المعلمة الزخم من 0.9 الى 0.5 لمنع الصدمة وعدم الاستقرار.

الاداءات LSUN

تدريب دورة الأولى (التعلم عبر الإنترنت)، ونموذج الآثار CONVERGES تم الحصول عليها هي على النحو التالي:

هذا يدل على أن DCGAN لا تتولد عن تدريب الذاكرة البيانات / على تركيب صور ذات جودة عالية.

DCGAN قدرات التحقق

تتميز من أجل التحقق من صحة تمثيل DCGAN، تمثيل الميزات في مدخلات L2-SVM، تتم مقارنة تصنيف والنتائج مع غيرها من خوارزمية التعلم غير خاضعة للرقابة.

للقيام بذلك، استخدم المولد في تدريب ImageNet-1K تم الحصول عليها، كل الميزات من جميع طبقات CNN كمدخل، حيث كل طبقة من الطريقة CNN باستخدام-تجميع أقصى انخفاض 4 4، ثم توسع إلى شكل متجه من البعد 28672، وإدخالها إلى L2-SVM.

أداء Mnist على مجموعة البيانات المقارنة:

وضع البيانات المقارنة على SVNH:

التجوال الفضاء الخفية

كيفية استكشاف الفضاء خفية تؤثر يتم إنشاء الصورة النهائية عن طريق تعديل ببطء متجهة الأولي. بهذه الطريقة، يمكنك استكشاف كيفية وصف الصورة عن طريق مطوية في الفضاء الخفي، ولكن أيضا يمكن تحديد هذه الصور هي تعلم حقا بسبب الميزات الدلالي أو مجرد تذكر الصورة (إذا كان هناك تغيير حاد).

من الرسم البياني أعلاه، يمكنك ان ترى بعض التغييرات التدريجية، مثل الصف السادس، ويكون تدريجيا نافذة. السطر الرابع، TV تختفي تدريجيا.

الممي تصفية

من خلال تحليل مرشح، يمكننا أن نرى أن في دراسة المنازل الخصائص، GAN المستفادة حقا السرير، النافذة، وغيرها من الميزات.

على اليسار هو مرشح عشوائي، وتصفية حق وعلم وظاهرة للعيان، مرشح إلى اليمين أو ذات مغزى.

قناع الدلالي

في الفضاء مخفي، على افتراض معرفة أي من العديد من المتغيرات التحكم كائن، بحيث قاسية لا يمكن أن يكون قد تم حظره هذه المتغيرات سوف يولد كائن في الصورة تختفي؟

أطروحة التجربة هو هذا: أولا، 150 الصور، بما في ذلك النوافذ وبلا نوافذ، ومن ثم استخدام وظيفة الانحدار أسفل لوجستية لتصنيفها، على الوزن ليست مميزة 0، أنه والنوافذ ذات الصلة. إلى كتلة، للحصول على صورة الجيل الجديد.

ناقلات الحساب

word2vec ما شابه ذلك، وليس لديه صورة أيضا خصائص مماثلة، الجمع والطرح يمكن أن تكون مخفية في الفضاء للحصول على صورة جديدة؟

التجارب تشير إلى أن استخدام تمثيل صورة واحدة ليست مستقرة، فإن استخدام ثلاث صور أن يكون أكثر استقرارا.

يمكننا أن نرى، صورة واحدة ليست مستقرة، وثلاث صور، يمكنك أن تتعلم تعبيرات والنظارات الشمسية وغيرها من الميزات.

ما هو أكثر من ذلك، يمكنك أن تتعلم ناقلات مستقرة، لإجراء التحول، على سبيل المثال، وتحول التوجه.

ملخص

قد يبدو المساهمة الرئيسية لهذه الورقة بسيطة، ولكن في الواقع هناك الكثير من العمل، والكامل للمهارة ممتازة على تعديل المعلمة دافا.

ولكن أعتقد، هو أن مساهمة أكبر لدراسة تأثير الطريق، وتوليد نموذج من الصعب التمييز بين الخير والشر، وهذه الورقة من خلال استكشاف الفضاء الخفية، وتحليل الشبكة، والتي تتميز القدرة على المقارنة بين سلسلة من الاجراءات لإثبات خوارزمية DCGAN في الواقع خوارزمية قوية.

شيري الجديد SUV غلاف لقطات رمز اختبار T1A

إنتاج المياه واضحة وتحيط بها المحكمة القديمة الرائعة، سوف Nanhaizi اثنين بارك الأراضي الرطبة تكون مفتوحة في العام المقبل في يوليو

موبايل يعيش Lianmai تحقيق التوليف نهاية --Server

"مدينة الموت" في القاهرة، وبنى مهندسي مأوى للاجئين في حاويات

تحوم H6 كوبيه الجديدة ثوب أحمر الإصدار القياسي من ذراع التجسس الإلكتروني / لا تزال السلطة دون تغيير

سانج يونج ريكستون الجديدة G4 سعر المدرجة رسميا من 21،98-31،98 عشرة آلاف يوان 10 نماذج / دفع

البيتلز معا، "الدبور" الربط 8 المدينة، "علة" حرق في وقت مبكر القلب "نحلة" مان تحطمت تماما

أسبوع واحد طول عمر البطارية، رقيقة ساعة الجسم مجد التقييم الأول: يأخذك إلى أعلى الجبل إلى البحر

بطاقة التفاح والعديد من تفاصيل أكثر، يمكن توليد رقم بطاقة افتراضية في أي وقت

قيمة الين، والفضاء، والطاقة كيف الانتخابات؟ 200000 توصية مشتركة SUV المدمجة

بلدية بكين الإدارية مركز خدمة المركز الفرعي لا يتحرك! منذ تنفيذ أول أيام العام الجديد من "نافذة واحدة" لتولي

899 يوان! نشرت المجد ووتش السحر: أسبوع واحد حياة طويلة