المغلي كتاب الكستناء تجف من الجزء السفلي من راحة غير معبد،
تقارير و qubit | عدد ملفه QbitAI
صورة الجيل الحالي هو الأكثر واقعية BigGAN بعدها!
إطلاق النار، هو جوجل الدماغ وETH زيورخ. انهم طرح جيل جديد من GAN: SGAN .
أنها تنتج كانت الصور الحقيقية للعدو.
تحت هذه الفراشات اللتين فقط أكثر وضوحا؟
صورتين المناظر الطبيعية، والتي تشانغ هو أكثر واقعية؟
معضلة أمر طبيعي، وعلى أي حال، ليست صحيحة. ووفقا كذبة أعلاه، يتم ترك من SGAN، BigGAN بواسطة اليد اليمنى.
كما أن لديها المزيد من العناصر:
أما ما هو SGAN، أعلن نهاية الجواب.
من الصعب التنافس مع بالعين المجردة، يتحدثون مع البيانات. تشغيل ااا (فريشيه التأسيس القطر) درجة، وانخفاض درجة، وهو ما يعني أن هذه الصور تكمن أقرب إلى المعرفة الإنسانية في الصورة الحقيقية -
SGAN هو 8.0، و 8.4 دقائق BigGAN. لاعبين جدد للفوز قليلا.
ولعلكم تتذكرون BigGAN تأسيسها، ولدت مباشرة الإخلاص صورة إلى المستوى التالي، وجهت على تويتر الحيل التقدير؟
اليوم ليس فقط بعده، وغير خففت بعده.
"سهل" أين هو؟
SGAN تحقيق مثل هذه النتائج جيدة، 10 فقط من البيانات المسمى يدويا. والمخضرم BigGAN، استخدمت بيانات التدريب 100 خلال الشرح اليدوي.
إذا كنت تنفق 20 من البيانات والشروح، وسوف SGAN تأثير مستوى أعلى.
تميزت عدم وجود بيانات، ساعد GAN بالفعل زيادة الطاقة الإنتاجية وتوسيع سيناريوهات الاستخدام عنق الزجاجة الرئيسية. اليوم، تقريبا تم كسر عنق الزجاجة.
الآن SGAN، بعد فقط ImageNet التجربة، وأقل وضوحا الخطوة الأولى في بيانات التدريب لتوليد صور عالية الدقة في التنفيذ.
التالي، والكتاب يريدون تطبيق هذه التكنولوجيا إلى "أكبر" و "أكثر تنوعا،" مجموعة البيانات.
وليس ذلك بكثير علامة
لماذا GAN التدريب ولدت صورة، علامة أنه يتطلب كمية كبيرة من البيانات؟
هناك GAN مولد، واثنين من الممي التجمع.
حيث المصنفين للحفاظ على تحديد صورة خاطئة، ومولد الإثارة من صورة أكثر واقعية.
صورة التسمية، هو إعطاء الممي لجعل الحكم القائمة. على سبيل المثال، وهذا هو حقا قطة، كلب هذا صحيح، هذا صحيح ...... هذا هو رأي كاذبة هامبورغ.
ومع ذلك، لا تميز كم البيانات؟
غوغل وETH زيورخ الباحثين، قررت تدريب خاصة بهم AI صورة الشرح، إلى استهلاك الممي.
مباراة نصف تحت إشراف الرقابة الذاتية
دعونا الممي صورة التسمية الخاصة، هناك طريقتان.
أولا منذ أسلوب الإشراف هو لإضافة الممي ميزة مستخرج (ميزة النازع)، وتدريب حقيقي من البيانات غير المسماة داخل التوصيف الخاصة بهم (ميزة التمثيل) المستفادة.
هل تجمع (التجميع) لتوصيف وتعيين نتيجة للتجميع، لاستخدام كتسمية.
تدريب هنا، وأنا استخدم فقدان وظيفة المراقبة الذاتية.
في المرتبة الثانية طرق شبه أشرف، وهو مستخرج ميزة الذي يتعين القيام به، ولكن أكثر تعقيدا من على الطريق قليلا.
في مجموعة التدريب المجموعة الثانوية لل وقد اتسمت هذه القضية خارج، استنادا إلى المعلومات المعروفة للتعلم تميز، في حين أن التدريب ل الخطي المصنف (الخطي مصنف).
وبهذه الطريقة، وعبر الكون وظيفة الخسارة على أساس الإشراف الذاتي، بالإضافة إلى (عبر الانتروبيا الخسارة) شبه أشرف.
تدريب ما قبل ميزة مستخرج، يمكنك أن تأخذ GAN القطار. هذا إيذانا جزء بسيط من المعروف تطوير GAN، ودعا SGAN .
ومع ذلك، قبل التدريب ليس هو السبيل الوحيد.
نريد نهج ذي شقين، يمكنك استخدام شارك في التدريب (شارك في التدريب):
الممي مباشرة التوصيف أعلاه، شبه يشرف تدريب المصنف الخطي للتنبؤ صورة لا المشروح. تتم هذه العملية، GAN والتدريب خارج معا.
حتى لا يكون هناك نسخة التآزر SGAN، ودعا SGAN-CO .
موجة الترقية
ثم، وفريق يريد أيضا SGAN تصبح أكثر قوة، وذلك فوق التدريب الاستقرار GAN أخذت يعتقد.
وقال الباحثون الممي فهو المصنف حسنا، إذا كان هذا المصنف التضخيم (تكبير) قد تكون جيدة على فعالية.
حتى أنها أعطت المصنف إضافي من المهام الإشرافية، فمن ل التضخيم دوران من خلال مجموعة التدريب (بما في ذلك الصواب والخطأ الشكل الشكل)، وجعل التنبؤ.
ثم هذه الخطوة، وأمام نموذج شبه إشراف الجمع، ويصبح التدريب GAN أكثر استقرارا، سيكون هناك نسخة مطورة SGAN :
العمارة المولودين خارج BigGAN
سواء SGAN أو SGAN، وقد استعار العليا هندسة الشبكات BigGAN، المعلمات الأمثل هي أيضا سوبر وأسلافه.
والفرق هو أن هذه الدراسة لم تستخدم تسوية متعامد (متعامد توفيق أوضاع)، لم تستخدم اقتطاع (اقتطاع) المهارات.
BigGAN مولد والرسم التخطيطي لالممي
تدريب مجموعة البيانات من ImageNet، منها 1.3 مليون صور تدريب و 50،000 اختبار صورة، صور مجموعه 1000 فئات.
أصبح تعديل حجم الصورة 128 128 3، ك تم اختيارها عشوائيا عينات في كل فئة، لتعيين أسلوب شبه إشراف قسم الحصول على البيانات المسمى المستخدمة.
وأخيرا، والتدريب على جوجل TPU V3 قرنة 128 الأساسية.
ما وراء BigGAN
المقارنة بين الدراسة الأساسية هي DeepMind من BigGAN، حامل الرقم القياسي الحالي، ااا النتيجة 7.4 .
ومع ذلك، فهي من تلقاء نفسها في ImageNet BigGAN تنفيذها، ااا هو 8.4، 75، وكمعيار.
في هذا المخطط، SGAN هو شبه تحت إشراف أساليب ما قبل التدريب. SGAN-CO التآزر أساليب التدريب شبه أشرف.
SGAN، ويقترن مع SGAN تحت اشراف النفس الخطية المصنفات (مجموعة البيانات الصراخ التضخيم بعد تناوب عليها التصنيف).
حيث، والأفضل هو SGAN، 10 فقط من البيانات المسمى يدويا، وسجل ااا 8.0، هو النتيجة من 78.7، كان أداء أفضل من BigGAN.
إذا كنت مهتما في هذه الدراسة رجاء حافظت البوابة جيدة:
ورقة:
عالية الدقة الجيل صورة مع تسميات أقل
https://arxiv.org/abs/1903.02271
في بداية المقال لإظهار هذه الصور للغش، أن يأتي من بين الأوراق:
السطر الأول هو BigGAN يعمل، والخط الثاني هو SGAN الجديدة، هل تفكر حتى الآن؟
وبالإضافة إلى ذلك، كما أنها مفتوحة الكود لجميع الأوراق المستخدمة في التجارب على جيثب:
https://github.com/google/compare_gan
- كامل -
التوظيف الصادق
المكدسة تقوم بتجنيد محرر / مراسل، ومقرها في تشونغ قوان تسون في بكين. نتوقع الموهوبين والطلاب المتحمسين للانضمام إلينا! مزيد من التفاصيل، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "تجنيد" كلمة.
و qubit QbitAI عناوين على التوقيع
' " تتبع تقنيات AI دينامية جديدة والمنتجات