[ايان غودفلوو قوي دفع] تقدم GAN تتبع 10 ورقة كبيرة (مرفق التحميل)

الأنفس جي تقرير جديد

ترجمة: القلم، شياو تشين

[استعراض فاز جي الجديدة شبكة GAN ولدت ضد المؤلف إيان غودفلوو يوصي على تويتر GAN من 10 ورقة، GAN هو تتبع التقدم، والتعرف على أحدث التقنيات لا ينبغي تفويتها. هذه المقالة يجلب الترتيب والعرض، ونأمل أن تعطي القارئ الإلهام.

1. التقدمي زراعة GANS لتحسين الجودة والاستقرار، والاختلاف

تيرو كاراس، تيمو العيلة، اللاعب Samuli لين وجاكو يتينن (NVIDIA وجامعة آلتو)

واقترحت ورقة GAN من البحوث NVIDIA زيادة تدريجية إلى (تزايد تقدمية) في GAN طريقة التدريب، باستخدام GAN شبكة تدريجيا زيادة (ويشار إلى PG-GAN)، ومجموعة HQ-البيانات بعناية معالجة CelebA، لتحقيق تأثير لالتقاط الأنفاس الصورة التي تم إنشاؤها. يقول المؤلفان بهذه الطريقة ليس فقط لتحقيق الاستقرار في التدريب، GAN الناتج جودة الصورة هو إلى حد بعيد أفضل.

على فكرة رئيسية هي زيادة تدريجيا المولد والممي: من بداية منخفضة، مع تقدم التدريب، إضافة طبقة جديدة من أدق وأدق تفاصيل النمذجة. "التقدمي تزايد" يشير إلى أول شبكة التدريب 4X4، 8X8، والتدريب، والنمو، وتحقيق نهاية المطاف 1024x1024. هذا ليس فقط تسريع تدريب السرعة، سرعة التدريب قد استقرت إلى حد كبير، وجودة الصورة الناتجة عالية جدا، على سبيل المثال صورة CelebA 1024 1024.

مجموعات البيانات والتعليمات البرمجية مفتوحة المصدر.

الرسالة: الشبكي: //arxiv.org/pdf/1710.10196.pdf

المصدر: الشبكي: //github.com/tkarras/progressive_growing_of_gans

جي وون تقرير جديد: حتى الآن معظم GAN الحقيقي: NVIDIA الزيادة التدريجية في وضع التدريب GAN، وتوليد غير مسبوقة صورة عالية الوضوح

2. الطيفي التطبيع لشبكات الخصومة التوليدية

تاكيرو Miyato، توشيكي كاتاوكا، ماسانوري كوياما، يويتشي يوشيدا (2018)

ICLR 2018 أوراق من الباحثين اليابانيين اقترحت تقنية تسمى "تطبيع الطيفي" (التطبيع الطيفي) من الوزن الجديد تطبيع (الوزن التطبيع) والتكنولوجيا، لتحقيق الاستقرار في المصنفات القطار. هذا جديد خفيف الوزن الحوسبة التقنية تطبيع، سهلة نشر لهم في القائمة. أجرينا عليها اختباراتنا في CIFAR10، STL-10 و ILSVRC2012 مجموعة البيانات التطبيع الطيفي للفعالية، والتي أكدتها التجارب فيما يتعلق بالتدريب ومستقر GAN التدريب التقني أولئك الذين يستخدمون المقترحة سابقا الطيفي GAN التطبيع (SN-GAN) يمكن نفس نوعية البناء وصور أفضل.

ببساطة، تقترح هذه الورقة طريقة الوزن الجديد تطبيع لتحقيق الاستقرار في التدريب الممي. في ورقة وكتب الباحثون أن طرق التطبيع التي يجب أن يتم تعديلها على وسيطة طويلة، فمن يبشيز ثابتة، وإذا لم يكن ضبط هذا فرط المعلمات ويمكن الحصول على أداء مرضيا. وبالإضافة إلى ذلك، خوارزمية بسيطة، قليلة التكلفة الحسابية إضافية.

أوراق عنوان: الشبكي: //openreview.net/pdf معرف = B1QRgziT-؟

جي وون تقارير جديدة: فئة GAN 1000 يولد كافة الكائنات ImageNet

3. cGANs مع الممي الإسقاط

تاكيرو Miyato، ماسانوري كوياما (2018)

وتقترح هذه الورقة طريقة جديدة تقوم على الإسقاط، المعلومات الشرطية (معلومات المشروطة) في الممي GAN. هذا الأسلوب هو حاليا معظم شروط GAN الإطار (cGAN) هو مختلف، وكان متصلا متجه الميزة بواسطة استخدام المعلومات حالة (جزءا لا يتجزأ) حالة النواقل. مع هذه التعديلات، فإن الباحثين لتوليد أعلى بكثير من نوعية النتيجة المثلى الحالية في الصف صورة ImageNet المشروطة، ويتحقق زوج واحد فقط منها من قبل مولد والممي. فإن دراسة تمتد أيضا إلى تطبيق فائقة الدقة، وتوليد عالية الجودة الفائقة دقة وضوح الصورة بنجاح. الرمز، والصور، وتدريب ما قبل جيل نموذج متاح.

الرسالة: الشبكي: //openreview.net/pdf معرف = ByS1VpgRZ؟

الرمز: الشبكي: //github.com/pfnet-research/sngan_projection

4. عالية الدقة صورة توليف والتلاعب الدلالي مع شرطي GANS

T-C وانغ، M-Y ليو، J-Y تشو (2017)

البحوث، Pix2pixHD استخدام حالة من جامعة كاليفورنيا في بيركلي ومن تركيب صورة NVIDIA GAN HD وتجهيز (القرار 2048x1024)، FIG إدخال الشرح الدلالي، يمكن للنظام توليد صورة واقعية عن العالم الحقيقي، على سبيل المثال في الشوارع والوجه.

الباحثون اقتراح مولدات متعددة النطاق والهندسة المعمارية التمايز، جنبا إلى جنب مع مواجهة جديدة تعلم دالة الهدف. وقد اظهرت النتائج ان الظروف غان قادرة على تجميع عالية الدقة، الصور الفوتوغرافية واقعية دون أي خسارة أو اليدوي شبكة المدربين قبل.

ليس ذلك فحسب، يقترح المؤلفون طريقة تسمح للمستخدمين تحرير تفاعلي مظهر الكائن، أثرت بشكل كبير على أنواع البيانات التي تم إنشاؤها. على سبيل المثال، في الفيديو التالي، يمكنك العثور على المستخدم لتحديد استبدال اللون والشارع نموذج سيارة، إضافة إلى بعض أشجار الشوارع FIG، اكتب الشارع، أو تغيير (على سبيل المثال، في مفترق طرق الطريق ملموسة). وبالمثل، عندما الدلالي الشرح FIG الاصطناعية الإنسان الوجه، صورة وجه الدلالي الشرح معين، يمكنك اختيار مزيج من ملامح الوجه، لون تغيير حجم، إضافة لحيته وما شابه ذلك.

وأشارت المادة من الكتاب إلى أن طريقتهم يمكن أن تمتد إلى مناطق أخرى، وخاصة في مجال الصور الطبية مثل عدم وجود شبكة المدربين قبل.

مشروع وأطروحة: الشبكي: //tcwang0509.github.io/pix2pixHD/

5. هل GANS خلقوا متساوين؟ A كبيرة النطاق دراسة

M وسيتش، K Kurach، M ميشالسكي، S جيلي، O بوسك (2017)

هذه دراسة من الدماغ جوجل للفريق، ونموذج GAN المتميز بهم ظهرت مؤخرا MM GAN، NS GAN، WGAN، WGAN GP، LS GAN، دراغان، وبدأ وكأنه مقارنة أداء موضوعية وجدت أن هذا النموذج لا يدعي أن تكون مثلهم كما أفضل من GAN الأصلي.

وقال الباحثون انهم كانوا منصفين، مقارنة شاملة من دولة من بين الفن وبعض نموذج GAN أثبتت تحت عالية بما فيه الكفاية لحساب وضع الميزانية، وكلها تقريبا التي GAN يمكن أن تحقق قيمة الاستثمارات الخارجية المباشرة مماثلة.

الأدلة التجريبية على (الميزانية تحسب لاستنساخ هذه التجارب عبارة عن ساعات 60K P100 GPU) من أجل مقارنة أداء في GAN ثبت، من الضروري أن يقدم تقريرا عن نتائج ملخصا للتوزيع، بدلا من مجرد الإبلاغ عن أفضل النتائج، لأن هناك عملية التحسين عشوائي ونموذج عدم الاستقرار.

إيان غودفلوو تعليقك على هذا العمل: الباحثون ML، المراجعين، والحاجة إلى تأثير نتائج متانة الإحصائية والمعلمات الالتراس دراسة أكثر خطورة من التقارير الإخبارية حول ML. وهذا يدل على الدراسة انه خلال العام الماضي الكثير من ورقة فقط لمراقبة خطأ المعاينة، وليس تحسنا حقيقيا.

الرسالة: الشبكي: //arxiv.org/pdf/1711.10337.pdf

جي وون تقرير جديد: [جوجل الدماغ فريق GAN تقرير رسمي البيئي] ستة أنواع من النموذج الامثل GAN المقابل، فإن أفضل ما زالت النسخة الأصلية

6. التدريب تحسين من اسرشتاين GANS

Gulrajani، F أحمد، M Arjovsky، V دومولين، A كورفيل

توليد المواجهة شبكة (GANS) هو نموذج قوي جدا، ولكن في هذه المرحلة هو التدخل لا يزال يتم تدريب مشكلة عدم الاستقرار. اقترح اسرشتاين مؤخرا ضد شبكة (WGAN) من حيث استقرار GANS تدريب التقدم المحرز، ولكن لا يزال بعض الأحيان تنتج سوى عينات ذات جودة منخفضة، أو مشاكل غير التقارب يبدو. الطريقة المقترحة في هذه المقالة WGAN الأداء المتفوق من المعيار، في الحالة التي يكون فيها معلمات التوليف تقريبا أي عظمى، GAN يمكن أن تضمن هياكل مستقرة من التدريب المختلفة، بما في ذلك نموذج ResNets طبقة 101 واستنادا إلى بيانات منفصلة نموذج لغة.

المساهمة الرئيسية من هذه المادة على النحو التالي:

قان ضمان مجموعة متنوعة من هياكل التكوين مستقر

ضد شبكة الجيل المقترح ((WGAN-GP) على أساس العقوبة متدرجة، ويمكن أيضا ضمان تدريب مستقرة

تم تحسين استقرار هيكل نموذج مختلف التدريب GAN وأظهرت مشكلة تشذيب تحسين أوزان النتائج، ولكن أظهرت الورقة أيضا توليد صور عالية الجودة والأحرف على مستوى لا أخذ العينات منفصلة لل اللغة تحسينات في الأداء النموذجي.

هذه النتائج التجريبية هو مبين في الجدول رقم 1:

الجدول 1

الرسالة: الشبكي: //arxiv.org/pdf/1704.00028.pdf

7. StackGAN ++: صورة واقعية التجميعي مع شبكات الخصومة المولدة مرصوف

هان تشانغ وآخرون.

وعلى الرغم من العداء التي تم إنشاؤها بواسطة شبكة (GANS) في مجموعة متنوعة من المهام حققنا نجاحا ملحوظا، لكنها لا تزال تواجه تحديات في توليد الصور ذات جودة عالية. هذا ويعرض ورقة مكدسة ضد شبكة الجيل (StackGAN)، والأهداف هي جيل صورة واقعية عالية الدقة.

أولا، نقترح هندسة الشبكات الجيل ضد كومة يتكون من مرحلتين GAN-V1 للنص - تركيب الصورة. وصف نص معين، ويصور GAN في المرحلة الأولى على الشكل الأصلي ولون الجسم، مما أسفر عن الصور منخفضة القرار. في المرحلة الثانية، وصورة قرار منخفضة GAN ونص الوصف من المرحلة الأولى كمدخل ويولد صورة واقعية عن تفاصيل عالية الدقة.

ثانيا، نقترح هندسة الشبكات متعددة المراحل يولد العداء التي StackGAN-V2، للقيام بمهام الجيل المشروطة وغير المشروطة. StackGAN-V2 هيكل شجرة اقترحه عدد وافر من المولدات الكهربائية وتكوين الممي. فروع مختلفة من شجرة قد تولد التعددية المقابلة من صور من نفس الحجم المشهد. من خلال نهج مشترك لعدة الموزعة، StackGAN-V2 تظهر أكثر استقرارا من نتائج التدريب StackGAN -v1. وهناك عدد كبير من التجارب تبين أنه في توليد صور عالية الوضوح، ورقة يقترح مكدسة ضد توليد أداء الشبكة أعلى من أي مرحلة أخرى من مراحل ميزة الخوارزمية. اقترح النموذجي في المادة هو مبين في الشكل 1:

الرسالة: الشبكي: //arxiv.org/pdf/1710.10916.pdf

8. الشبكات العصبية العميقة توليدي-الحفاظ على الخصوصية تدعم تبادل البيانات السريرية

B K. بوليو جونز، Z S وو، C ويليامز، C S. غرين (2017)

على الرغم من أنه من المسلم به عموما أن تبادل البيانات لتعزيز التطور السريع للعلوم، ولكن لحماية خصوصية المشاركين أعاقت الطلب معقول ممارسة الطب. ، وتدريب البيانات لتدريب الشبكة العصبية عن طريق توليد البيانات عمق محاكاة للمريض. SPRINT إلى التجربة، على سبيل المثال، والتجارب يمكن تعميمها لإظهار البيانات الأولية التي تم الحصول عليها من خلال نماذج التعلم تدريب الجهاز باستخدام بيانات المحاكاة. من خلال الجمع بين مختلف المستخدمين والخصوصية، ويمكن أن الطريقة المقترحة تضمن بيانات نموذج قوي قد تتوافق مع كل من المحققين جمعت مجموعة البيانات.

لبناء الباحثون مجموعة من البيانات الانتهاء، يمكنهم استخدام الطريقة المقترحة في ورقة، لتوفير وصول الجمهور إلى الإصدار استخدام الشخصي من مجموعات البيانات للموظفين ذات الصلة بالبحث العلمي البحوث. حتى في خصوصية الظروف تحتاج إلى النظر فيها، ويمكن أيضا أن يتم نشر البيانات الناتجة مع رمز ذات الصلة، خوارزميات تسمح للباحثين آخرين لإعادة إنتاج. من خلال التصدي للتحديات تبادل البيانات، وعمق الشبكة العصبية يمكن أن تسهل مجموعات البيانات السريرية التحقيق تكرار صارمة.

الرسالة: الشبكي: //www.biorxiv.org/content/early/2017/07/05/159756

9. الخصومة تباين بايز: توحيد تباين Autoencoders والمولدة الخصومة الشبكات

L Mescheder، S Nowozin، A جيجر (2017)

تباين التشفير التلقائي (VAEs) هو تعبير نموذج يحتمل متغير من التوزيع الاحتمالي للتعلم معقدة من بيانات التدريب. ومع ذلك، فإن نوعية النتائج تعتمد على نموذج المنطق نموذج المهارات. هذه الورقة يدخل مواجهة من نوع التباينية بايز (AVB)، وهو متغير لصناعة السيارات القطار الترميز باستخدام نموذج الاستدلال على اي تعبير عن التكنولوجيا. ويتحقق ذلك من خلال تقديم ورقة هدف ثانوي لتحديد الشبكة، تسمح هذه الشبكة إعادة تعريف المشكلة أقصى احتمال والقضايا ذات اللعبة، وبالتالي توليد المواجهة بين VAEs وأنشأت قواعد الاتصال بالشبكة.

وأظهرت النتائج أنه في ظل ظروف المعلمات غير تقييد، وسيلة لتوليد المعلمات نموذج يمكن الحصول على أقصى تقدير الاحتمالات، ويمكن الحصول على توزيع الخلفي بدقة من خلال مراقبة المتغيرات الخفية. هذه الطريقة تختلف عن المنافسة والجمع GANS VAEs من الأساليب المقترحة في ورقة لها أساس نظري واضح. والخوارزمية القياسية تحتفظ معظم مزايا التباين التلقائي للترميز، وأسهل للتنفيذ. . نموذجية خوارزمية المقارنة كما هو مبين في الشكل افي المعيار:

binarized النتائج على MNIST مجموعة البيانات كما هو موضح في الجدول رقم 2، على التوالي، ويستند VAEs AVB تحسين خوارزميات مختلفة. ويمكن الاطلاع على حسب الجدول نتيجة التحليل، يمكن أن الخوارزمية المقترحة الحصول على أفضل خدمة في عدد binarized مجموعة البيانات تقدير MNIST احتمال. في الجدول رقم من النصف الثاني من تقديرات احتمال لا يتم الحصول عليها عن طريق AIS، ولكن في طريقة أخذ العينات أهمية.

الجدول 2

الرسالة: الشبكي: //arxiv.org/pdf/1701.04722.pdf

10. التدرج أصل GAN الأمثل هو مستقر محليا

V Nagarajan، J. Z Kolter (2017)

على الرغم من أن يتم إنشاء تطبيق على الشبكة (GANS) أصبحت بارزة على نحو متزايد، ولكن يبقى GANS الأمثل قضية شائكة. وتحلل هذه المادة على شكل GANS الأمثل أساس النسب التدرج، على سبيل المثال في البيئة الطبيعية، وتولد المعلمة التمايز أثناء استخدام قطرة الانحدار صغير. ثبت أنه حتى بسيطة مشكلة المعايير والثوابت، GAN الأمثل لا مشاكل الأمثل تتوافق والمخالفات. في ظل الظروف المناسبة، لالقواعد التقليدية للخوارزمية GAN، نقطة التوازن في عملية التحسين لا تزال مستقرة مقارب.

من ناحية أخرى، أثبتت الورقة أيضا اسرشتاين GAN اقترحت مؤخرا للحد من فترات عدم التقارب عندما تقترب نقطة التوازن. مستوحاة من هذا التحليل الاستقرار، وتقترح الورقة طريقة جديدة لتنظيم، لاستكمال التدرج أصل GAN، وذلك لضمان استقرار GAN WGAN المحلية والتقليدية، ولكن أيضا في نموذج العملية وتسريع التقارب الفشل من حيث آفاق التطبيق العملي.

وتظهر النتائج المقارنة أدناه، على اليسار باستخدام طريقة التدرج تسوية النتائج FIG، نتائج الجانب الأيمن من FIG DCGAN بنية التقليدية التي تم الحصول عليها بعد المقابلة تكرار النتائج 1،4،20:

الرسالة: الشبكي: //arxiv.org/abs/1706.04156

المصدر: الشبكي: //weibo.com/ttarticle/p/showid=2309404212119326295632

طريق الحرير

[ايان غودفلوو قوي دفع] تقدم GAN تتبع 10 ورقة كبيرة (مرفق التحميل)

ماذا سيكون زرع الآفات والأمراض الكستناء؟ كيف الوقاية والسيطرة؟

طازجة المجتمع: بعد أحد المتاجر، والاستفادة المقبل في السوق منفذ تريليون؟

جينغدتشن كلية مشروع نقل آخر التطورات، جنبا إلى جنب يشعر "سرعة Fuliang" ذلك!

تم إرسال الشكوى للتعبير عن خسرت بوضوح، الحقيقة وراء معضلة

الأكثر تميزا من 12 الصغيرة، 2019 لإكمال قطعة.

[شمال] بدأ AI الفئة المفتوحة الربع الثاني من الرعد التحدث: كيفية بدء الشركات لكسر احتكار BAT

علي نمو إيرادات التجزئة الجديدة من أكثر من 340 في المئة، الجوع، ما هي الكلمة من فمه "الاندماج"، حياة الصيد المحلية

كيفية زراعة ذات العوائد العالية الذرة الصيف؟ الذرة الصيف الشمالي المزروعة إدارة التكنولوجيا

هاينان القطار الناس كيف يذهب إلى المنزل؟ الله التشغيل يحدق أصدقاء البر الرئيسى ......

فرنسا هي معظم العمل الرائع من ثمانية أنواع من الطعام، ولكن الهجوم المضاد لمغرور الصيني؟

المشي في مفترق طرق تجارية جديدة تاوباو، بشرت في 15 عاما من معظم التغييرات الهامة

جوجل آلة التعلم دورات مفتوحة! جوجل AI تحرير برامج تعليمية لإدارة الدعم المفتوح الصينية

إكسياوجان مدينة الصينية الرسم الجمعية، التي تأسست

متعدد Dmall مع تينسنت لتحقيق التعاون رأس المال، وزيادة الوزن Wumart متجر تشانغ في إعادة بدء؟

الثقيلة: DeepMind الاعلان عن تعزيز العام التعلم نموذج جديد، يمكن للروبوت يتعلم أي مهمة

هذه الحزمة تسمح لك لإلقاء نظرة مهرجان الربيع محاربة العمل الإضافي خريطة صرخة لا يفقد!

التجزئة الساخن أسبوع واحد | الجياع ذلك كلمة في الفم "الاندماج"؛ Jingdong لمكافحة الفساد ورفض 16 شخصا

حول متعة في ذلك، وكان الاسباني خطيرة.

قدم إكسياوجان الصفقة الجديدة، بعد بدوره المعلم لتحسين معاملة الأصدقاء ~

المحتوى IP، وإمدادات الاكتئاب سلسلة والمجتمعات ورفع مستوى الاستهلاك، وكيفية الاستفادة من الفرص التجارية الجديدة؟

البلدة القديمة، في أوروبا والولايات المتحدة ببساطة إلى السماء!

أي أعلى من الجبل الرجل! فقد كلتا ساقيه، 69 عاما، كان لا يزال يقف على قمة جبل ايفرست

الأحكام ذات الصلة