أسوأ GAN: رسوم التدريب من 10 مليون حالة والخبرة الآن حرة، ولكن أيضا أسلوب واقعي Kichiku

آني شياو شيا قوه Yipu شركة B الاختيار من أسفل خليج و qubit تقارير | عدد ملفه QbitAI

الخبر السار! الخبر السار!

في نهاية سبتمبر ضربت صناعة أقوى في GAN التاريخ، وهو أعلى استخدام BigGAN 512 أوقات التدريب TPU، لقد تم الافراج تجريبي رسميا!

طالما كمبيوتر مع الوصول إلى الإنترنت، ويمكن استخدامه لتوليد مجموعة واسعة من صور واقعية.

فهم كيفية جعل الكمال الدهون تمساح أفريقي التدرج للوصول ~

وهذا يعني أنه من دون الحاجة إلى إنفاق 10 حتي 70000000 تكلفة استئجار TPU تدريب شخصيا، ببساطة فتح عنوان الإفراج DeepMind، يمكنك تجربة شخصيا الشعور الهيمنة BigGAN.

BigGAN تجريبي تجربة غزاة

مسؤول DeepMind يعطي تجريبي 128256512 ثلاثة أحجام.

ولكن بغض النظر عن أي واحد منكم فتح، Colab في التقصير والتجريبي 256، وأبعاد أخرى لضبط نفسها يدويا.

قبل مجموعة

بعد الافتتاح، لضمان توصيل الشبكة، كل كتلة التعليمات البرمجية واحدا تلو الآخر ثم قم بتشغيل مرة أخرى.

أولا، وتحديد مسار وحدة https://tfhub.dev/deepmind/biggan-256/1

ثم أكمل سلسلة من الإعدادات، اتصل TensorFlow.

بعد تحميل نموذج BigGAN من TF المحور.

تعريف وعرض وظائف لأخذ عينات صورة BigGAN.

إنشاء جلسة TensorFlow، تهيئة المتغيرات.

الجيل عينة واحدة

بعد هذه الاستعدادات، يمكننا أن نبدأ رسميا اللعب BigGAN تصل.

هناك أربعة خيارات الإعداد على الشاشة، أن ننظر في الماضي فئة ما كان لتحديد ما الذي تم إنشاؤه، القائمة المنسدلة في ما مجموعه 999 أصناف للاختيار من بينها، وسوف نستخدم الافتراضي 933 نوعا من الجبن برغر لمحاولة.

يتم إنشاؤها الخيارات الثلاثة الأولى من معايير محددة، وهي الأولى num_samples يتم إنشاؤها، يمكن تعديل هامبورغ عدد ضمن نطاق 1-20.

في المرتبة الثانية اقتطاع يمكن تعديل بين 0 و 1، وأصغر عدد، ونمط أكثر اتساقا، وهو أسلوب المحافظ.

على أكبر عدد، وزيادة الفجوة بين الرسومات، وغالبا ما تولد صورة كاملة وهامبورغ لا يهم.

ثلث noise_seed البذور الضوضاء، ويمكن تعديل بين 0 و 100، وأكبر هذه القيمة، وشكل همبرغر أكثر البرية.

تشيز يضحك في U ~

كائنات التدرج

تعلم جيلا بعد فقط هامبرغر واحدة، يمكنك محاولة السمة الثانية: كائنات التدرج والعلم اسم أقحم بين العينات BigGAN.

متدرج جيدا تعريف الكائن، التدرج من كائن إلى كائن آخر.

وبطبيعة الحال، لأنها تنطوي على كائنين، في حاجة إلى المحتوى أيضا إلى تعيين بعض أكثر.

دعونا نلقي اختيار كائنين:

الكائن A (category_A): الذهبي المسترد الكلب.

كائنات B (category_B): ذهبية.

كائنين يمكن تعديلها بشكل منفصل noise_seed .

كل إنشاء النتائج شوطا طويلا، كل سطر هو من الذهبي إلى ذهبية عملية تدريجية، وعدد الصفوف هو عدد العينات، أي عدة تدرجات تم إنشاؤه.

بداية المجموعة الاولى num_samples وعدد "عدد الصفوف"، الكائن في شريط التدرج، يمكن اختيار من بين 1-5.

الخيار الإعداد المقبلة num_interps يشير إلى "رقم الإطار" كل عملية تدريجية، وهو "رقم الإطار" أكبر عملية تدريجية أكثر تفصيلا، 2 قد يتم تعيين إلى الحد الأدنى، والحد الأقصى لتكون 10؛

وبالإضافة إلى ذلك يمكنك أيضا تعيين اقتطاع ، والجيل السابق كما عينة واحدة، اقتطاع أكبر فجوة بين أكبر عينات مختلفة.

حسنا، وهذه العملية محددة على هذه، يمكنك العثور على المدخل في نهاية الخاصة بهم من هذه المادة لنفسك ~

وبالإضافة إلى ذلك، هناك الناس حماسا جعل نسخة GIF، هل يمكن أن تصبح تلقائيا عملية تدريجية الكائنات GIF، وأثر هو على الارجح هذا:

نفس نهاية النص يمكن العثور عليها في موقع البوابة.

! مكلفة ! مكلفة تكلفة

هذه تجريبي شعب الأجانب قد بعث برسالة تهنئة، مما يدل على تأثير الصدمة، لدينا العوز صفق للعب، وهناك ...... نظرة جائع.

جوجل الدماغ الباحث طوكيو، تويتر الشهير hardmaru الأحمر على شبكة العلوم والتكنولوجيا، وعلق، اختيار أي GAN، وكيفية اتباع منتصف القائمة همبرغر وجبة الوجبات السريعة مثل.

تويتر المستخدمين - = قال كولين أيضا أن الطعام الناتج هو حقا قليلا واقعية جدا، دراسة أكاديمية جادة لنرى كيف فجأة بالجوع.

بعض مستخدمي الإنترنت يعتقدون BigGAN في صناعة التصميم لديها امكانات كبيرة، وتحويل أسلوبه والجمع بين تنويع المواد وتصميم توجيه أهمية للمصمم.

المستخدمين أيضا محاولة عقد عقلية لتوليد مجموعة متنوعة مع تجريبي، لقد وجدت هذا مدهش أثر يذكر آه.

وهناك شاهد التدفق، إلى جانب محاولات وجبة. "تهانينا! هذا العمل لا يصدق حقا، مثل تفاصيل التجربة فشلت الصور ...... حتى اذا كنا نستطيع اطلاق سراح قانون فإن المجتمع يكون أكثر بالامتنان. وقال المستخدمين elder_price666 ".

ولكن الأخ الأكبر وراء البقاء، وتريد لتدريب خاص BigGAN لها؟ يرجى التفكير مرتين لا يستطيعون تدريب الموارد تحتاج إلى تستهلك آه.

حتى إذا كان من المحتمل أن تحقيق TensorFlow ورمز، يمكنك أيضا المسؤول على تحمل آه!

ووفقا للتفاصيل الواردة في ورقة الملحق، يتم تدريب BigGAN على قرنة TPU. تدريب جيل 128 128 BigGAN صورة نموذج، استخدم 128 جوجل TPU الأساسية. TPU النوى 256 256512 512 نموذج يتطلب في المقابل ارتفع إلى 256 و 512.

المزيد من الرعب هو أنه مع هذا العدد الكبير من حالة TPU، ومعظم النماذج أيضا تدريب 24-48 ساعة، وهو الانتظار ليوم أو يومين لرؤية المنتج النهائي.

ووفقا لسحابة TPU سعر V2 من 4.5 دولار أمريكي للTPU ساعة العد، تدريب النسخة الأساسية من 128 128 BigGAN، وهو معظم الحد الأدنى مع ذلك، يحتاج $ 13800 إلى 27600 $، أي ما يعادل 96000 يوان ليوان 193000 .

أما بالنسبة عالية الوضوح GAN كبير 512 512، ويمكن أن تصل تكاليف التدريب $ 110،000، جنبا إلى جنب 760،000 يوان .

وقال تجريبي واحد، ونحن نحاول الحصول على المتعة الأرز الفواكه في قسم التعليقات في انسجام تام، "هذه ليست الاصطناعية، بل هو مجرد صحيحا، ولكن في الحقيقة مكلفة جدا."

مراجعة أوراق

تأثير مذهل أيضا مكلفة BigGAN من اثنين عبقرية لإطلاق النار، قبل شهر، عندما مجهزة BigGAN مراجعة مزدوجة الأعمى للأوراق الخروج من ICLR 2019، خبراء لدرجة الغليان: فكيف اقعية تأثير؟

في دراسة تاريخ رسومات الحاسوب، BigGAN تأثير تقدما شريحة كبيرة من الذين سبقوهم. على سبيل المثال، 128 128 قرار التدريب على ImageNet، والتأسيس نقاط (IS) 166.3 درجة، وأفضل درجة قبل 52.52 دقيقة 3 مرات .

بالإضافة إلى الحصول على خارج لوحة 128 128، BigGAN ImageNet أيضا مباشرة على بيانات من 256 256512 512 عينات التدريب على توليد أكثر إقناعا.

في ورقة كبيرة الحجم GAN التدريب من أجل الدقة العالية الطبيعية صورة التجميعي والباحثين سر وراء نتائج مذهلة BIgGAN، قام حقا الثمن من المال.

لأن أكثر من نموذج متعددة المعلمة، وحجم التدريب هو أيضا أكبر منذ GAN. ومن 2-4 مرات المعلمات السابقة، وحجم الدفعة هو 8 أضعاف السابق.

جعلت الباحثين GAN العمارة تغييرين على التكيف مع حالة عدم الاستقرار للتدريب على نطاق واسع، مثل نوع القناة الحكم في إجراء تغييرات، بحيث يكون لكل طبقة وحدة في تصفية التفاف الأول وتصفية إخراج تساوي عدد مثل مولد G مع الطبقة مشتركة واحدة جزءا لا يتجزأ، وتوليد الربح وتعويض لكل طبقة BatchNorm العينة.

 المولدات الكهربائية والهندسة المعمارية التوثيق

نتائج التقييم

وقد تم الافراج عن نتائج التقييم BigGAN، وقال انه تلقى ثلاث المراجعين 8 نقاط و 7 نقاط و 10 نقطة تقييم، حاليا 8.45 نقطة بين أعلى خمسة ICLR2019 مائتي الأوراق.

على OpenReview والمراجعين وجهات نظر مماثلة على الورقة التالية:

1) BigGAN لها أداء جيد على مجموعات كبيرة من البيانات، حجم الملف كبير.

2) ذكر الملحق بعض الآثار السلبية، التي تعطي التحسينات المستقبل ساعد.

3) عدم وجود تقنيات اقتطاع المواد واضحة من النماذج الكبيرة، ومناقشة سهلة الفهم.

3 المراجعين تقييم على النحو التالي:

1 تعليق:

التصويت: 8، لقبول أطروحة أعلى 50، وقبول واضح.

الثقة: 4 والمراجعين لديهم ثقة، لكنه ليس من المؤكد تماما أن التقييم هو الصحيح.

تقدم هذه الورقة مجموعة من التقنيات للتدريب على نطاق واسع من GAN والحصول على أحدث نتائج صور عالية الدقة.

المزايا:

- هذه التقنية المقترحة هي بديهية للغاية وهدف واضح

- والميزة الرئيسية لهذا العمل، يحاول الكتاب أن "قياس" التي اقترحها كل سرعة التدريب على تكنولوجيا وتحسينات في الأداء

- تحليل مفصل للكشف تحطم، وزيادة استقرار GAN على نطاق واسع

- كانت نتائج الاختبار للإعجاب

العيوب:

- تتطلب موارد الحوسبة هائلة الميزانية. نموذج BigGAN ذكرت الورقة الأصلية باستخدام TPU 128-256، يحد بشدة من استنساخ النتائج.

خلاصة القول:

ورقة مكتوبة جيدا، واعتقد معقولة جدا، وكانت النتائج مقنعة جدا. هذا هو ورقة جيدة جدا، فمن بقوة قبول الموصى بها.

التعليق 2:

نتيجة : 7، الكتابة الجيدة، لقبوله.

الثقة : 3 والمراجعين لتقييم ما إذا كانت صحيحة واثق جدا.

OF الدراسة التجريبية المقترحة التي أدخلت على تمديد لGAN مجموعات البيانات المعقدة طريقة (على سبيل المثال ImageNet) لتوليد الظروف الصورة القائمة.

أنها أول مرة يتم بناؤه وفقا لتكنولوجيا GAN مؤخرا المقترحة وصفت الأساس القوي، من أجل تعزيز أداء مجموعات كبيرة من البيانات، والوصول إلى قيادة IS / عشرات ااا، والتأثيرات البصرية الرائعة.

ويقترح المؤلفان تقنيات اقتطاع بسيطة للسيطرة على الإخلاص / التباين، والتي هي مثيرة للاهتمام في حد ذاته، ولكن لا يمكن تمديدها مع الهندسة المعمارية. اقترح البلاغ كذلك على أساس متعامد من تسوية للتخفيف من حدة هذه المشكلة.

أجرى المؤلفون أيضا مسح وقوع حادث تدريب على نطاق واسع، ودرسنا عددا من مخطط تسوية على أساس الأدلة التجريبية التي تم جمعها.

المزايا:

- وتنص المادة على عدد من الأفكار حول GAN الاستقرار والأداء في نطاق واسع مجموعة التدريب البيانات. ينبغي أن يكون هذا مفيدا لاستخدام GAN على مجموعات البيانات المعقدة، وعدد كبير من الناس يمكن الوصول إلى أي مورد الحوسبة.

- على الرغم من مؤشرات التقييم المشترك GAN ما زالت غير كافية، ولكن لقياس أداء المكتسبة أبعد من الأعمال السابقة، فإنه لا يبدو أن يرتبط مع تأثيرات بصرية كبيرة.

- الزيادة من التعديلات الأساسية موصوفة بشكل جيد وشرح واضح. الملحق في هذا المجال ذات قيمة كبيرة.

العيوب:

- مناقشة تفتقر أحيانا العمق.

أنا لا أعرف لماذا بعض النماذج الكبيرة لا تناسب اقتطاع.

ويقترح المؤلفان أوسع عمق أداء الشبكة أفضل السبل، وكيفية الحد من أداء الشبكة. هذا النقص نفسه من المناقشة، لا يبدو أن المؤلف في محاولة لفهم الظاهرة لماذا هذا القبيل.

أعتقد أننا يجب أن نحاول بذل جهد أكبر لفهم وتفسير لماذا سيكون هناك بعض الظواهر، فإنه يجعل من الاسهل لتوجيه العمل مستقبلا.

- القسم 3.1: "في الجدول 1، لاحظنا أي تسوية متعامد، 16 فقط من نماذج للاقتطاع، وتنظيم متعامد 60 في المائة" بالنسبة لي، وهذا ليس واضحا بشكل خاص . هذا هو الشيء الذي القارئ ينبغي أن يفهم من الجدول رقم 1؟

- أشك في جزء من النص والملاحق المحدد. وأنا ممتن جدا للجسم ونتائج سلبية ذكرت في الملحق، والتي هي ذات قيمة كبيرة.

ومع ذلك، وهذه المادة هي في المقام الأول بالنسبة لي تحقيق مفصل التجريبية عالية الأداء وعلى نطاق واسع إدخال GAN، وأنا قد تقاسمها مع الزملاء يريدون حل مشاكل مماثلة.

في هذه الحالة، إذا قراء المستقبل يقتصر على النص، وأعتقد أن بعض المحتويات الواردة في الملحق B و C من أكثر من مسح على صفحة كاملة من الاستقرار والمحاولات التي لم تكتمل مهارات أكثر قيمة من الملكية.

خلاصة القول:

نجاح المقالات والبحوث قابلية GAN يمكن، حتى في الأداء العالي دون التضحية ImageNet التدريب الاستقرار ليس مخيبة للآمال. تحسن على SOTA السابق من الضروري للغاية. العمارة الحديثة GAN مجموعات البيانات المعقدة هذا العمل المعارض، ويمكن أن تصبح أساسا متينا للعمل في المستقبل.

ولكن أعتقد أن وينبغي أن يتم ذلك كتابة من قبل تحليلا أكثر تفصيلا ومناقشة سلوك الأداء، لتحسين ورقة، من أجل مزيد من دليل وإلهام عمل المستقبل.

أريد أيضا أن نرى يتم تطبيق هذه التقنية المقترحة على مجموعة من البيانات أكثر بساطة. هذه القدرة الحاسوبية وخفض CelebA الناس مماثل كنت ستفعل؟

التعليق 3:

تصنيفات : 10، الأوراق المقبولة أعلى 5، ورقة المنوية

الثقة : 4 والمراجعين لديهم ثقة، لكنه ليس من المؤكد تماما أن التقييم هو الصحيح

جوهر هذا العنصر الجديد هو قطع النصائح: عندما التدريب، وأخذ العينات ض المدخلات من التوزيع الطبيعي، ولكن في الاختبار، وذلك باستخدام التوزيع الطبيعي اقتطاع: عندما يكون حجم ض عنصر فوق عتبة معينة، ستكون إعادة أخذ العينات. على سبيل المثال، الاختلاف في قيمة العتبة يظهر في النتائج التجريبية في تغيير FD وIS.

وتتضمن المادة النتائج السلبية ومفصل المعلمة التي تجتاح، التي هي أيضا جيدة جدا.

خلاصة القول:

هذا هو عمل جيد جدا، وحققنا انجازات ملحوظة، قد أحرزت تقدما هائلا في مجال مولد الصورة.

بوابة

باني عرض توضيحي:

https://tfhub.dev/s؟q=biggan

مقيم جوجل AI ثيو ساندرسون الإصدار، وأصبحت تشارك في الاستيفاء خريطة التحرك :

https://colab.research.google.com/drive/1MhfEAOBwhGu1A-F2NSVxGQrkJ4vk7w4V

الرسالة: الشبكي: معرف //openreview.net/forum = B1xsqj09Fm؟

البذور جوجل كاري الآخرين GAN تجريبي:

https://research.google.com/seedbank/seeds؟q=GAN

- كامل  -

وظائف التخطيط لهذا الحدث

تحت و qubit هو تجنيد التخطيط لهذا الحدث، سيكون مسؤولا عن مناطق مختلفة من أبعاد الأنشطة عبر الإنترنت وغير متصل التخطيط والتنفيذ. نرحب ذبابة شركاء صغير ذكي للانضمام، ونأمل أن يكون لديك بعض الخبرة في التخطيط لهذا الحدث أو العمليات. مزيد من التفاصيل، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "تجنيد" كلمة.

و qubit QbitAI عناوين على التوقيع

' " تتبع تقنيات AI دينامية جديدة والمنتجات

ثقافة الرياضة الوطنية في بنغ تشنغ! --2018 جولة ثقافية وطنية من محطة شنتشن صلت إلى نهايتها

وجه الفرشاة أسفل توقعات أداء الموردين AI، سعر سهم شركة أبل انخفضت بنسبة الدخن

2018 LOL العشرة أسعار! Sicong تستحق اللاعب الأسطوري، وهو الشخص الذي خلق على حد سواء!

يجري خائفا GIF شخصية محرجة: السائق من الانجيل، وأخت وأفخم لعب للعب مع لفتات المعقدة؟

لاعب خط الوسط شينهوا لعبت عمل خطير مرة أخرى، وهذه المرة شيلين الثناء ولكن لا تؤدي نقاط المستخدمين Nupi

أحدث التصنيف العالمي: فان تشن دونغ تشن منغ اعادة انتخابه أعلى، عاد مالون إلى الأعلى ثلاثة

البخار كيف بائسة؟ مرة واحدة Shuoyibuer الكذب لكسب المال، والآن وقد تم تقريبا جميع الشركات المصنعة الأوروبية والأمريكية تخلت

ثلاث كأس آسيا U23، وسجل الهدف الأول للاعبين الوطني لكرة القدم هي من النادي

وهناك الأنهار والبحيرات حيث يوجد العدو! لعبة فنون الدفاع عن النفس، قتل العدو التي سجلت كلها

أكثر من عامين، وأول أربعة لاعبين الصيني لاول مرة بطولة كوبا ديل ري

"أبطال الاتحاد" 2019 السنة الصينية الجديدة الاحتفال الجلد: نظموا VN سيلرز المتكررة ضربات الهيب عبر

كأس آسيا U23 انتصار تاريخي قادم، لكنه أصيب الناس بالقلق