GAN يمكن تجميع خريطة 2K عالية الوضوح! يمكن تغيير تفاصيل يدويا | ورقة + كود تنتجها نفيديا

الصيف B آن مترجم الانتهاء

إنتاج و qubit | عدد ملفه QbitAI

أدخل خريطة الدلالي -

سوف تكون قادرة على استعادة العالم بأسره.

أدخل عرض الدلالي الشرح من الأم الحقيقية لن تعترف لهم في -

يمكنك تجميع وجه بشري حقيقي.

سمارت كنت قد لاحظت، ودعا pix2pixHD ميزات مذهلة، يمكنك إنشاء نوع من الظروف شبكة (شروط GAN)، يتم تقليل والدلالي الشرح من الصورة لتبدو وكأنها في العالم الحقيقي. pix2pixHD الاصطناعية دقة وضوح الصورة تصل إلى 2048x1024، وCRN، pix2pix مقارنة أداة صورة أخرى التوليف يمكن العثور عليها، pix2pixHD تأثير أمامنا بوضوح العديد من شارع!

 pix2pixHD وpix2pix، CRN مقارنة الرسم

ومن المثير للاهتمام، حتى لي Feifei الطلبة المتفوقين، والآن تسلا الذكاء الاصطناعي ورؤية القيادة التلقائي هو أيضا رئيس أندريه Karpathy على صاح تويتر "تدربت شقيقة أوزة جدا!"

في نهاية المطاف هو كيف نفس الشيء؟ على متن الحافلة، وذهبنا لإلقاء نظرة على الأوراق.

تأثير مذهل

pix2pixHD يكون الشرح الدلالي من الصور عن طريق الحد من قدرة العالم الحقيقي، وتحتاج أيضا إلى تعديل بسهولة وصور المباراة على أساس. يمكنك استبدال نماذج مركبة والألوان مفتاح، تغيير نوع الشارع، وحتى يمكن إزالة الصورة ضمن مشهد الصورة وحتى زيادة في الأشجار.

وراء خريطة الدلالي، غنية في العالم الحقيقي.

 أدخل الخريطة الدلالية

 يختلف الانتاج مشهد مركب

pix2pixHD ليس فقط في الرسم البياني الدلالي الشارع إلى صور حقيقية، وحتى يتحول وجهه.

والشوارع ما شابه ذلك، وفقا لالدلالي الشرح من صور الوجه، ويمكننا اختيار مزيج من عيون ملامح الوجه الشعب والحاجبين واللحية وغيرها، ويمكن أيضا ضبط حجم الميزات على خريطة ملحوظ.

ما إذا كانت الزيادة في الشارع والحد من الأشياء، أو لتغير وجه ملامح الوجه هي قابلة للتعديل من خلال واجهة كاملة. واجهة مماثلة تماما لواجهة العديد من اللباس مع لعبة بات مان لتحقيق "نقل بنقرة واحدة" و "مفتاح التغيير العين"، لحية طويلة، وتغير اللون، فهي النقر على شيء الماوس.

يمكن فقط الحصول على pix2pix 256 256، وكيف تصبح "أوزة شقيقة المدربين،" pix2pixHD ذلك؟ دعونا ننظر في التفاصيل التقنية.

شبكة الهندسة المعمارية

لتوليد صور عالية الدقة مباشرة العمارة pix2pix هي بالتأكيد لا. في ورقة يقول المؤلفان، حاولوا والتدريب عدم الاستقرار الناتجة جودة الصورة ليست مرضية.

لا تزال لديها على أساس التحول.

وهكذا، لأنها تستند إلى pix2pix، ويضيف "من الخام لمولد غرامة (خشن ل-

مولد غرامة) "، بنية الممي متعددة على نطاق ومواجهة قوية تعلم دالة الهدف.

من الخام لمولد غرامة

مولد تتكون من شبكات فرعية G1 و G2، G1 يولد شبكة عالمية، G2 هي شبكة تعزيز جزئية. اثنين من الشبكات الفرعية المستخدمة في الجمع، وهيكل هو مبين أدناه:

حيث يتم احتساب G1 القرار 1024 512، وقرار إخراج G2 صورة موسع إلى 4 مرات، أي الأفقي والعمودي على التوالي تضاعفت 2،2048 1024. لتوليد صور عالية الدقة، ونفس الشيء يمكن أن يقترن مع شبكة التسليح المحلية، والناتج 4096 2048 من FIG.

في تدريب هذه المولدات، أول باني التدريب العالمي، ومن ثم تدريب تعزيز المحلي، ومن ثم صقل المعلمات الشاملة لجميع الشبكات.

متعدد المقاييس الممي

صور عالية الدقة تولد ليس فقط ولكن من الصعب، والسماح للكمبيوتر من الصعب تحديد الصواب والخطأ.

لتحديد عالية الدقة صورة حقيقية أو الاصطناعية، وكنت في حاجة الى الكثير من الممي الحقل تقبلا، وهذا يعني، إما عن طريق شبكة عميقة، إما مع حبات الإلتواء كبيرة. وكلتا الطريقتين زيادة الطاقة الاستيعابية للشبكة، يؤدي بسهولة إلى أكثر من المناسب، ولكن يأخذ أيضا تدريب المزيد من الذاكرة.

باني مع ذاكرة انتزاع؟ لا، لا. حتى هذه الورقة يقترح المؤلفون فكرة جديدة: الممي متعددة النطاق، وهذا هو، مع ثلاثة الممي لتحديد الصور الحقيقية والزائفة من قرارات مختلفة.

مبين، هذه تمارس التمييز ثلاثة D1، D2 و D3 ديك تكوين شبكة الاتصال نفسه، ولكن كما هو مبين أعلاه في الصور التدريب من مختلف الأحجام. عن طريق الحد من صورة عالية الدقة عينات مرتين، وتوليد ثلاثة أنواع من حجم الصورة، ثم تدريب الممي D1، D2 و D3، على التوالي، للتمييز بين الصور الحقيقية والكاذبة من ثلاثة أحجام.

الممي على خشونة نطاق الحد الأقصى الحقل تقبلا، بحيث تكون الصورة هي المسؤولة عن الانسجام العالمي، ومعظم الممي غرامة على نطاق مسؤول عن توجيه مولد يولد تفاصيل غرامة.

تحسين وظيفة الخسارة

وظيفة LGAN موضوعي (G، D) من شرطي GAN

أساس والتمييز على أساس pix2pixHD ويدخل فقدان مطابقة الميزة، بعد مولد التدريب يولد أحجام مختلفة أكثر صورة طبيعية، فإن الخسارة تكون مستقرة.

ميزة مستخرج الممي كمبوتشيا الديمقراطية ط عشر وأعرب عن طبقة كما D (ط) ك، حيث يمكن التعبير عن وظيفة فقدان مطابقة على النحو التالي:

إكمال المهمة الموضوعية التالية، وتتضمن فقدان GAN وفقدان مطابقة الخصائص:

من الدلالات صورة توقيع توليفها

وكثيرا ما تستخدم الجيل صورة توقيع الدلالي (خرائط علامة مميزة الدلالي)، ولكن واضعي يعتقد المثال في الشكل (خريطة سبيل المثال) أهم المعلومات غير المدرجة في الشكل الترميز الدلالي.

على سبيل المثال، شخصية، جميع السيارات تنصهر، لا يمكن فصلها، والتي تحتاج لحساب المثال أعلاه من FIG ب هو مبين في الشكل الحدود (مثيل خريطة حدود).

مثال على خريطة حدود، على الصورة التي تم إنشاؤها في الحالة التي يكون فيها وتفاصيل سيارتين FIG لا يظهر غير واضح.

بعد حل الخاصة الدلالي خريطة العلامات عيب فيها، هناك مشكلة: قلنا في وقت سابق على الخريطة للحصول على كل كائن يمكن السيطرة عليها بشكل فردي، هو كيفية تحقيق ذلك؟

في pix2pixHD، والكتاب من أجل توليد ملامح منخفضة الأبعاد، وهي شبكة E تدريب الترميز لإيجاد وفي كل حالة الهدف الحقيقي الموافق ناقلات منخفضة الأبعاد. وبالإضافة إلى ذلك، فإن استخدام المبرمج القياسية - فك ترميز مخطط لها.

من أجل ضمان التنسيق الداخلي يتميز كل حالة، والكتاب في إخراج التشفير يضيف مثالا طبقة الخلايا متوسط المستوى، لحساب متوسط المثال الميزة. يتم بث هذا متوسط ثم هذه الميزة لجميع الحالات من مواقف بكسل، كما هو مبين أدناه:

من pix2pix إلى HD

من الاسم إلى العمارة، ويمكن أن يقال هذا pix2pixHD أن تكون نسخة مطورة من pix2pix.

هذه الورقة الجديدة أساسا من نفيديا، ولكن يخلط مع واحد من جامعة كاليفورنيا، بيركلي يونيو يان تشو، تسينغهوا سلسلة العلوم جامعة كارنيجي ميلون بيركلي با، الرقيق القط، ولكن أيضا لpix2pix من اثنين.

المختبر حيث ساهم العديد من الأوراق في مجال الهجرة تكوين صورة والاسلوب، ولكن أيضا ضمير جدا أن يكون فتح شفرة المصدر.

الذي، pix2pix نطاق واسع، على سبيل المثال، العديد من المعروف تجريبي التغيير الفني الصورة، تقوم على pix2pix، واحدة من الاكثر شهرة ومتعة، وربما عدد قليل سوف تكون قادرة على رسم بسهولة القطط edges2cats.

التجريبي شعبية رسم القطط التي جاءت لتكون الأصدقاء للعب مجموعة متنوعة من آفاق جديدة، بت الكم قبل الانتهاء من تجميع روح الفنان، وقد جمعت العديد من "تحفة".

أيضا pix2pix القائمة على اللوحة الأحذية اللوحة مجموعات رسمت المنزل، وهناك سلسلة من العرض، يمكنك أن تبدأ المحاولة: الشبكي: //affinelayer.com/pixsrv/index.html

الكتابة على الجدران أيضا استخدامها لتصبح وجها إنسانيا، لون مطابق لتفعله حيال ذلك، مشغول جدا.

الآن، مع نسخة عالية الوضوح من pix2pixHD، نفس رمز المصدر المفتوح، ولكن أيضا أن تلعب لا أعرف ما حيل جديدة.

نتوقع ~

روابط ذات علاقة

pix2pixHD

الرئيسية: الشبكي: //tcwang0509.github.io/pix2pixHD/

الرمز: الشبكي: //github.com/NVIDIA/pix2pixHD

الرسالة: الشبكي: //arxiv.org/abs/1711.11585

pix2pix

الرئيسية: الشبكي: //phillipi.github.io/pix2pix/

يونيو يان تشو

الصفحة الرئيسية: http: //people.eecs.berkeley.edu/~junyanz/

- كامل  -

التوظيف الصادق

المكدسة تقوم بتجنيد محرر / مراسل، ومقرها في تشونغ قوان تسون في بكين. نتوقع الموهوبين والطلاب المتحمسين للانضمام إلينا! مزيد من التفاصيل، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "تجنيد" كلمة.

و qubit QbitAI عناوين على التوقيع

' " تتبع تقنيات AI دينامية جديدة والمنتجات

تسببت ثلاثة عوامل نيمار هذا الركود الموسم

ومن المتوقع أن شريك المدافع Hengda جين بينجكسيانج! مقابلة مع الغضب مثل المالك الجديد، عبارة تسليط الضوء على الذكاء العاطفي عالية

سيتم سرد Zotye T600 الجديد في 10 أكتوبر أجزاء التعرض

ملك المجد أقوى بطل! 3 ثوان دبابة مدفع كاملة من الدم، مما اضطر يوم الطوارئ الولايات المتحدة تحت الرف حتى إعادته

الحزب عقد الأماكن Neiyuan، اختيار قادة Hengda؟ حقيقية النواة أبدا بديلة! 1 شخص غير مرغوب فيه

لا ينخدع! بحفر H2 SUV معلقة حقا وحدها في السوق، ما يزيد قليلا عن 70000

ضد البرد الحالية كما طرح الأول من النهاية "سلسلة كتلة" جولة في الصين، يمكن للاعبين التعدين في اللعبة!

شينهوا أكثر قوة! وقد ترك والمباركة مع قطني قوي تشين شنغ، وكسر واحد من جبابرة الهدف من الجنسية الصينية

قاد هارفارد H6 الجودة جريت وول موتورز فاز الدورة 2018 للجودة "أعلى جائزة"

الدوري الألعاب الآسيوية النهائية إعادة تحميل الفيديو، والسبب الحقيقي هو في الحقيقة كوريا قيام شبح!

الهولندي حارس مرمى برشلونة الحارس يحتاج إلى تعلم لتصبح منذ مواطنه كأس عشرين عاما

سوف Hengda 7 ترك ستة أشخاص العاطلين عن العمل؟ وتشير التفاصيل التي فنغ سياوتينغ ترك الفريق، وحافظت على موقف المخاطر القاتلة!