GAN أربعة انجازا كبيرا تحقق في عام 2017، قد يكون مستقبل لها تأثير على رسومات الحاسوب

ولدت ضد شبكة (GAN، شبكات الخصومة المولدة) بعد أن اقترحت من قبل إيان غودفلوو، مما تسبب في عدد كبير من الباحثين والمطورين لتصميم المزيد من GAN العديد من المتغيرات التي GAN في العام الماضي أصبحت واحدة من أكثر مناقشتها في عمق تقنيات التعلم، شانغ - قبول واسع أستاذ لي هونغ كونغ هونغ لتر مختبر مشترك مقابلة DeepTech، تحليل GAN متعمقة لتطوير بشرت في العام الماضي وتأثير انجازا كبيرا أربعة في ثلاثة أبعاد يجلب.

لي هونغ لتر أعتقد تطوير GAN العام الماضي ويمكن القول أن هناك أربعة انفراجة كبيرة: أولا، عدة مقالات يعرض مهمة جدا الصحيفة عن فقدان وظيفة هو أكثر ملاءمة للGAN التدريب (أو دالة الهدف)، وبالتالي تعزيز GAN قدرات توليد البيانات.

الفيسبوك من قبل معهد الذكاء الاصطناعي (FAIR) ونشره معهد جامعة نيويورك من كولون الرياضيات (CIMS، معهد كورانت للعلوم الرياضية) التعاون "اسرشتاين GAN" (المشار إليها باسم WGAN)، وكذلك من قبل معهد مونتريال للتعلم خوارزمية معروفة (MILA، اقترح معهد مونتريال للتعلم الخوارزميات)، CIMS، المعهد الكندي للدراسات المتقدمة CIFAR) التعاون ( "التدريب تحسين من اسرشتاين GANS" (المشار إليها باسم WGAN تحسين).

الشكل شو "اسرشتاين GAN" بيانات تجريبية

هذا الإنجاز هو الأول من اثنين من الطفرات أوراق GAN، وليس على نحو سلس فقدان وظيفة إلى تعديل، جعل وظيفة فقدان أكثر ملاءمة، وتسبب المتابعة السريعة غوغل وOpenAI، ويأتي كل مع "وكريمر بعد آسا الحل لمتحيزة اسرشتاين التدرجات "و" تحسين GAN استخدام وسائل النقل الأمثل "الأوراق التي جعلت استقرار التدريب GAN، متانة وتم النتائج النهائية تعزيز جيدا.

اختراق الثاني هو أن العديد من المؤسسات GAN تصميم هيكل الشبكة العصبية أكثر مناسبة لإنتاج البيانات الأبعاد عالية التعقيد الآن.

يستخدم GAN الماضي لتوليد إشارة واحدة الأبعاد (مثل اللغة والصوت) وإشارة ثنائية الأبعاد بسيط (على سبيل المثال، والأسود والصور الرقمية البيضاء)، هو يريد من الصعب جدا لتوليد معقدة، وارتفاع الأبعاد إشارة (مثل الصورة الطبيعية)، فإن الباحثين يقترحون المتابعة توليد عمق التفاف ضد شبكة (DCGAN والشبكات التلافيف العميقة المولدة الخصومة)، قد تكون أكثر فعالية نسبيا لتوليد إشارة صورة ثنائية الأبعاد. وجعلت هذا GAN الأول تقدما كبيرا في مجال توليد صورة، بعد أن ظهرت الدراسات التي تستخدم GAN ولدت الصور، والبحث GAN وبالتالي شعبية.

وعلى الرغم من DCGAN، للسماح GAN في عالم ثنائي الأبعاد، للأسف، يتم إنشاؤها من دقة وضوح الصورة لا تزال صغيرة، ومعظم فقط 64 * 64 أو 128 * 128. حتى العام الماضي كان هناك اختراق أكبر، الأول هو سلالة شانغ - الجامعة الصينية في مختبر المشتركة هونغ كونغ وجامعة روتجرز والمؤسسات الأخرى التي StackGAN الخوارزمية، اخترع هيكل الشبكة أفضل العصبي، ودقة الصورة المتولدة من 128 * 128 زادت بشكل كبير إلى 256 * 256، NVIDIA لمواجهة المشاهير لمواد التدريب في وقت لاحق، ويولد شخص مستعار واقعية جدا وفقا للصحيفة، انخفض قرار سحب انقضاض تصل إلى 1024 * 1024، ومرة واحدة عجب العالم الخارجي، غان معركة الشهيرة.

خوارزمية الشكل شو StackGAN ++ لتوليد الكنائس والقطط

وأشار لي هونغ لتر من، GAN هو جزء من نموذج ولدت، والهدف من ذلك هو الاقتراب من التوزيع الحقيقي للبيانات. منذ GAN لم البيانات جعل من نهج أحادي البعد إلى تطوير تعقيد ثنائي الأبعاد من توزيع البيانات، وبالتالي فإن المجال GAN الحالي، إما البحوث النظرية أو التطبيقية، وأكثر من 50 هم من صورة، أو صورة للتحقق من جدوى نظرية جديدة. الآن بعض الناس يريدون الاستفادة من GAN للقيام إشارات ثلاثية الأبعاد، مثل الفيديو. ومع ذلك، في هذه المرحلة حتى آثار صورة ثنائية الأبعاد، GAN ليست مثالية، وبالتالي فإن إشارة ولدت تأثير ثلاثي الأبعاد لا تزال في مرحلة أولية جدا من الاستكشاف.

والثالث هو اختراق للشبكة العصبية GAN ديه أساليب تدريبية جديدة، في اختراق معين أساليب التدريب الشرطي GAN.

GAN المفهوم الأصلي هو متجه الضجيج العشوائي (الضجيج العشوائي) يولد صورة، وهذا ما يسمى GAN غير مشروط، NVIDIA هو مثل لتوليد اسم مستعار بناء على الشخص. يتميز GAN غير مشروط لا تحكم، لا يمكن للمستخدم معرفة ما إذا كان مولد سوف تنتج أي نوع من المحتوى. ولكن عندما تريد ولدت GAN "السيطرة" الوقت المحتوى وكيف نفعل ذلك؟ لذلك، وقد اقترح الباحثون طريقة جديدة، وهذا هو، شرطي GAN، يولد صورة تمشيا مع معايير محددة.

على سبيل المثال، عندما نريد أن تولد من الناس وجه مع عيون كبيرة، الوجه البيضاوي والأنف عالية، شعر أسود وغيرها من الشروط في نموذج التدريب، الجهاز سوف نفعل ذلك وفقا لهذه الشروط المعمول بها، دون توليد الظروف خارج (مثل عيون صغيرة، مستديرة الوجه، وما إلى ذلك) الوجه.

ومع ذلك، لتدريب شرطي GAN الافتراض هو الحاجة إلى بيانات تقرن (البيانات المقترنة). وفي العام الماضي، اقترحت جامعة كاليفورنيا، بيركلي (جامعة كاليفورنيا في بيركلي) CycleGAN، من أجل حل هذه المشكلة.

الشكل شو شرطي GAN شخصية للرسوم المتحركة ولدت

مضمون الورقة هو إدخال "حصان" الصور، وبالتالي فإن الجهاز يمكن أن تولد "حمار وحشي" صورة للنهج شرطي GAN الماضي مطلوب صورة حصان وحمار وحشي، والسماح للآلة تعرف المراسلات مفصلة بين البلدين مثل رأس الحصان الموافق رأس حمار وحشي حيث أرجل الحصان وقدم المقابلة لحمار وحشي حيث كما هو معروف البيانات المقترنة. ولكن لإقامة مثل هذه العلاقة الحساسة ليست سهلة، تستغرق وقتا طويلا واحد، وثانيا، قد يكون من الصعب الحصول على مثل هذه المعلومات، ونهج CycleGAN هو اعطاء كومة من كومة من الحصان وصورة حمار وحشي، بدءا من الخيول التدريب لالحمر الوحشية، وبعد إعادة تدريب من الخلف الجهاز إلى حمار وحشي الحصان.

CycleGAN كسر الحد في شرطي GAN الماضي يتطلب تسميات يقترن دقيق، لا إنشاء واحد لرسم الخرائط واحد بين بيانات التدريب والمناطق المستهدفة في المجال الأصلي، يمكنك تحقيق تأثير تحويل الصورة، وذلك بعد ظهور قضية عظيمة تداعيات.

اختراق رئيسي الرابع هو عمق تعلم المزيد والمزيد من التطبيقات في التفكير الخصومة، ويعزز أداء التطبيق الأصلي.

أستاذ شو هونغ لى الشكل ل

ينظر على نطاق واسع على أنها بداية GAN مجرد نموذج الجيل، ولكن في الواقع نفس التفكير المواجهة مفيد لتحسين خوارزميات منظمة العفو الدولية القائمة. على سبيل المثال، بعد ويمكن رؤية التقليدية خوارزمية التعلم عميقة كما GAN مولد، وإدخال الممي، يمكن أن مهمة تحسين أداء النموذج الأصلي، دعونا لا خوارزميات AI الحالية أفضل لتوليد نتائج أكثر واقعية. اسرة شانغ - الجامعة الصينية في هونغ كونغ أستاذ مختبر المشتركة الوقف جيان تشين البحوث GAN فائقة دقة وضوح الصورة، وليس فقط لتحسين الصور ذات دقة منخفضة، لتحويلها إلى صور عالية الدقة، فإنه يمكن أيضا اتخاذ خطوة تلقائيا المناظر الطبيعية الأمام الأسلوب والتفاصيل من الصورة .

ويستند أستاذ جامعة تشونغشان ليندا مختبر هوا هونج كونج المشتركة بشأن صحة GAN تعزيز صورة ولدت العنوان - آخر شانغ سلالة. الجيل الصورة العنوان الرئيسي هو أن تقرأ من خلال صورة الكمبيوتر، واستخدام اللغة الطبيعية لوصف محتوى الصورة، والانضمام هو مكتوب الممي يمكن تحديد هذه الجملة الإنسان أو الحاسوب ولدت، عن طريق منظمة العفو الدولية في هذا الطريق حتى أن النموذج الأصلي إنشاء المزيد من اللقب هناك "الناس طعم" أكثر طبيعية. هناك أيضا سيتم عرض العديد من الممارسين الترجمة الآلية GAN، التعرف على الوجه، المعلومات الاتجاه استرجاع حققت طفرة جيدة جدا في العام الماضي.

ثلاثة ظهور تأثير رفعتها أكثر من ثلاث سنوات

الحديث GAN على اختراق العام الماضي، والتكنولوجيا أيضا أن نرى لماذا كان الأمر كذلك قلق "، وكان أساسا لها تأثير على الكثير من المستويات، ولكن أيضا إمكانية مستقبل هائل." لي هونغ لتر، موضحا التركيز.

أولا، من الناحية النظرية، يتم استخدام النموذج التوليدي لتقريب التوزيع الحقيقي للالبيانات لإنشاء نموذج مثل نموذج النظرية الافتراضية التقليدية، والتباين autoencoder (تباين السيارات التشفير)، وما إلى ذلك، ولكن في السنوات العشر الماضية، وهذه التقنيات أو بأي حال من الأحوال لنهج صحيح، وتوزيع البيانات الأبعاد عالية، وتوليد صورة لا يزال مهمة صعبة للغاية، حتى ظهور GAN.

صورة FIG شو الناتجة عن خوارزمية StackGAN

لماذا نولي اهتماما لGAN، لي هونغ لتر يعتقدون: " يكمن في احتمال قوي برهن عليها، لا تزال مستمرة لتحسين قدرة نهج توزيع البيانات الحقيقية، وبالفعل هناك بعض الاختراقات. "على سبيل المثال، فإن الجيل الصورة المذكورة أعلاه، في القرار الأخير من 256 * 256، والتقدم إلى نهاية 1024 * 1024، 1024 * 1024 وإن كانت لا تزال غير عملي، ولكن في غضون فترة زمنية قصيرة أن نرى تطور كبير، وكثير من الناس يعتقدون أن GAN هناك إمكانات كبيرة للتنمية. ومع ذلك، إذا تم إنشاء صورة من GAN نظرة فاحصة لا تزال تجد العيوب، وهذا هو القول القدرات البشرية لم يتحقق، لذلك هناك وجهات نظر تلك المدرسة GAN في الواقع ليست سيئة للغاية، وحتى مبالغ بها. اثنين إرسال تعبير عن آرائهم الخاصة.

والتأثير الثاني هو السماح زيارتها الباحثون فكرة تحديث دراسة AI " أنها علمتنا أن عددا من الباحثين، لا تدرس إدخال التفكير الخصومة، وكيفية تقديم، كيف السليم المقدمة، وتحسين أداء خوارزميات AI التقليدية مصممة لأداء المهام في سلسلة من خوارزمية التعلم عميقة. "سعيد هونغ لى يتر المزيد من الأفكار البحثية وسبل تحسين تأثير منظمة العفو الدولية، التي AI خطوة إلى الأمام هو مهم جدا بالنسبة لمستقبل الإنسانية مواصلة دفع.

والتعلم شبه إشراف يمكن أن يستند الثالث على كمية صغيرة من البيانات. ونحن نعلم جميعا أن لتدريب الشبكة العصبية تتطلب كمية هائلة من البيانات، GAN يوفر طريقة جديدة للتفكير - التدريب GAN لمحاكاة توزيع البيانات الحقيقية. في بعض الحالات، فإن الباحثين تواجه البيانات الحقيقية ليست كافية، أو صعوبة الحصول على بيانات من هذا الوضع، ثم يمكنك محاولة لمحاكاة التدريب الحقيقي توزيع البيانات GAN، إذا كانت المحاكاة بما فيه الكفاية جيدة، GAN يمكن أن تولد المزيد من البيانات التدريب، هذا يساعد على حل المشاكل دراسة متعمقة لكمية صغيرة من البيانات. وهناك بالفعل العديد من الجهود البحثية في هذا الاتجاه، وحققت بعض النتائج.

على سبيل المثال، وون CVPR 2017 جائزة أفضل ورقة ترشيح أبل الورقة الأولى "التعلم من مقلد والصور غير خاضعة للرقابة من خلال التدريب الخصومة"، هو استخدام GAN لتوليد بيانات التدريب أكثر واقعية.

الشكل شو التعلم من مقلد والصور غير خاضعة للرقابة من خلال الخصومة عرض التدريب

أبل مهمة رقة بحثية، هو السماح الجهاز سوف تكون قادرة على تحديد اتجاه أنظار الشخص بالصورة العين البشرية. الطريقة التقليدية الحاجة العين البشرية لالتقاط الصور، ومن ثم وصفت يدويا، وغالبا ما يأخذ الكثير من القوى العاملة والوقت التكاليف، أو تطور من الصور العين البشرية باستخدام رسومات الحاسوب (رسومات الحاسوب). الطريقة الأكثر بسيطة بدائية هي صور حية وخلق صور رسومات الحاسوب التدريب مختلط. لكن الصورة الحاسوب ولدت ليست صحيحة، مخرج الفجوة مجال بيانات التدريب وبيانات الاختبار من مختلف المجالات (المجال) تسبب عرضة في عملية التدريب، مما يؤدي إلى أداء الأداء الاعتراف منخفضة تؤثر على الشبكة العصبية النهائية، وذلك من خلال طرح أبل GAN تحسين صحة صورة مركبة، والتقليل من تأثير على الخصائص النهائية للفجوة المجال.

قد يكون GAN لها تأثير على مستقبل رسومات الحاسوب

باختصار، هناك طريقتان لاستخدام GAN، جيل كامل من الصفر: مختلف الضجيج العشوائي الناتجة عن متغير صورة المدخلات، والمخرجات لهذه التطبيقات على درجة عالية من الصعوبة الإنسان والحيوان، والآخر هو استخدام GAN لتحسين التطبيقات AI التقليدية، مثل الصور فائقة الدقة المناظر الطبيعية تلقائيا، والترجمة الآلية، وعلى درجة منخفضة نسبيا من الصعوبة القائمة أو، وأثر هو أيضا عملي جدا.

تطوير أكثر من ثلاث سنوات من GAN، وقد وضعت في مجال الذكاء الاصطناعي لمدة 60 عاما، على الرغم من أن التكنولوجيا لا تزال جديدة للغاية، ولكن بالفعل هناك الكثير من الاحتمالات والمستقبل لا يزال في الاستثمار العديد من الباحثين والشركات المختلفة المتغيرات أو يظهر نسخة متقدمة. على سبيل المثال، لديك فرصة للتقدم من ثنائية الأبعاد إلى صور الفيديو ثلاثية الأبعاد وهلم جرا، لي هونغ لتر كما طرح وجهات نظره ". في المستقبل البعيد، قد يكون هناك تحد تأثير أو الرسومات، على الرغم من أنه لا ينظر ظاهرة واضحة جدا، ولكن تخيل بجرأة، فمن الممكن . "

على سبيل المثال، وصناعة السينما تريد توليد صورة المشاهير، ونهج النمذجة ثلاثية الأبعاد الأصلي للنجمة في الوجه، بالإضافة إلى تصميم المواد والخصائص الفيزيائية، ومن ثم تقديمها عن طريق الكمبيوتر، وهذا هو عملية طويلة؛ أو هو أيضا يحاول شخص ما لإنشاء نماذج ثلاثية الأبعاد واقعية من الطيار الآلي بيئة التدريب الافتراضية. المستقبل GAN يمكن أن يكون قادرا على تحقيقه. GAN المولدة حاليا الصور وكذلك دقة الفيديو لا يزال منخفضا، لا يمكن للعين البشرية رؤية عيوب واضحة. إذا كان الهيكل الجديد، وأساليب التدريب في السنوات المقبلة، فرصة للقيام حقيقية. إذا كان البحث GAN لا يمكن الحفاظ على التطور السريع، فإنه قد لا تحل محل عملية النمذجة ثلاثية الأبعاد.

في الخارج، بما في ذلك غوغل، OpenAI، وجامعة نيويورك والدراسات حتى قضى الكثير من الموارد لGAN البحوث، والمؤسسات الأكاديمية الصينية الحالية شنت على نظرية GAN، على سبيل المثال، الجامعة الصينية في هونغ كونغ وجامعة شنغهاي جياوتونغ، جامعة تسينغهوا والمؤسسات البحثية الأخرى. ويستند الأعمال GAN على تطبيق المنحى، على سبيل المثال، إلى شانغ سلالة GAN ديهم صورة فائقة الدقة للمنتج، وتتضمن العديد من العملاء مصنعي الهاتف المحمول، والبائعين، وصورة أخرى تجهيز APP.

طريق الحرير

GAN أربعة انجازا كبيرا تحقق في عام 2017، قد يكون مستقبل لها تأثير على رسومات الحاسوب

AI جيل جديد من "العراب" الارتفاع، أو إنجازات نحو الوعي الطبقي لديه آلة كبيرة

عقد المنتدى سيتشوان المحامين أول هذه، ويقولون بشكل وثيق معكم

عام مفتوح إنهاء وهان سرعة الحصان، وقررت في حفل توزيع جوائز البطولة السنوية خمسة

العمارة المواد الفعلية (D): الربيع التمهيد التكامل Thymeleaf

إصدار موثوق: "MIT Science and Technology Review" 2018 "Top Ten Breakthrough Technology"

المصور ووهان | الانقلاب الشتوي، نرجس نحت منزل

الشباب إلى القاضي في بقعة صعبة: في النهاية هو 4P أو الاغتصاب الجماعي، ونبه نائب رئيس مجلس الوزراء الإيطالي

على غرار المسرح زفاف مذهلة "حفلة رقم" الثقافة التقليدية الزواج جلب الذوق

"ريفرز" يحيي الذكرى الأربعين للإصلاح والانفتاح أمامنا بدا في الفريق الجديد "قائمة Langya"

بدأت لوتشو للتركيز على 78 مشاريع كبرى اجمالى الاستثمارات 48.8 مليار يوان الجنوب من عهد التجارية المعقدة

A الشمس الذهبية سيتشوان

إنجن إكس الهندسة المعمارية التفصيلية: تركيب إنجن إكس والتكوين

الأخبار | يتوقع قطاع تيانفو شارع شمال تمديد ديانغ ليكتمل بحلول نهاية عام 2022، ارتفعت مدينة ألمانية إلى الخط السريع

نخب مع الجرافين، نريد رشفة؟

المعركة - رويس يسجل هدف التعادل مرة أخرى روبرت DOTT 1-1 C 3-1 هدف ريال

قادة الرأي في وادي السليكون للقيام به "طول العمر المحارب"، الخلايا الجذعية لمكافحة الشيخوخة يمكن أن تجلب الأمل؟

المعركة - صلاح حطم ليفربول تقاليد دبا لا يوفنتوس 2-01-02-0 في باريس

تكنولوجيا أسبوعي: معركة على الشاطئ! جماعة أمريكية أو ديدي، الذي هو صناعة سيارة أجرة "الاخ الاكبر"؟ ...

من فريق مطبخ و02:45 استخدام 321cooking المطبخ لجعل الطرود الغذائية لذيذة تصبح فجأة طاه الأبيض

الأكبر في تاريخ شبكة الاتصالات الفضائية بدءا إطلاق ثنائي، المسك أو سوف السيطرة على معظم التغطية شبكة واسعة

تكنولوجيا أسبوعي: السيارة والمنزل إعادة تمويل أزمة B الجولة ثلاثة مليارات قطع مصلح أضاف الحلم / بريمج

هجوم الصغرى قناة "مشروع غسل" السلوك، مساعدة تطوير المحتوى الأصلي

الأحكام ذات الصلة