الاتحاد الأخ سيدني معهد انغ Chaoyue AI: طريقة صورة تستند تحرير لتوليد شبكات المواجهة | ملخص حصة

لى فنغ شبكة AI تقنية الصحافة، في السنوات الأخيرة، وتتحقق المواجهة توليد في كثير من جيل صورة شبكة وصورة المهام تحرير نجاحا كبيرا واستقطب اهتمام أكثر وأكثر. لتحرير الصور المهام التي تواجه الآن اثنين من التحديات الهامة هي: توجيهات بشأن كيفية الشبكة إلى صورة الهدف تعلم (لتعزيز تأثير تحرير الصور) وكيف الحسية محتوى الصورة الإدخال (لتعزيز دقة لتحرير الصور).

UTS FEIT في السنة الثالثة طالب الدكتوراه، الأخ معهد سيدني AI الاتحاد الطلاب الزائرين، برعاية البروفيسور وانغ تاو Chaoyue كبير من الطلاب شبكة تشنغ لى فنغ في AI Yanxishe مؤتمر أكاديمي بالتزامن مع الشباب لتبادل له ورقتين علامة فصلها المولدة الخصومة شبكات لكائن صورة تقديم-ري (IJCAI 2017 أفضل ورقة طالب) وشبكات الخصومة إدراكي للتحول الصورة إلى صورة (أرخايف 2017)، واستكشاف الحصة المقابلة لتحرير الصور الشأن.

حصة على ما يلي:

الصورة الشائعة تحرير الصورة لالمطر (الثلج)، يملأ الصورة والرسومات والصور، وتحويل نمط والصورة فائقة الدقة، الصور الملونة، تناوب صورة، وتحويل الوقت، ويعطى صورة ومتطلبات مجردة، لتوليد صورة جديدة. التي تسمح للآلة لفهم الصورة وإنتاج صورة.

يتم إنشاء غودفلوو ضد الشبكة المقترحة في عام 2014، والذي يعتبر بنية الشبكة الجديدة التي يمكن أن يتم التعلم تحت إشراف أو غير خاضعة للرقابة.

GANS الصورة القائمة على تحرير الإطار هو على النحو التالي:

بعد ذلك تأتي الورقة الأولى للمهام تحويل الصورة المتصورة ضد شبكة (إدراكي الخصومة الشبكة، PAN).

خلال العامين الماضيين GANS الإطار القائم، هناك الكثير من التحسين المختلفة، والشكل التالي هو المقارنة بين عمل فقدان بكسل الحكمة، وفقدان GANS وفقدان إدراكي ل.

ميزة فقدان بكسل هو استخدام بسيطة، وسرعة التدريب السريع والاستقرار، والعيب هو طمس صورة الإخراج، جودة منخفضة.

GAN فقدان ميزة هي لتحسين جودة الصورة لتوليد أكثر واقعية، أكثر وضوحا، والعيب هو التعلم توزيع جيل كامل لا يمكن استخدامها وحدها.

الإدراك الحسي فقدان التركيز ميزة على ميزة الأبعاد عالية المدرجة في تأثير الصورة التصور، يقتصر العيب إلى الشبكات الأخرى مسبقا المدربين.

وهنا بعض الدراسات إلى تعزيز يتم إنشاء جودة الصورة لجعل مقدمة من فقدان مختلفة لتوليد صور الانتاج المختلفة.

وهم يأملون أن يكون وظيفة جديدة للتعويض عن فقدان المشاكل القائمة، واصلت لتضييق الفجوة الناتجة صورة والصورة الحقيقية. واستنادا إلى فكرة طرحها ضد فقدان المتصورة.

أسباب لاستخدامها ضد فقدان ينظر هي كما يلي:

تصور: مقياس الفرق بين الصور ميزة الأبعاد عالية ولدت والحقيقية وتلتزم للحد منها.

المعارضون: عندما يكون الفرق هو أصغر من ميزة موجودة عالية الأبعاد قيمة معينة م، يتم تحديث شبكات D لإيجاد مساحة جديدة الأبعاد عالية، إلى مزيد من صقل مختلف تزال موجودة.

الزي الرسمي: تدريب جميع GAN في إطار عمل موحد، دون إدخال الشبكة قبل التدريب الأخرى والحصول على غير محدود.

أنها أدخلت ضد فقدان ينظر بالإضافة إلى فقدان GAN الهيكل، حيث إدخال فقدان GAN لجعل توزيع كلها صورة ولدت بما يتفق مع التوزيع العام للالصورة الفعلية.

وفيما يلي محددة لهذه الشبكة من التجارب ذات الصلة، والصورة الرئيسية لتمطر، وتحويل من تسمية الصورة بعد تقسيم إعادة إنشاء الشارع وصور الأقمار الصناعية لخرائط جوجل، واستكمال الصورة والمخططات المهمة الجيل الصورة الحقيقية.

ما يلي هو المقارنة بين صور من الأمطار والثلوج لهذه المهمة، وقد تم تعزيز نموذجهم من حيث التحكم في الألوان.

وفيما يلي صورة من إنجاز المهمة، مقارنة CVPR 2016 سياق التشفير، PAN يمكن الحصول على المزيد من النتائج المثلى.

عندما Pixel2pixel التجربة مع pix2pix القيام المقارنة، يمكنك أن ترى أيضا تحسنت بشكل ملحوظ.

بعد حل جودة الصورة ولدت، هناك مشكلة: للتفسير. وهذا هو، كيفية فتح الشبكات العصبية الصندوق الأسود، ومساعدة مزيد من الفهم للصورة الكمبيوتر.

توجه لفهم كيف يمكن لعملية تحويل الصورة في الشبكة بالكامل، وتتميز المعلومات وسيطة سيطرة طبقة، لأنها تجعل التسمية ضد التحلل شبكة (بطاقة فصلها المولدة الخصومة الشبكات، TDGAN)، وصورة هدفا للالمقدمة إعادة (إعادة تقديم) .

إعطاء صورة المدخلات، والتي سوف تشمل سلسلة من إدخال المعلومات، فمن السهل أن نرى أن الدماغ البشري بعد الفرعية نوع المعلومات، ولكن قبل شبكة من الصعب فهم هذه المعلومات، فإنه من الصعب جعل غرامة الطفيفة صورة المدخلات، والآن يريدون تريد الشبكة لتكون قادرة على مزيد من فهم المعلومات.

واقترحوا توصيف التحلل.

الحل: التسمية. ببساطة تغيير التسمية، يمكنك بسهولة توليد يبتسم الصورة.

وبناء على هذا، جعلوا TDGAN، بما في ذلك شبكات فرعية الرقم الأربعة التالية.

إطار شبكة FIG على النحو التالي:

هناك F1، F2، F3، F4 أربعة المعوقات الرئيسية:

الشبكات الفرعية الأربعة تأخذ شكل التدريب البديل:

هنا نتائج عمل المقابل، نظرا كرسي واحد، وعدد معين من زوايا المطلوب، قد يكون إنشاء تأثير في زوايا مختلفة، وآثار أخرى يمكن أن تتولد في مختلف التعبير الخفيفة والكبار.

هذا الرقم هو يفعلونه في مجموعتي البيانات بعض المهام. بأمر الصورة الكراسي، الكراسي توليد زوايا مختلفة، ويمكن أيضا التحكم في خصائص مختلفة من المدخلات صورة الوجه، مثل تغيير في زاوية، والإضاءة والتعبير وهلم جرا.

تلخيصها على النحو التالي: العديد من الطرق الحالية هي في إطار GANS، على أمل تعزيز صورة القائمة تحرير آثار وتحسين دقة لتحرير الصور، فإنها تحاول أن تفعل ما يلي، للسماح للأداء مهمة أفضل.

الأول هو من مستوى التعلم لم تعد ثابتة للتو، بكسل بكسل أو مساحة أعلى الأبعاد تضييق الفرق بين الصورة الحقيقية وصورة التحويل، ولكن لاستخدامها ضد فكرة التعلم لمواصلة البحث عن والحد من الصورة الحقيقية وتحويل الصور بين الخلافات المتبقية. من ناحية أخرى، انهم يريدون فهم أكثر عمقا للصورة خوارزمية يمكن ومساعدة جهاز الكمبيوتر ليكون أكثر ذكاء، من خلال استخراج وتحلل المعلومات المختلفة الواردة في الصورة، بحيث خوارزمية يمكن أن يكون أكثر دقة تحرير الصور للحصول على النتائج المرجوة.

شبكات الخصومة إدراكي للتحول صورة إلى صورة

عنوان ورقة: الشبكي: //arxiv.org/abs/1706.09138

شبكات الخصومة المولدة بطاقة فصلها عن كائن صورة إعادة تقديم

عنوان ورقة: الشبكي: //www.ijcai.org/proceedings/2017/0404.pdf

حصة هذا الفيديو هي كما يلي:

شبكة التوحيد لى فنغ AI تقنية مراجعة المحرر.

محورها وتعزيز الارتقاء السياحة الريفية

"سونيك فريق سباق" المخابرات الجديد: حقل فيض ودور جديد

أعلن توم كروز عنوان "مهمة مستحيلة 6: مجموع انهيار" مروحية السلطة الفلسطينية للانضمام الى اقبال مغامرة سوبرمان

STM32 تصميم نظام قياس الطيف القائم

يمكن 50000 دولار شراء سيارة SUV وMPV تختار؟

سامسونج غالاكسي S10 سلسلة بنك نيجارا سعر الإفراج عن 4999 يوان

"العمل البحر الأحمر" معدات أكثر من 30 كيلوغرام من وزن مسيرة 200 كيلومترا، 5000 ساعة تصوير شريحة زجاجية

عمق التعلم لإعادة اختراع العجلة، والتخلي تماما العودة الانتشار؟

التلقائي الكبح عرض طرقت فعلا مضيفة هذه الفكرة أن القصة أيضا!

الضمير! هواوي مفتوح EMUI 9.0 الترقية، هواوي Mate9، P10 في العمود من ثمانية طرازات قديمة

"شاطىء البحر مانشستر" الرجال كيسي أفليك الخروج جوائز الاوسكار هذا العام

استنادا D2D تأخير جودة الخدمة ضمان V2V للمركبات الاتصالات مخطط توزيع الكهرباء