CVPR 2018 الملخص: الجزء الأول

هذا المقال هو عبارة عن تجميع للAI Yanxishe بلوق التكنولوجيا، والعنوان الأصلي:

NeuroNuggets: CVPR عام 2018 في مراجعة الجزء الأول

الكاتب | سيرغي Nikolenko، ألكسي Artamonov

الترجمة | تشاو التدقيق | لى جينغ

إنهاء | شقيقة الأناناس

الرابط الأصلي:

https://medium.com/neuromation-io-blog/neuronuggets-cvpr-2018-in-review-part-i-f22b8c223202

NeuroNuggets: CVPR 2018 استعراض العام، الجزء الأول

في Neuromation، ونحن نبحث دائما عن أفكار جديدة ومثيرة للاهتمام المساهمة في بحثنا. ما يبحثون عنه أكثر مكان مناسب من مؤتمر القمة. لقد غطت كيفية النجاح في منطقتنا ندوة DeepGlobe CVPR (رؤية الحاسوب والتعرف على نمط) الاجتماع. هذه المرة سوف ننظر بعناية في الصحف الأكثر إثارة للاهتمام CVPR نفسها. خلال هذا الوقت، واجتماع على مستوى أعلى هو شيء مهم جدا، لذلك قمنا بإعداد سلسلة من التغريدات. ونحن نقدم ورقة في أي ترتيب معين، وليس فقط لتحديد أفضل الأوراق، ونحن المتعلقة بالبحوث في Neuromation القيام به. هذه المرة، ألكسي Artamonov (هل الناس على الاطلاق) وقد أعدت هذه القائمة، حاولت أن أضيف بعض عرضه. في هذه السلسلة، ونحن سوف يطلع جدا، في محاولة لانتزاع أكبر قدر من اهتمام من وجهة كل ورقة، لذلك بهذه الطريقة لا يمكننا أن نفهم حقا عمل كاملة، ويوصى بشدة لقراءة الصحيفة كاملة.

GAN ورؤية الكمبيوتر

في الجزء الأول، ونحن نركز على توليد النموذج الذي لا يميز فقط بين القطط والكلاب، ويمكن أيضا توليد صورة نموذج التعلم الجهاز الجديد من القطط والكلاب. لرؤية الكمبيوتر، وأنجح نموذج الطبقة مولد هو توليدي ضد شبكة (GAN)، التي الممي تعلم التمييز بين الأشياء وتوليد الهدف الحقيقي، ومولد تعلم أن الممي خداع. لقد كتبت مرارا وتكرارا GAN (على سبيل المثال، هنا وهنا)، لذلك دعونا تذهب مباشرة إلى الموضوع.

القليل وجه تبحث في الهواء الطلق

Y. باي آخرون، مع توليدي شبكة ضد أبحث قليلا في الهواء الطلق الوجه

المملكة العربية السعودية والصين في التعاون الباحثين، واستخدام المؤلفون GAN لكشف وتضخيم حشد صغير جدا من الوجوه في الصورة. حتى لو كان فقط لكشف الوجه الصغير هو أيضا مسألة مثيرة للاهتمام، يواجه الناس العاديين كاشف (على سبيل المثال، في رسائلنا السابقة وظيفة) وعادة ما لا يمكن أن تحل المشكلة. هنا، يقترح المؤلف خط أنابيب لاستخراج وجه النهاية، ثم تطبيقه على توليد ونماذج تزيد 4 مرات (المعروفة باسم عملية فائقة الدقة). وفيما يلي لمحة عامة عن ورقة في الطريق:

PairedCycleGAN ماكياج

. H. تشانغ وآخرون، PairedCycleGAN: نمط غير المتماثلة لإزالة المكياج ونقل

تم الظروف GAN تستخدم على نطاق واسع في معالجة الصور، ونحن سبق ان ذكرت فائقة الدقة، GAN أيضا طبقت بنجاح تحويل النمط. استخدام GAN والتعلم والسمات البارزة الموافق عنصر صورة معينة - وتغييرها. في هذا العمل والباحثين من جامعة برينستون وبيركلي والإطار أدوبي المقترح لتعديل الصورة. جزء مثيرة للاهتمام من هذا العمل هو مؤلف من مكونات مختلفة من الوجه (العينين والشفاه والجلد) تدريب مولد وحده وتطبيق كل منها على حدة لاستخراج جزء الوجه من شبكات مختلفة:

GANerated الأيدي

F. مولر وآخرون، GANerated الأيدي لRGB الاثنين الى وقت لفي الوقت الحقيقي 3D تتبع اليد

لقد كتب عن تقدير الموقف. مجموعة فرعية هامة جدا من (وعادة ما يتطلب نموذج منفصل) تقدير قفة هو تتبع اليد. على التعامل مع الكمبيوتر من خلال التلويح بيديه لم تتحقق موضوع الخيال العلمي بشكل كامل، لا يزال يتطلب الأجهزة المتخصصة، مثل كينيكت. وكما جرت العادة، واحدة من المشاكل الرئيسية هي البيانات: يمكنك العثور على علامة صحيح دفق الفيديو 3D أين؟ في هذا العمل، ويقترح المؤلفون بنية حالة GAN، قادرة على تجميع نموذج 3D في الصورة ومن ثم تستخدم لتدريب الشبكة تتبع اليد. هذا العمل هو جذابة جدا بالنسبة لنا، والبيانات الاصطناعية هو مفتاح الدراسة Neuromation، قد تنظر فيه بمزيد من التفصيل بعد الولايات المتحدة. وفي الوقت نفسه، وهنا هو "الاصطناعية لالحقيقية" العمارة GAN:

مشاة GAN الهجرة

L. وي آخرون، شخص نقل GAN لجسر الفجوة المجال لشخص وإعادة تحديد

الناس إعادة تحديد الهوية (ريد) المشكلة هي أن يجد الشخص نفسه في صور مختلفة اتخذت في ظل ظروف مختلفة وظروف مختلفة. والسؤال أصبح من الطبيعي أن موضوع العديد من الدراسات، والآن حل جيد نسبيا، ولكن مشكلة المناطق قائما الخلافات: مجموعات مختلفة بيانات الصورة والحروف مع ظروف مختلفة جدا (الإضاءة، والخلفية الخ)، في مجموعة بيانات تدريب خسائر كبيرة في الشبكة إلى مجموعة أخرى من البيانات (مثل التطبيقات وفي العالم الحقيقي). هذا الرقم يدل على مجموعات البيانات المختلفة. لحل هذه المشكلة، وهذا يعرض العمل بنية GAN، قادرة على نقل صورة من "مجموعة البيانات على غرار" واحد إلى آخر "، وعلى غرار مجموعة البيانات"، وذلك باستخدام GAN لتعزيز بيانات حقيقية من خلال التحولات المعقدة. وهو يعمل على النحو التالي:

العين نموذج التوليف توليد صورة

K.Wang آخرون، الهرمية توليدي نموذج العين لتكوين صورة والعين نظرة تقدير

معهد البوليتكنيك رينسيلار هذا العمل على حل مشكلة محددة جدا: الصور الخام الكبار العين. وهذا ليس فقط لتوليد صور عيون جميلة مهمة، ومع التقدير البصر الناتجة حل المشكلة: ما يراه الناس؟ وهذا يمهد الطريق لواجهة الخيال العلمي الحقيقية ...... ولكن هذا لا يزال في المستقبل، حتى بالعين الجيل الاصطناعية الحالية هي أيضا مشكلة صعبة للغاية. ويقترح المؤلفان نموذج معقد على شكل العين احتمال الاصطناعية، ويعرض بنية GAN، وتوليد عيون وفقا لهذا النموذج - كان نجاحا كبيرا.

إصلاح صورة: املأ الفراغ

J. يو وآخرون، صورة التوليدية Inpainting مع السياقية الاهتمام

أدوبي البحوث وجامعة إلينوي في أوربانا - شامبين هذا العمل محاولة حل الصورة لملء الفجوات في هذه المشكلة تحدي (انظر المثال أعلاه). عادة، تحتاج الصور لفهم المشهد إصلاح المحتملة: في أعلى يمين الصورة أعلاه، كنت تعرف أي نوع من وجه، ونحن نواجه يمكن توقع بناء على ما لرؤية الشعر والرقبة. في هذا العمل، يقترح المؤلفان النهج القائم على GAN يمكن استخدامها لتحسين خصائص الصورة المحيطة يتم إنشاء. يتكون هذا الهيكل من جزأين، نتيجة الخام ولدت أولا، ثم يتم تكريره باستخدام شبكة أخرى. نتائج جيدة للغاية:

اليوم هو الحال. هذا هو الجزء الأول فقط، وسوف نستمر CVPR 2018 الاستعراض في العدد القادم، وداعا. شبكة شبكة شبكة لى فنغ لى فنغ لى فنغ

سيرغي NikolenkoChief باحث، Neuromation

ألكسي ArtamonovSenior باحث، Neuromation

أريد الاستمرار لعرضها روابط ذات صلة والمراجع؟

انقر على الرابط لفتح الصحافة أو انقر فوق [CVPR 2018 الملخص: الجزء الأول]:

AI Yanxishe المحتوى مثيرة تحديثها يوميا، لمشاهدة المزيد من المحتوى:

YOLO بناء واستخدام SKIL على مستوى المنتج نظام الكشف عن الهدف

كيفية تحسين كبير في سرعة نموذج كفاءة التدريب الخاص بك؟

الضمير نوصي بما يلي: 20 أسابيع دراسة ملصقات تجربة علوم الكمبيوتر (موارد المرفق)

يجب العلماء البيانات على فهم المفاهيم الأساسية للإحصاءات خمسة: ملامح إحصائية، التوزيعات الاحتمالية، والحد من أبعاد، الإفراط / undersampling والإحصاءات النظرية الافتراضية

أعلى 5 أفضل المصدر المفتوح جافا الأداء أداة مراقبة

معرفة كيفية اختبار مباشر ل118i سيارة BMW 1 السلسلة

ملك المجد: البطل المبالغة في وقت متأخر، القرد في القائمة، ويعتبر أول من يكون الأقوى

تنبيه! وضع سامسونج يلة Mengliao: سامسونج S9 سلسلة الافتراض النسخة الحمراء من القائمة الرسمية

Suning تشغيل وصيانة الممارسات الخادم التشكيل الآلي واسعة النطاق

سوف المشروبات دائرة اللعب أكثر من شركة كوكا كولا، التي تم اطلاقها في AAPE موضوع سلسلة متوفر في الوقت الحاضر!

مؤتمر الشعب الوطني لي Chunkui: جنوب الصين لتصبح العلامة التجارية الأولى لي هش

أوصى المعلمين تحرير ألعاب الدم لاختيار هذه الهواتف على غير ما يرام

جوجل I / O مؤتمر توقعات: عليك أن نتطلع إلى ذلك

العودة إلى الماضي، وحكم مقاهي الانترنت هي لعبة ما؟ أي واحد هو المفضل لديك؟

تشكيلة الخالدة! الممثل البريطاني تشكيلة كاملة للانضمام إلى موضوع الحرب في فيلم "1917"، وسيكون آخر "دونكيرك" ذلك؟

MaxScale: الخلية قراءة منفصلة والكتابة وتنفيذ موازنة أداة الوسيطة