مجرد صورة، فيديو الحركة مزورة في كل دقيقة من | MIT خوارزمية

آن B من أسفل الصيف التظاهر سولت لايك سيتي

إنتاج و qubit | عدد ملفه QbitAI

ومفتاح للماكياج، كمفتاح للجمال، ونحن قد يكون بعيدا عن "بنقرة واحدة اللياقة البدنية".

كيف أقول؟

في الآونة الأخيرة، MIT (معهد ماساتشوستس للتكنولوجيا) قام الباحثون بتطوير التكنولوجيا الجديدة وحدها A يمكن الصور صورة نفسي، تتردد في وضعها موضع أي الموقف. AI الخيال والدماغ قوة التعبئة، حتى لتحقيق محة تصور الصورة الكاملة؟

نعم، المفاجأة هي أن تأثير الاصطناعية من هذه التكنولوجيا لا تزال جيدة جدا، تماما كما زخما حقيقيا -

ارتداء ملابس اليوغا للعب البيسبول؟

ارتداء ملابس اليوغا ولعب الغولف؟

بدء فجأة اليوغا أثناء لعبة البيسبول؟

كنت قد خمنت، وهذه الأرقام هي وراء الوهم، في معهد ماساتشوستس للتكنولوجيا في الصحف عن طريق الفم العام CVPR توليف الصور من البشر في الوقفات بالغيب، فإن الباحثين يقترحون جيل وحدات من الشبكات العصبية، وذلك باستخدام مقتطفات من فيديو الحركة البشري بعد زوج من الصور والتدريب الموقف، فمن الممكن لتجميع تطارد الموقف الجديد القيام به لشخص ما.

المثير للاهتمام أكثر، وهذا النموذج لا انقضاء ممارسة متعمدة، ولكن أيضا تولد الفيديو متجاورة.

صورة واحدة فقط، هي نفسها سوف تكون قادرة على التعامل مع صورة الظل الصورة، وفي حالة تم حظره، والشخصيات هي خلفية طبيعية جدا والاصطناعية، والتي في النهاية هو كيف نفعل؟

خطوة تفكيك

وحدها الصورة الشخصية الاصطناعية الموقف ليس سهلا. التغيرات الوضعي أحدثت حركة الجسم، مما يؤثر على خلفية المحيطة ومتفاوتة ظلال شخصية المكشوفة، وإذا كانت أطرافه شخص إذا تم حظر عليها، التي يحتاجها الجسم لتعويض الدماغ الخاصة بهم تصور الحدود ......

في كلمة قصيرة: ورطة.

وعلاوة على ذلك، بالنسبة للبشر كان عمل مرهق ومعقد، وخاصة بالنسبة AI ذلك. كيف نفعل؟

MIT اعتراض من الشركاء صغير مع أكثر من 260 زوجا من الصور وأشرطة الفيديو في الموقف، وتدريب نموذج التعلم تحت إشراف.

مصدر الصورة والمعلومات الموقف 2D المقابلة لها، والهدف إدخال فتة في النموذج، فإنه يمكن توليف صورة الإخراج، والجمع بين الموقف الهدف من الشخصيات في الصورة المصدر.

جوهر الأكاذيب الأسلوب في هذه المهمة الشاقة إلى أربع كبيرة بسيطة المهام الفرعية وحدات، وربما على النحو التالي:

عملية التصنيع الموقف جديدة في خمس خطوات.

وكانت الخطوة الأولى ويمثل الموقف ، الباحثون 2D تشكل مز وحزب العمال في شكل 3D ممثلة RH W J، حيث ارتفاع الصورة المدخلات يمثل H، W يمثل عرض J من كل قناة تحتوي على عقدة أخرى (س، ص) كمركز توقعات غاوس. هذه الطريقة يمكن أن تتخذ بسرعة الاستفادة من المدخلات المكاني لفتة مميزة، بدلا من شقة، كثيفة FIG.

بعد ذلك العمل، فمن الضروري إجراء الصورة العامة ككل تقسيم الأصلي هل لتركيب إجراءات إعداد.

كل جزء من الجسم عادة يحدث مختلفة شرائح المسار ملعب أفيني الحركة، هل من الأصل ينقسم إلى مقدمة وخلفية طبقات، وينقسم الجزء الأساسي في المقدمة والرأس والجزء العلوي من الذراع، وانخفاض الذراع والفخذ والساق والجذع الجزء الآخر، على غرار UNET تقسيم الصورة الهندسة المعمارية.

التالي آفاق تشوه الفضاء ، وستكون هذه تقسيم الجسم مرة أخرى معا.

التالي توليف ، وجزء الجسم المشترك محولة، مزيد من الصقل المظهر. يظهر الشكل التالي قناع جبل (العمود 3) والعديد من مراحل الانتاج من هذا YFG المثالي (العمود 4).

كما يمكن أن يرى، حتى لو كانت البداية لفتات مبالغ فيها جدا، توليفها يبدو تأثير واقعي جدا. ومن المثير للاهتمام، لن يتم الاحتفاظ بها نوادي الجولف، مضارب التنس وغيرها من المقتنيات، بعد التوليف.

في هذه الحالة، فإنه يتضمن بن، على خلفية المتخلفة. تركيب الخلفية هو مبين بداية لملء الأجزاء المظللة في العملية المقدمة، كما هو مبين أعلاه في العمود الخامس -

العمارة الشبكة بالكامل هو الحال، ثم نذهب ونرى كيف الباحثين المدربين خصيصا لذلك.

تم اختيارها بعناية مجموعات البيانات

نموذج جاهز، لا تزال مدينون البيانات.

ففتشوا بعض أشرطة الفيديو من يوتيوب. بما في ذلك المادة 136 من لعبة غولف، واليوغا أو قسم اللياقة البدنية 60، والباب 70 لعبة البيسبول.

اختاروا الفيديو لديهم سمة مشتركة: خلفية ثابت الأساسية، والناس فقط تتحرك. وبهذه الطريقة، ونموذج من أجل الوفاء بولايتها على نحو أفضل.

مزجها، ثم بعد عدد من التحجيم والتضخيم، والتناوب، والعملية العكسية أو ما شابه ذلك، ويتم تشكيل لاستخدام مجموعة البيانات، فضلا عن 10، ومجموعة الاختبار.

لاستخدام هذه البيانات، اختبار العديد من العلماء قدرتهم على تجميع النموذج.

يتوهم إظهار القدرة على بدء

طريقة اختبار بسيط جدا، واختيار شخصيات العمل المستخرجة من الفيديو، والعثور على صورة إطار آخر، حتى يتسنى للشعب داخل نموذج الملتوية في هذا العمل، انظر كيف يعمل.

وقال الكتاب في الصحيفة: من الواضح ان نتائجنا زميل جميلة، صورة بطاقة.

ومقارنة مع نظرائهم الأكبر سنا UNET، هذه طريقة جديدة لتجميع الصورة من أقل عرضة للخطأ. على سبيل المثال، السطر الأول على الخريطة، UNET توليفها في سن المراهقة ملابس التنس المصفرة، والصف الرابع، أخت لياقة بدنية صغير بدا وراء الظلال الثقيلة.

من البيانات، جعلت هذا النهج الجديد أيضا انخفاض نسبة الخطأ من UNET النتيجة أفضل حركة استقلال جنوب السودان.

ولكن هذا هو واضح ليس القوة الكاملة للنموذج.

يوضح الشكل، كل من عمل واحد للعمل تنس آخر التنس من عمل واحد لحركة اللياقة البدنية اللياقة البدنية أخرى، ولكن أيضا هي صورة لا يزال.

ربما كنت تتذكر بداية المقال المعرض. بالطبع لا أكذب عليك، في تصميم نموذج لصورة ومجموعة من الأهداف الموقف، ويولد بالطبع الفيديو، لا مشكلة أصدقاء ~

فيديو في سلسلة من الإجراءات لتفكيك، بحيث الشكل. الوقت لاختبار البصر: هل يمكنك تخمين أي من هذين الخطين هو الصحيح، وهو توليفة من السطرين تفعل؟

والجواب هو، 1،3 الخط هو تخليق العمل، 2،4 خط هو الصحيح.

ربط، فمن ذلك:

تعبت من ضرر ~ Sahua! من السهل جدا أن نتظاهر الرياضية، والفيديو ليس بالضرورة الحقيقة ~

الانتظار، وهذا لا يزال غير كامل قوتها.

في بداية العرض ارتداء ملابس اليوغا لعب البيسبول، بالطبع، انها تحفة.

هذا النموذج، والتي يمكن توليفها تشكل حاضنة فئات مختلفة. أدخل المصدر والمقصد، على التوالي، من فئات مختلفة من الإجراءات، على الرغم من أن النتائج الكاملة والشعور انتهاك، ولكن لا يزال أقل إقناع.

القيام اليوغا في ملعب التنس، الجولف حصيرة اليوغا ......

لا تنسى، وقاموا بتدريب هذا النموذج فقط حركة الطبقة ثلاثة، وأكثر من 260 أشرطة الفيديو، وإذا ما يكفي من نقطة تدريب البيانات، والخوف هو في الحقيقة مفتاح التظاهر لممارسة الرياضة.

بوابة

هذا توليف الصور من البشر في الوقفات بالغيب، كان CVPR 2018 الاستقبال ورقات عن طريق الفم، واحد للورق، ومعهد ماساتشوستس للتكنولوجيا ما بعد الدكتوراه جوها بالاكريشنان، له الماجستير والدكتوراه هم من معهد ماساتشوستس للتكنولوجيا.

جميع أعضاء الفريق البحثي هم من معهد ماساتشوستس للتكنولوجيا، بما في ذلك طلاب الدراسات العليا ايمي تشا، ما بعد الدكتوراه أدريان V. Dalca، وكذلك الماجستير والدكتوراه المعلم بالاكريشنان: جون غوتاغ وفريدو دوراند.

وجاء الآخر من فريق عضوين أيضا من معهد ماساتشوستس للتكنولوجيا، وهو طالب دراسات عليا ايمي تشاو، وآخر ما بعد الدكتوراه أدريان V. Dalca.

الرسالة: الشبكي: //arxiv.org/pdf/1804.07739.pdf

الرمز: الشبكي: //github.com/balakg/posewarp-cvpr2018

- كامل  -

التوظيف الصادق

المكدسة هو تجنيد عمليات المتدربين السوق، والمشاركة في الأنشطة عبر الإنترنت في إطار عملية العام / موضوع للمساعدة على خلق المواد ذات الصلة والعمليات والمجتمعات الأخرى. مقرها في تشونغ قوان تسون في بكين.

ونحن نتطلع إلى حماسة الطلاب للانضمام! تسليم استئناف مرحبا بكم في quxin@qbitai.com

تفاصيل محددة، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "المتدرب" في الاسم.

و qubit QbitAI عناوين على التوقيع

' " تتبع تقنيات AI دينامية جديدة والمنتجات

وحظرت قائد إيران بعد المباراة، بطولات الدوري على وجهها الاتحاد الإيراني لكرة القدم

من أجل محاربة المكونات عاصفة ثلجية قوية، دعوى قضائية ثماني سنوات، وتبحث عن المكونات في مجال الأعمال التجارية لعشرات تفقد الملايين!

لا تشتري زيادة أجرة تيغوان، وكان وسيم ولكن قد باع 90،000250،000 تيغوان L، وشرائه حفظ 160000

أعلن العاصفة الثلجية التي علب من العالم يخطط لفيلم جديد! وقد وقعت عاصفة ثلجية أخيرا لي أن استقر لرجال الأعمال: العضو

18 هوندا أوديسي، إذا كان الأمر يستحق نتطلع إلى؟

كرة القدم الهولندية في انهيار المجلس، والحرب في أوروبا المتبقية فريقين يجتمع مرة أخرى في المنزل لفتح الباب الأسود!

RNG Lingchen قوان شوان القلب التقاعد، والمشاركة S8 من كل مدرب المنتخب ثلاثة LPL في إجازة!

تدفق، بو تشون 310Wagon تصبح نماذج انفجار في حاجة أيضا لأسباب أخرى؟

يجرؤ تفجير "لا يوجد أي أثر لPS"؟ ضرب مسؤول أدوبي AI قصد الوجه

في العالم معظم الألعاب الماشية PW؟ مما اضطر لعبة العصابات عاصفة ثلجية قوية، والعالم من علب أطلقت الملابس الحنين

وهناك شعار على قيمة خمسة BYD F0، ويخشى من سرقة مخبأة في غطاء محرك السيارة، ونتيجة للمأساة

إيران مهاجم الجنسية كسر مسابقة كأس الاتحاد الاوروبي، أقلعت قميصه تحولت السويد إلى إيران