يعلمك تحتاج فقط لتوصيل الكاميرا بالكمبيوتر، يمكنك استخدام الوقت الحقيقي الدراسة الكشف عن وجوه عمق

مذكرة لى فنغ الشبكة: هذه المادة هي عبارة عن تجميع لللى فنغ ترجمات بلوق التكنولوجيا المجموعة، العنوان الأصلي كشف الناس في الوقت الحقيقي عن طريق التعلم العميق، والمؤلف شومان تشانغ.

الترجمة | جينغ بنغ فاي التشطيب | مروحة جيانغ يوهانغ

في الوقت الحقيقي الكشف عن وجوه هو موضوع مثير جدا للاهتمام. كيف يمكننا موثوق كشف الأشياء وغيرها من المدخلات الفيديو في الحياة الحقيقية؟ تمكنت مؤخرا لبناء تطبيق بسيط للغاية، وذلك ببساطة توصيل الكاميرا إلى مستخدمي شبكة الكمبيوتر يمكن الكشف عن تلقائيا الكائن. وأود أن أشاطركم كيف يمكنني بناء هذا التطبيق، فضلا عن بعض أسئلة مثيرة للاهتمام والتحديات التي واجهت في هذه العملية.

يمكن العثور على شفرة المصدر المشروع (https://github.com/schumanzhang/object_detection_real_time) هنا.

الكشف عن وجوه هو حقل نشط جدا من البحوث الرؤية الحاسوبية. كشف وتحديد الكائنات في صورة (تفسر على أنها وضع مربع إحاطة حول الكائن) الأسلوب الأكثر فعالية هو استخدام تقنيات التعلم عميقة. عدة مصممة خصيصا لهذا هندسة الشبكات العصبية الغرض، مثل R-CNN، السريع R-CNN، كشف واحد (SSD) وYOLO (أنت تنظر إلا مرة واحدة).

نموذج الكشف عن وجوه Tensorflow

يمكنك بسهولة العثور على نموذج فوق هندسة الشبكات العصبية المدربين قبل في مكتبة tensorflow. ويشار إليها مجتمعة ب تعيين نموذج الكشف tensorflow. هذه نموذج ما قبل التدريب للتدريب (https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/detection_model_zoo.md) على مجموعة البيانات COCO يحتوي على مجموعه من 90 درجة تسمية (الأجسام في العالم الحقيقي، مثل الناس، القطط والكلاب، وما إلى ذلك). في هذا التطبيق البسيط، سوف نستخدم ما يسمى طريقة الكشف عن واحد من mobilenet. هذه العمارة هو أكثر إحكاما ويمكن الحصول على زيادة سرعة اضافية، وهو أمر مهم لتحليل 30-50 لقطة في الصورة الثانية هي.

أنا لن بالتفصيل كيف يمكن لهذه الشبكات العصبية العمل (مستقل وهذا هو موضوع آخر مثير للاهتمام). في تطبيقنا، تركيزنا هو اختبار الموظفين، ونحن نحاول الإجابة على السؤال ما إذا كان شخص ما في الغرفة، وإذا كان الأمر كذلك، كم من الناس؟ ولكن أيضا أن تكون قادرة على كشف الأجسام يصل إلى 90 فئات من العالم الحقيقي، بما في ذلك الهواتف النقالة والكتب وأجهزة الكمبيوتر المحمولة والأشياء المشتركة الأخرى. من الناحية النظرية، يمكننا استخدام طريقة التعلم نقل لإعادة تدريب العديد من هذه الطبقات الأخيرة من هندسة الشبكات العصبية، من أجل الكشف عن مجموعة متنوعة من الأشياء، ولكن هذا يتطلب بيانات التدريب إضافية، والكثير من قوة الحوسبة والوقت.

باختصار، سوف نستخدم دفق الفيديو تحليل tensorflow، غرفة الموظفين والسيرة الذاتية مفتوحة بيثون الاختبار.

إنشاء التطبيق الكشف عن وجوه

عملية التطبيق كله هو على النحو التالي:

  • سوف نستخدم-السيرة الذاتية البيانات المفتوحة بيثون إطار القراءة من مكتبة الكاميرا في دفتر الملاحظات. وسوف يتم ذلك بواسطة الدالة VideoCapture-السيرة الذاتية المفتوحة.

  • ثم ننقل إطارات للنماذج mobilenet SSD ليتم الكشف. أي مستوى الثقة الكشف أعلى من 0.5 وسوف تعاد إلى الصورة إطار التعادل.

  • سوف يتم الكشف عن أي كائن من تم الكشف عن وحدة التصور في مربع صورة إحاطة حول كائن وضعت في اللون.

  • نحن أيضا إضافة وحدة نمطية تتبع لعرض ما إذا كانت الغرفة فارغة وعدد الأشخاص في الغرفة. سيتم تخزين البيانات في ملف csv منفصل.

بعد تجهيز عودة بيانات الإطار، يمكننا استخدام-السيرة الذاتية مفتوحة وظيفة imshow من عرض صورة مع مربع إطار إحاطة إلى مستخدم.

وأخيرا، فإن الناتج معدل دفق الفيديو في الثانية 20 إرسال بريد الملف .mp4 منفصلة بحيث أن الأخيرة يمكن أن نقدر عملنا :)

في رمز أعلاه، "في حين أن 'دورة لقراءة بيانات الإطار من كاميرا الشبكة، وبعد ذلك بيانات الإطار غير المجهزة في قائمة انتظار الإدخال للتسليم في عمق نموذج التعلم. مرة واحدة نحصل على نتيجة توقع tensorflow سيتم إدراج هذه القيمة التنبؤ / كشف في قائمة انتظار الإخراج، ثم الطبقة التصور وحدة object_tracker، ونحن سوف معالجة أخيرا إطار مكتوبة إلى ملف ويعرض النتائج للمستخدم منفصل.

سوف نستخدم خاصية تعدد في بيثون لتحسين سرعة معالجة إطارات الفيديو. وظيفة عامل طابور التالية المكتسبة من بيانات الإطار الإدخال، ويتم تحميل نموذج tensorflow تدعم أي نتائج الكشف إلى قائمة انتظار الإخراج. هذا هو موضوع الرئيسي تشغيل على حدة.

وبطبيعة الحال، من أجل الفحص البصري، ونحن بحاجة لتمرير الكشف عن تسمية الطبقة، والثقة في كل منها، والإحداثيات لون المربع المحيط، والاستفادة منها في صورة الإطار.

اختبار وتقييم التطبيقات

والسؤال التالي هو كيف هذا الأداء تطبيق بسيط؟ على جهاز الكمبيوتر المحمول، وأعتقد أن تشغيل فعل الموظفين وظيفة تطبيق اختبار على وظيفة جيدة. ليس لدي هذه التطبيقات المكان بيئة اختبار صارمة. ومع ذلك، كما أنني أرى الكثير من الأداء وليس الوضع الهش. أولا، عندما أضع ستيف جوبز سيرة على الجزء الأمامي من الكاميرا، والشيكات إلى شخص آخر، بدلا من كتاب (أو شخص لا يمكن التمييز بين صورة الواقع). ثانيا، أعتقد في أداء جيدا في نفس الوقت أفراد الاختبار، اختبار أداء الفئات الأخرى ليست جيدة بشكل خاص، مثل هاتفي سوف غالبا ما تكون خاطئة لTV أو الكمبيوتر المحمول. عندما اكتشفت الكائنات الأخرى في العالم الحقيقي لا يزال هناك مجال كبير للتحسين.

التطبيقات المحتملة الواقع؟

يمكن أن نفكر بسهولة في كثير من الحالات تطبيق عملية مثيرة للاهتمام، لتحليل وكشف في الوقت الحقيقي دفق الفيديو من قبل شخص أو كائن آخر. يمكننا الكشف عن وجود أفراد في كاميرات المراقبة في، بعد كل شيء، لدينا الكثير من الكاميرات الأمنية المهملة. يمكننا أن نسمح الكاميرا تتبع الأفراد، وحساب تدفق الناس، حتى في الوقت الحقيقي لتحديد سلوك معين. نقل السيارات هو أيضا وشيك، وهذه التكنولوجيا تساعدنا على رؤية المركبات على الطرق الوعرة والكشف عن المشاة أمر بالغ الأهمية.

الرابط الأصلي: الشبكي: //medium.com/@schuman.zhang/detecting-people-in-real-time-using-deep-learning-84859c9682d2

رقم لقب ~

التركيز على

تطوير التكنولوجيا AI AI والنمو المهندس المعارف المجتمعية في البحث عن عمل

لقد ولدت!

مرحبا بكم فى زيارة الروابط أدناه أو الخبرة كود مسح

https://club.leiphone.com/page/home

لى فنغ لى فنغ صافي صافي

"أمة القتالية لتطوير في الاعتبار"، "الأرض الليلة الماضية" نهاية شراب الفودكا الروليت

تاريخ المنزل التكنولوجيا الأول، وقالت انها ساعدت الكثير من المبرمجين

وقال لين بن الاتجاهات الجديدة شاشة بصمة، وهما التكنولوجيا الأساسية ذات الصلة قد تغلب!

هذا 22 مليون حالة من الترف SUV، هناك ما يقرب من 200 مليون لحقل الغاز!

ومجموعة من "الزي بخير" الذي ظهر في برلين! مزيج المباراة ومجموعة متنوعة من صغير نصيحة جديرة بالاهتمام الخاص بك!

آلة الغيار من خيار! متانة عالية وقيمة اللون ناعمة ألف يوان الجهاز الموصى بها

"المفترسة المدينة" تدريجي "لانقاذ جدي"، "" كان معظم شخصية كاريزمية في الواقع آلة القاتل بدم الباردة

بدءا شياو 675 المعالج مع التركيز الجديد، MEIZU، كانت الأرز الأحمر في نهاية الرائد التعرض!

مجد السابق للملك الآلهة خليفة اللحوم جرافة شيانغ يو Fuzion التعليقات

"حورية البحر" التغيير "قنديل البحر الكبير كبير المتدرب الشقيقة" لا يخاف من لدغة قنديل البحر، كيف أنها لم تفعل ذلك؟

كيا نيرو القطب روي مدرجة رسميا للبيع 14،98-18،98 وان

أديداس يهدأ ولد الجدد فجر الخفقان الصيف