من أجل تحقيق موضوع الكشف عنها بواسطة TensorFlow تصنيف على مستوى بكسل

مذكرة لى فنغ شبكة AI تقنية مراجعة: هذه المادة من "التكنولوجيا توبو" التي تم تجميعها من طريق الكشف عن وجوه Tensorflow للقيام بكسل الحكيم تصنيف.

في الآونة الأخيرة، TensorFlow من "وجوه الكشف API" لديه ميزة جديدة، ويمكن تحديدها على أساس بكسل من موضع الكائن بكسل الكائن الهدف. وبعبارة أخرى، ارتفع مستوى TensorFlow الكشف عن وجوه من الصورة الأصلية إلى مستوى بكسل بنجاح.

استخدام TensorFlow من "API الكشف عن وجوه" لتحديد الكائنات في الصورة، والنتيجة النهائية هي صورة لاثنين من كائنات مختلفة في مربع محاصر. في الآونة الأخيرة، وهذا "الكائن كشف API" لديه ميزة جديدة، يمكنك تحديد بكسل الكائن على أساس الموقف بكسل الكائن الهدف، لتحقيق تصنيف بكسل من الكائنات.

TensorFlow الكشف عن وجوه نموذج API --Mask-RCNN

أمثلة على تجزئة

"أمثلة من الانقسام" هو امتداد لالكشف عن وجوه، لأنها تتيح لنا الحصول على معلومات شاملة حول الكائن أكثر دقة في الأساس العام للالكائن المكتشف.

تحت أي ظرف من الظروف نحن بحاجة إلى معلومات دقيقة ذلك؟

  • السيارات بدون سائق

    لضمان سلامة والمركبات بدون طيار تتطلب تحديد المواقع بدقة من السيارات والمشاة أخرى على الطريق.

  • نظام الروبوت

    الروبوت عند الاتصال قسمين، إذا كنت تعرف المكان المحدد من هذين العنصرين، وتشغيل الروبوت ستكون أكثر كفاءة ودقة.

هناك العديد من الطرق ل"حالات انقسام" من، TensorFlow يكون "أمثلة على تقسيم" باستخدام قناع RCNN الخوارزمية.

قناع R-CNN خوارزمية نظرة عامة

قناع العمارة RCNN خوارزمية

قبل إدخال قناع RCNN، ونحن ننظر أولا إلى فهم أسرع RCNN.

أسرع RCNN هو خوارزمية للكشف عن وجوه، والتي تنقسم إلى مرحلتين: المرحلة الأولى تسمى "مرشح شبكات الجيل المنطقة" (وRPN)، الذي يولد الكائن مرشح الحدود؛ في المرحلة الثانية هي في الأساس سريعة R-CNN الخوارزمية، وهي استخدام ميزة كائن من كل مرشح الحدود RolPool المكتسبة، الحدود وتنفيذ التصنيف والانحدار. ويضم مرحلتين المستخدمة يمكن أن تكون مشتركة، للحصول على صورة النتائج المتوقعة بشكل أسرع.

أسرع R-CNN لديها اثنين من النواتج لكل مرشح، والتسمية والتصنيف، والآخر هو حدود الكائن. قناع RCNN هو أساس اثنين من إخراج أسرع RCNN على إضافة إخراج قناع، قناع هو قناع ثنائي بكسل الهدف في الإطار الذي يمثله. ولكن القناع الناتج المضافة حديثا مع تصنيف الأصلي وإخراج الحدود مختلفة، فإنه يحتاج كائن أدق التخطيط المكاني ومعلومات الموقع. ولذلك، قناع R-CNN الحاجة إلى استخدام "الشبكة العصبية الالتواء الكامل" (FCN).

التفاف كامل الشبكة العصبية (FCN) العمارة خوارزمية

"الشبكة العصبية التفاف كامل" هو "تقسيم الدلالات" في خوارزمية شائعة جدا، والذي يستخدم الإلتواء وتجميع طبقات من كتل مختلفة، بفك أول صورة لأحد به الأصلي حجم والثلاثين، ثم هذا المستوى توقع تصنيف من التفاصيل، واستخدام الأخير من يصل أخذ العينات لاستعادة طبقة الصورة إزالة التفاف إلى الحجم الأصلي.

ولذلك، قناع RCNN يمكن أن يقال أن تكون أسرع RCNN و "التفاف كامل الشبكة العصبية" هذه الشبكتين دمج معا لتشكيل هيكل شبكة ضخمة.

التطبيق العملي للقناع RCNN

  • اختبار صورة

يمكنك استخدام رمز مشترك على موقع TensorFlow إلى الصورة اختبار قناع RCNN. وفيما يلي نتائج الاختبار الخاص بي:

قناع RCNN على الطائرات الورقية صورة

  • فيديو اختبار

بالنسبة لي، والأكثر إثارة للاهتمام هو استخدام أشرطة فيديو يوتيوب لاختبار النموذج. أنا تحميل عدد غير قليل من أشرطة الفيديو من يوتيوب، بدأت اختبار الفيديو.

فيديو اختبار رئيسي خطوات من:

ميزات 1. VideoFileClip المستخرجة من كل إطار من الفيديو؛

وظيفة 2. fl_image اتخذت كل اكتشاف كائن صورة الفيديو، ومن ثم استبدال صورة الفيديو الأصلي باستخدام صورة الفيديو المحورة؛

3. وأخيرا، يتم تعديل صورة الفيديو في شريط فيديو جديد.

عنوان جيثب: الشبكي: //github.com/priya-dwivedi/Deep-Learning/blob/master/Mask_RCNN/Mask_RCNN_Videos.ipynb

قناع RCNN دراسة متعمقة

والخطوة التالية هي لاستكشاف ما يلي:

  • A دقة أعلى من نموذج الاختبار، اختبار نتيجة للفرق بين لوحظ الاثنين؛

  • اختبار TensorFlow الكشف عن وجوه باستخدام قناع API RCNN في مجموعة البيانات المخصصة.

هذه المادة التي جمعتها الشبكة عمود لى فنغ، أعيد طبعها بإذن من شبكة لى فنغ.

kdnuggets عبر

غمضة عين 14 عاما وقت وافته المنية الألعاب برنامج سيعيد مجلس CCTV

مجهزة 21: عرض 9 أوسع من سوني اريكسون 10Plus يا طريقة جديدة

أول المنتجات الروبوت الذكية العائلة بدأت رسميا سعر الدخن من 2299 يوان

ومرنة شاشة الهاتف المحمول التعرض الدخن مرة أخرى: جميع أنواع العمليات وكامل وأسود

على غرار سيارة الشباب Erhai اختبار قيادة الهيئة العامة للاستثمار KX5 جديد

"فاينل فانتسي 14" 5.0 وظيفة جديدة "الراقصات" أعلن عدد من المعلومات العامة الجديدة

بطولة العملاق الصين والولايات المتحدة بدءا الصاخبة

"الشعر العيون المتعبة نهاية العالم" السلاح السري فتح، سونيا لعب دور الذكور السيف فنون الدفاع عن النفس

نعمة مقنعة! عودة ملاحظة سامسونج 7 يمكن تغيير مباشرة بعد سبعة هواتف النقالة

تكثيف المنافسة AI! BAT الرقمية العصابات الحديث عن تطوير مستقبل الذكاء الاصطناعي

إعادة تعريف HTC بالحرج عنوان المدى المتوسط

شراء؟ "الذئب الظل وافته المنية درجتين."