كيف تأتي التوت بسهولة اكتشاف أهداف التعلم عمق؟

مذكرة لى فنغ الشبكة: هذه المادة هي عبارة عن تجميع للAI Yanxishe بلوق التكنولوجيا، والعنوان الأصلي كيفية الكشف بسهولة كائنات مع ديب التعلم على التوت بي، ومؤلف سارثاك جاين. الترجمة | القليل شقيق البابون التدقيق | تشاو التشطيب | جيانغ فان

هذا سبب الكثير من التحديات في العالم الحقيقي، مثل بيانات محدودة، فقط أجهزة الكمبيوتر الصغيرة (مثل الهواتف النقالة، والتوت فطيرة) التي تسببها التعلم العميق لا يمكن تشغيل نماذج معقدة. توضح هذه المقالة كيفية استخدام إرسالها التوت للكشف عن الهدف. مثل القيادة على الطرق السيارة، والبرتقال الثلاجة والتوقيع والفضاء تسلا على الملف.

تنويه: أنا بناء nanonets.com لمساعدة آلة بناء نماذج لاستخدامها مع القليل من البيانات وأي أجهزة كمبيوتر التعلم.

إذا كنت عاجلة جدا، يرجى ينزل إلى أسفل من هذه المادة مباشرة إلى مستودع جيثب.

الكشف عن سيارة على الطريق في مومباي

لماذا الكشف عن الهدف؟ لماذا هو التوت بي؟

التوت بي هو جهاز كمبيوتر مرن، أنها باعت 15 مليون وحدة جذبت قلوب جيل من المستهلكين، والمتسللين الكثير من بارد التوت حان لإنشاء المشروع. وبالنظر إلى عمق التعلم والتوت بي كاميرا شعبية، ونحن نعتقد انه اذا تمكنا من استخدام التعلم العميق في التوت تأتي في الكشف عن أي كائن ستكون كبيرة.

الآن يمكنك الكشف عن الصور الخاصة بك الصورة الذاتية في انفجار قنبلة، شخص دخل أقفاص Harambe، حيث صلصة الفلفل الحار أو البريد السريع في منطقة الأمازون في منزلك.

ما هو الكشف عن الهدف؟

2000 سنة من التطور يجعل النظام البصري البشري قد تطور بشكل كبير أعلى. الدماغ البشري هو 30 من الخلايا العصبية المسؤولة عن معالجة المعلومات البصرية (في مقابل 8 فقط عن طريق اللمس تجهيز والسمعية تجهيز 3). مقارنة مع الآلات والبشر لديهم اثنين من المزايا الرئيسية. أولا، الرؤية، والثاني هو توفير تدريب مجموعة بيانات غير محدودة تقريبا (الطفل عن خمس سنوات من العمر ويمكن الحصول على 2.7B بيانات الصورة أثناء الفاصل الزمني أخذ العينات في 30fps).

من أجل أداء تقليد على مستوى الإنسان، والعلماء البصرية المهام التصور إلى أربع فئات مختلفة.

1. تصنيف تحديد تسمية للصورة.

2. حدد تحديد الحدود لتسمية محددة.

3. الكشف عن وجوه ، رسم الحدود متعددة في الصورة.

4. تقطيع الصورة لإعطاء الموقع الدقيق للكائن في منطقة الصورة.

الكشف عن وجوه غير كافية جيدة للعديد من التطبيقات (تقطيع الصورة هي نتيجة أكثر دقة، فإنه يؤثر على إنشاء بيانات التدريب المعقدة. وبالمقارنة مع رسم إطار فإنه عادة ما يستغرق 12 أضعاف إنسان وقت يتميز لصورة الانقسام.) بالإضافة إلى ذلك، بعد الكشف عن كائن، ويمكن تقسيم الكائن حتى في الحدود منفصل.

استخدام الكشف عن وجوه:

الكشف عن الهدف له أهمية عملية مهمة، وقد استخدمت على نطاق واسع في جميع مناحي الحياة. وفيما يلي بعض الأمثلة:

كيف يمكنني استخدام الكشف عن وجوه لحل مشاكلهم؟

الكشف عن وجوه يمكن استخدامها في حل العديد من المشاكل. هذه هي التصنيف العام:

1. الكائن ليس في صورة بلدي؟ على سبيل المثال، في بيتي هناك متسلل.

2. في صورة كائن الذي الموقف؟ على سبيل المثال، عندما انفجرت سيارة تحاول التنقل في جميع أنحاء العالم، فمن المهم أن نعرف مكان وجود الكائن.

3. عدد الكائنات في الصورة يكون؟ وجوه الكشف عن عدد من الكائنات هو واحد من أكثر طريقة فعالة من الحساب. على سبيل المثال، كم عدد المربعات الموجودة على رفوف المخازن.

4. ما هي أنواع مختلفة من الكائنات في صورة لها؟ مثل المناطق التي من حديقة الحيوان ما الحيوان؟

5.  كيف كبيرة حجم الكائن؟ خاصة استخدام كاميرا ثابتة، فمن السهل لحساب حجم الكائن. على سبيل المثال، حجم المانجو.

6. كيف هي التفاعل بين الأجسام؟ على سبيل المثال، تكوين في كرة القدم هو كيف يؤثر على نتيجة المباراة؟

7. في أوقات مختلفة من موضع الكائن (تتبع كائن)؟ مثل مسار القطار ككائن وحساب سرعتها.

الانتهاء من الكشف عن وجوه في خط 20

YOLO خوارزمية التصور

وهناك عدة نماذج أو هياكل للكشف عن وجوه. كل المفاضلة بين السرعة والدقة والحجم. لقد اخترنا معظم شعبية واحدة: YOLO (أن تبحث فقط مرة واحدة)، وتبين كيف 20 أسطر من التعليمات البرمجية (تجاهل تعليق) العمل.

ملاحظة: هذا هو رمز الزائفة، ليست أمثلة العمل مباشرة. أنه يحتوي على مربع أسود قياسي جدا، التكوين CNN هو مبين أدناه:

يمكنك أن تقرأ (YOLO) النص الكامل: الشبكي: //pjreddie.com/media/files/papers/yolo_1.pdf

YOLO باستخدام التلافيف هندسة الشبكات العصبية أقل من 20 خطوط للقانون، على النحو التالي:

تعلم كيفية بناء نموذج للكشف عن عمق الهدف؟

دراسة متعمقة سير العمل من ست خطوات أساسية، وينقسم إلى ثلاثة أجزاء:

1. جمع مجموعة التدريب

2. نموذج التدريب

3. توقع صورة جديدة

المرحلة 1 - بيانات التدريب جمع

وقد تم جمع الصور الخطوة 1. (لا يقل عن 100 لكل كائن)

......

تريد مواصلة القراءة، يرجى الانتقال إلى مجتمعنا AI Yanxishe: HTTP: //www.gair.link/page/TextTranslation/904

المزيد من المحتوى المثير لجعل AI Yanxishe.

مختلف المجالات بما في ذلك رؤية الكمبيوتر، ودلالات الكلام، سلسلة كتلة، الطيار الآلي، واستخراج البيانات، التحكم الذكي، لغات البرمجة وغيرها تحديثها يوميا.

شبكة لى فنغ (عدد الجمهور: ليو فنغ شبكة)

انقر لقراءة النص الأصلي [نهاية] لمشاهدة المزيد من المحتوى:

واستنادا إلى مكتبة برمجية مفتوحة للرؤية الحاسوبية (C ++ / بيثون) نفذت باستخدام دراسة متعمقة من أصل كشف فتة البشري

كيفية استخدام إطار أزور Horovod في كائن وزعت كشف دراسة متعمقة

كشف كائن استنادا إلى عمق التعلم باستخدام مكتبة برمجية مفتوحة للرؤية الحاسوبية YOLOv3

أمازون وجوجل ومايكروسوفت، تواجه الشركات مقارنة الاعتراف

ستانفورد CS231n لي Feifei الكمبيوتر الكلاسيكية دورات الرؤية (باللغة الإنجليزية والترجمة الصينية + + وظيفة لشرح الحصة الفعلية)

في انتظاركم لتفسير:

يمكنك حل مشكلة الأحرف الكشف في غضون 10 دقيقة من ذلك؟

كيفية استخدام مكتبة برمجية مفتوحة للرؤية الحاسوبية لكتابة نود.جي إس اجهة سطر الأوامر صورة تصنيف ونموذج الشبكة العصبية

التعلم العميق من أسلوب الإشراف

سوناتا تجميل رسميا مظهر من التحسينات الداخلية

"الليلة في المسرح الرومانسي" الافراج اليوم 9 يسلط الضوء على إنشاء أحلى عيد الحب 2019

عيد الحب لجميع أولئك الذين يحبون العلم والتكنولوجيا القصة دائرة

قديم مقاومة للعب التحكم الرئيسية، والتفكير الملابس، معدات التحليل

BYD أودي سيارة فاخرة يسمى الخفيفة مصنع المدنيين المعروف أيضا باسم الخفيفة مصنع الصين؟

ريماك مفهوم S تشغيل فائقة نقية الكهربائية 2.5 ثانية Pobai

وو ين للبتروكيماويات مقصور على فئة معينة، كنت حقا يتقن ذلك؟

بوش أوتوموتيف الاستجابة إلى التغيير، "ثمانية عشر أسلحة."

يوصى بشدة أن تبدأ في نهاية خمسة أسود، أديداس EQT سادة ADV تظهر الروح الأسود شاذ الشعور الطليعية

التصنيف فيروس كمبيوتر عشرة قبل بضع سنوات، وكنت أعرف القليل

"A يتا: معركة انجيل" يتعرض "تدريب الكونغ فو" جعل من كاميرون قال إن "الموالية للابنة" لا يجوز العبث

وو الين ملك المجد للغناء نفس الأغنية، لا أحد يطلب مني أن تكون على استعداد للعب هذا التجسد العظيم