وأخيرا! Supervise.ly نشر صورة مجموعة البيانات تجزئة عليه (حر مفتوح المصدر)

مذكرة لى فنغ الشبكة: هذه المادة هي عبارة عن تجميع لللى فنغ ترجمات بلوق التكنولوجيا المجموعة، العنوان الأصلي الإفراج عن "Supervisely الشخص" بيانات للآلات التدريس للإنسان قطعة، مؤلف Supervise.ly.

الترجمة | Guonai تشياو وانغ نينغ تشانغ هو جين التشطيب | فان شوان وو جيانغ

ونحن فخورون جدا أن أعلن هنا، Supervisely صورة بيانات الإفراج. ومن العام والمجاني، فقط للأغراض الأكاديمية.

منظمة العفو الدولية لجعل وصول الجميع، ونحن لا تحتاج فقط مفتوحة المصدر، ولكن أيضا قوية حركة "البيانات المفتوحة". - أندرو نغ

ونحن نتفق معه بالتأكيد، ودعونا توسيع هذه الفكرة. لتجزئة الدلالي من الشخصيات، وهناك الكثير من البحث العميق على الشبكة العصبية. ومع ذلك، في معظم الحالات، وجمع البيانات من خوارزميات تطوير وتطبيق لتشغيل البيانات أكثر صعوبة وتكلفة.

هذا هو السبب في أننا بحاجة إلى منبر المصممة خصيصا يمكن أن تغطي تعلم آلة العمل كله من مجموعة بيانات التدريب لتطوير ونشر تدريب الشبكة العصبية.

عدة أمثلة من "Supervisely بيانات صورة"

ونحن نعتقد أن عملنا سيساعد المطورين والباحثين ورجال الأعمال. من أجل إنشاء كبيرة مجموعات التدريب على معلومات بشكل سريع، لا يمكن أن ينظر عملنا فقط كمجموعة البيانات العامة، ويمكن أن ينظر إليها على أنها أساليب وأدوات مبتكرة.

بعد ذلك، سنقوم بشرح كيفية بناء من الصفر مجموعة البيانات هذه، اسمحوا لي أن تظهر لك بعض الحقائق المثيرة للاهتمام:

  • مجموعة البيانات يتكون من 5711 تكوين الصورة، وهناك أمثلة للجسم البشري ملحوظ 6884 جودة عالية.

  • كافة الخطوات التالية في Supervisely الداخلية إنجازه دون أي ترميز.

  • الأهم من ذلك، يتم تنفيذ هذه الخطوات داخل تعليقي ليس الخبرة تعلم الآلة. العلماء البيانات فقط لمراقبة وإدارة العملية.

  • تعليق من قبل اثنين من أعضاء المجموعة والعملية برمتها استغرق أربعة أيام فقط.

Supervisely هي الحكمة من منصة التعلم الآلي تحتوي على علم البيانات. انها تسمح للعلماء البيانات للتركيز على مبتكرة حقا، وترك العمل اليومي لأشخاص آخرين (نعم، المعروفة تدريب هندسة الشبكات العصبية هي أيضا وظيفة عادية).

لحل المشكلة

في العديد من التطبيقات في العالم الحقيقي، فإن المهمة الرئيسية هي لتحليل صورة الكشف عن صور الإنسان في الاعتراف الحركة التلقائية القيادة مراقبة السيارات، والفيديو، والتطبيقات النقالة تستخدم.

أجرينا شركة DeepSystems دراسة داخلية، مما يجعلنا على بينة من عدم وجود بيانات على المهام كشف الإنسان. قد تسأل لنا: ما COCO، باسكال، Mapillary والبيانات العامة الأخرى المنصوص عليها؟ للإجابة على هذا السؤال، وأنا سوف تظهر أفضل لك بعض الأمثلة:

COCO من عدة بيانات البشري تدل سبيل المثال

معظم بيانات الاختبار الإنسان مجموعة نوعية البيانات العامة لا يلبي متطلباتنا، علينا خلق مجموعات البيانات الخاصة بك، وتقديم تعليقات الجودة، انا اقول لكم كيف فعلنا ذلك.

خطوة 0: مجموعة بيانات المشترك وعلى استعداد للتحميل، كنقطة مبدئية للتدريب الأولي للشبكة العصبية

مجموعات البيانات العامة التي يتم تحميلها إلى النظام: PascalVoc، Mapillary. لدينا "استيراد" تدعم وحدة مجموعة البيانات الأكثر شيوعا وتحويلها إلى على أساس الشكل القائم سلمان، ودعا شكل Supervisely موحد :)

ونحن أداء DTL ( "تحويل البيانات اللغة") الاستعلام لتنفيذ بعض الإجراءات: دمج مجموعات البيانات - > تخطي الصور من دون الناس - > من الجميع صورة الاقتصاص - > تصفية حسب العرض والارتفاع - > مقسمة إلى مجموعة التدريب / الاختبار.

دمج، وزراعة المحاصيل وتصفية مجموعة البيانات المشتركة البيانات الخام

يبدو ان لديه الكثير من البيانات المتاحة للجمهور، ولكن ذكرنا سابقا، هناك بعض المشاكل الخفية: منخفض الشرح جودة، دقة منخفضة وهلم جرا.

لذلك، قمنا ببناء أول مجموعة التدريب البيانات.

الخطوة 1: تدريب الشبكة العصبية

ونحن سوف UNET مثل الهندسة المعمارية التخصيص قليل

العمارة Unet_v2

ثنائية الكون خسارة + الخسارة = (ل - عدد عشوائي).

سرعة شبكة التدريب، هو دقيق جدا، وسهلة لتنفيذ وتخصيص. لأنها تتيح لنا الكثير من التجارب. Supervisely قد تكون موزعة على عدد وافر من العقد في الكتلة.

ولذلك، فإننا يمكن تدريب العديد من الشبكات العصبية في نفس الوقت. كل نفس الشبكات العصبية لدعم تدريب متعددة GPU على منصتنا. كل قرار اختبار التدريب المدخلات هو 256 * 256 وليس أكثر من 15 دقيقة.

الخطوة 2: البيانات الشرح إعداد

نقوم به لا تحمل علامات مميزة لا صورة جمع، لذلك قررنا أن تنزيله من الإنترنت. ونحن ندرك هذا المشروع على جيثب، والتي يمكنك تحميل البيانات من مكتبة الصور ممتازة، والانتهاء من Pexels (الشكر لله، وهذا هو عمل رائع حقا).

ولذا فإننا تحميل الصور عن 15K، الذي يحتوي على معلومات تتعلق تسميات مهمتنا، وتحميله على Supervisely وتنفيذ الاستعلام عملية تغيير الحجم التي كتبها DTL، بسبب فائقة حلها.

الخطوة 3: صورة الشبكة العصبية تحمل اسما

الأمثلة السابقة العمارة لا يدعم تجزئة. لذلك نحن لا تستخدم قناع RCNN، وأقرب إلى حافة كتلة منخفضة من تقسيم الكائن.

لهذا السبب قررنا أن نفعل خطة من خطوتين: تطبيق أسرع، RCNN (على NASNET) للكشف عن أي شخص على الصورة، مربع ثم إحاطة لكل تجزئة الشبكة التطبيق الرجل لتقسيم الكائن المهيمن. هذا يضمن النهج الذي نحن ليس فقط محاكاة تجزئة المثال وبدقة تقسيم حواف الكائنات.

3 دقائق من تطبيق نموذج الفيديو والكشف الصحيح يدويا

حاولنا قرارات مختلفة: NN نعبر إلى دقة أعلى، كلما كان ذلك أفضل النتائج التي تنتج. نحن لا نهتم إجمالي وقت الاستدلال، لأن الدعم Supervisely المنطق توزيعها عبر عدة آلات. للمهام العنونة قبل التلقائية، كان كافيا.

الخطوة 4: التحقق اليدوي وتصحيح

يتم عرض كافة الاستدلالات في لوحة المعلومات في الوقت الحقيقي. المشغلين لدينا لمعاينة كل النتائج واستخدام عدة علامات علامة صورة: التنبؤ سيئة، والتنبؤ الصحيح، والتنبؤ الجيد. هذه العملية بسرعة، لأنها تتطلب القليل جدا اختصار لوحة المفاتيح "الصورة التالية" و "صورة التسمية التوزيع."

كيف نحتفل صورة: اليسار - سيئة توقعات، - الحاجة للتنبؤ طفيف التصحيح اليدوي، والحق - التنبؤ الجيد.

وضع علامة على أنه يتم تخطي "التنبؤ سيئة" صورة. لا يزال مزيد من العمل لمعالجتها ونحن بحاجة إلى تصحيح الصورة.

كيفية تصحيح التنبؤ الشبكة العصبية

الوقت اللازم لتصحيح اليدوي هو أقل بكثير من التعليقات من الصفر.

خطوة 5: يتم إضافة النتيجة إلى مجموعة بيانات التدريب وانتقل إلى الخطوة 1

كاملة!

بعض النصائح:

  • عندما كنا لا ينطبق إلا على البيانات العامة للتدريب NN، و "الحق" صورة (وصفت بانها "توقعات جيدة" و "التنبؤ الصحيح") نسبة حوالي 20.

  • بعد التكرار السريع شجرة، ارتفع هذا الرقم إلى 70. أكملنا ما مجموعه 6 مرات التكرار، وNN النهائي تصبح دقيقة جدا :-)

  • قبل التدريب، ونضيف إلى مجموعة صغيرة من حواف الكائن لتجانس حواف خشنة وأداء مجموعة متنوعة من التحسينات: الوجه، زراعة المحاصيل عشوائي، والتناوب وزاوية تحويل لون عشوائي. كما ترون، حتى إذا كنت بحاجة إلى المزيد من التعليق طبقات الكائن على الصورة، وهذا الأسلوب ينطبق أيضا على العديد من المهام رؤية الكمبيوتر.

  • مكافأة

    هذه مجموعة من البيانات لمساعدتنا على تحسين AI أدوات الدعم الشرح - مخصصة لاستخدامها للكشف عن البشر. في النسخة الأخيرة لدينا، وأضاف لدينا القدرة داخل منظومة التدريب NN. ما يلي هو أداة المقارنة على أساس نسخة مخصصة من هذه الفئة. كان متوفرا، يمكنك أن تجرب البيانات الخاصة بك.

    كيفية الوصول إلى مجموعة البيانات

    تسجيل Supervisely، أدخل "استيراد" التبويب - >  "مجموعات البيانات مكتبة". انقر على "Supervisely الشخص" مجموعة البيانات، وكتابة اسم للمشروع الجديد. ثم انقر فوق الزر "ثلاث نقاط" - > "تحميل بتنسيق سلمان" - > زر "ابدأ". وبهذه الطريقة، فإن مجموع وقت التحميل قد يستغرق 15 دقيقة (~ 7 GB).

    كيفية تحميل النتائج

    استنتاج

    كيف ننظر إلى أي خلفيات ML لاستكمال جميع الخطوات مثيرة للاهتمام للغاية. نحن يوفر الكثير من الوقت ومن الخبراء التعلم العميق، لدينا فريق تصبح أكثر كفاءة والتعليقات في سرعة تعليق والجودة.

    نأمل أن منصة Supervisely مساعدة بعضهم عمق فريق التعلم أسرع وأسهل إنتاج المنتجات AI.

    واسمحوا لي أن قائمة وظيفة Supervisely الأكثر قيمة التي استخدمناها في هذا العمل:

    1. "استيراد" وحدة يمكن تحميل جميع مجموعات البيانات العامة

    2. "تحويل البيانات اللغة" للعمل، وتوطيد وتعزيز مجموعات البيانات

    3. وحدة "NN" أسرع-RCNN وUnetV2

    3. "الإحصاء" وحدة الحصول على معلومات مفيدة من البيانات التي لدينا في تلقائيا

    4. "الشرح" مثل فوتوشوب الى تدريب البيانات لميزة "التعاون" التي تسمح للموظفين والملاحظات مجتمعة فريق المهام تعيين بالنسبة لهم، والسيطرة على العملية برمتها.

    موقع بلوق https://hackernoon.com/releasing-supervisely-person-dataset-for-teaching-machines-to-segment-humans-1f1fc1f28469

    شبكة متصلة شبكة لى فنغ لى فنغ توصية

    أنا لا أعرف كيف لبدء تعلم الآلة؟ التي اتخذت دليل المبتدئين!

    لى فنغ المجموعة هو تجنيد ترجمات

    مسح كود Fanger وي

    تصريحات "اسم المجموعة لى فنغ ترجمات +" تعال معنا

    الذكاء الاصطناعي تمكين رفع مستوى الصناعة، AI + سيناريو الهبوط الدخول في "اندلاع"

    كنت صغيرا جدا ولكن لدي نظام قوي --mini-STX

    "AI + المشهد الذكي الجديد" كونكا الترقية مرة أخرى تألق AWE

    هوانغ بو عش المحمولة جوا إستغاثة الحفل جوقة "عرض جيد"، وأغنية التفجير الجمهور

    أصدرت ألمانيا وإيطاليا "كانغ سايت" المطبخ الكهربائية أزياء العلامة التجارية

    "أسطورة ولادة" مراهق الأحياء الفقيرة شنقا كان مفتوحا الهجمات المرتدة مثل "ملهمة يجب أن نرى الله"

    كانون الصغرى واحد يتبع اليوم يبدو كبيرة بعض الشيء

    وو لي لاول مرة، NBA السنة الصينية الجديدة السنة القمرية الجديدة، سوبر السلطانية ...... هذه الأحداث الرياضية لمرافقتك للعام الجديد

    يمكن نقلها إلى رسم معنى من سوني تفسير 8K TV أعمال سلسلة صناعة قمة

    ارون كوك تشو يون فات التجسد، "مذكرات مقياس ريختر الغش" من صنع جنون المزيفة "ووريورز" إلى "المحفوظات الوطنية أغنى رجل"

    AMD عصر المحاصر من معجون الأسنان إلى متى

    نينتندو ربيع 2019 معرض مستقل ملخص محتوى اللعبة