كشف الهدف مسابقة الأسلحة النووية: Vimicro نموذج من خطوة واحدة خوارزمية دوليا السباق الأول!

الأنفس جي تقرير جديد

المصدر: Vimicro

[استعراض فاز جي الجديدة في الآونة الأخيرة، ورؤية الكمبيوتر في المنافسة VOC باسكال الدولية، Vimicro على درجة من مجموع 89.0 نقطة في المرتبة الأولى، وفاز بالمركز الأول في نموذج واحد الكشف عن الهدف. نموذج الفوز هو نموذج من خطوة واحدة للكشف عن الهدف، فإنه يجلب التكنولوجيا شرح.

في الآونة الأخيرة، VOC comp4 المنافسة الكشف عن الهدف باسكال، Vimicro تحقيق نتائج أفضل، حصل أول نموذج الكشف عن الهدف واحد .

VOC باسكال هو حقل سباق ذات الشهرة العالمية من رؤية الكمبيوتر، لعبة، المتسابقون إلى الناس والقطط والطيور والطائرات والسيارات والقوارب، محفوظ بوعاء النباتات وغيرها من 20 فئات من الأجسام المكتشفة. نظرا لعينات التدريب أقل، المشهد حيوية جدا وصعبة جدا. الفرق المشاركة Vimicro الذكاء الاصطناعي VIM_SSD على درجة من مجموع 89.0 نقطة في المرتبة الأولى.

وقال Vimicro الذكاء الاصطناعي تكنولوجيا رقاقة رئيس الشركة والمدير العام تشانغ Yundong: "هذا النموذج المنافسة مناسبة لبسيطة من خطوة واحدة نموذج خوارزمية المعدات الطرفية نشر خوارزمية نموذج متعددة يمكن تحقيق نتائج مماثلة إلى خادم سحابة معقدة، لأنها ليست سهلة. AI شركات الرقائق، ونحن يجب أن لا يقتصر التميز في تصميم رقاقة، ولكن أيضا لجعل انفراجة في تبسيط خوارزمية الأمثل، لتوفير الأمامية المعدات ذكية من الحل الشامل ".

خطوة واحدة نموذج الكشف عن الهدف

قدمت Vimicro دراسة متعمقة ثابت من هذا النموذج نموذج والتعلم العميق السباق الأخير، لا يزال يتبع نموذج من خطوة واحدة للكشف عن الهدف شبكة الأساسية باستخدام VGG16، وعدم استخدام ResNet-101، ResNet-152 وغيرها من شبكة أكثر تعقيدا، لضمان دقة وسرعة حيث أسرع. السباق الأول من النتيجة هو 87.6، وهذا هو 89.0، تم تحسين دقة كثيرا. والنتيجة هي ليس فقط خطوة واحدة من جميع الخوارزميات، وتغلبنا على كل خوارزمية من خطوتين.

وقال AI قوه، نائب رئيس الأبحاث Vimicro الذكاء الاصطناعي تكنولوجيا رقاقة والتنمية: "إن عمق نموذج التعلم لدينا هو ترقية شاملة من النموذج السابق، لا تزال تستخدم في هندسة الشبكات خطوة واحدة، مع التركيز على تحسين وتعظيم الاستفادة من أساليب وتقنيات المتعلقة بالتدريب، في دون زيادة تعقيد الخوارزمية، مما يجعل الشبكة أكثر وأكثر دقة عالية، والذي هو بناء تكنولوجيا شركتنا الأساسية. في حالة الأمامية مقيدة الموارد الحاسوبية الأجهزة المدمجة، ونحن تحسين دقة من خلال تعديل هيكل الشبكة وتدريب الأساليب، بدلا من زيادة تعقيد الشبكة . "

VOC 2012 مجموعة البيانات نتائج الاختبار الصورة

ليس فقط هو نموذج واحد، وخطوة واحدة، وخاصة بالنسبة NPU جزءا لا يتجزأ من

متعدد نموذج الانصهار وكثيرا ما يستخدم في لعبة التعلم العميق للسلاح، فإنه عادة ما النتائج التي يمكن الترويج لها في مجموعة متنوعة من التلاعب مهمة تعلم الآلة. وكما يوحي اسمها، هو مزيج من عدة نموذج النظر في عدد من نماذج مختلفة، وتنصهر نتائجها معا.

وعلى الرغم من الانصهار في كثير من الأحيان أفضل من نموذج، ولكن تكاليف تنفيذها والنفقات العامة الحسابية كبيرة نسبيا. حاليا، يعتبر Vimicro أساسا من منظور التطبيق الفعلي للمشروع، وخاصة تطبيق الأمامية، نموذج واحد عموما. بطبيعة الحال، فإن الأخير سوف تنظر أيضا في استخدام التكامل النموذج، لتعزيز دقة نتائج المسابقة.

عشرة، فإنه يمكن النظر إلى الجدول التالي قبل المنافسة VOC باسكال، ما يلي خوارزمية معظم تطبيقات الشبكة أكثر تعقيدا استنادا ResNet-101 وResNet-152، وهي عملية من خطوتين، وهناك العديد من النماذج الانصهار (الفرقة). ونموذج Vimicro ليس فقط هو نموذج واحد، وخطوة واحدة في NPU جزءا لا يتجزأ من تحقيق معدل إطارات عالية.

طريقة

العمود الفقري

خريطة ()

Ali_DCN_SSD_ENSEMBLE

ResNet-101

89.2

طاقم

VIM_SSD (COCO + 07 ++ 12، نموذج واحد، مرحلة واحدة)

VGG16

89.0

مرحلة واحدة

وحيد

FOCAL_DRFCN (VOC + COCO، نموذج واحد)

ResNet-152

88.8

على مرحلتين

وحيد

R4D_faster_rcnn

-

88.6

-

-

FF_CSSD (VOC + COCO، مرحلة واحدة، نموذج واحد)

ResNet101

88.4

مرحلة واحدة

وحيد

R-FCN، ResNet فرقة (VOC + COCO)

ResNet

88.4

على مرحلتين

طاقم

HIK_FRCN

ResNet-101

87.9

على مرحلتين

وحيد

VIM_SSD

VGG16

87.6

مرحلة واحدة

وحيد

تشوه R-FCN، ResNet-101 (VOC + COCO)

ResNet-101

87.1

على مرحلتين

وحيد

RefineDet (VOC + COCO، singlemodel، VGG16، مرحلة واحدة)

VGG16

86.8

مرحلة واحدة

وحيد

علي بابا الدامور شبكة المستشفيات درجة الانصهار Ali_DCN_SSD_ENSEMBLE عن العديد من النماذج من 89.2، وارتفاع 0.2 نقطة فقط من الشبكة وضع vimicro واحدة، وعلي بابا الدامور المستشفى FF_CSSD (VOC + COCO، مرحلة واحدة، نموذج واحد) خطوة واحدة نموذج واحد دقة هو 88.4، وشبكة الأساسية هي ResNet101، والتفضيلية STAR 0.6 نقطة.

من المراقبة الامنية لحماية الحياة البرية المهددة بالانقراض، ومجموعة واسعة من السيناريوهات تطبيق

تستخدم على نطاق واسع في مجال تكنولوجيا الكشف عن الهدف، وهي واحدة من المشهد الهبوط AI الفني الرئيسي. Vimicro نموذج التعلم عمق تعمل في الواجهة الأمامية الأجهزة الذكية (مثل رئيس الكاميرا الذكية)، وتستخدم على نطاق واسع في المراقبة الأمنية، ومجال السلامة، وحماية البيئة، والمراقبة الصحية الشخصية.

هنا مثال لحماية البيئة في غرب الصين والتبت تطبيق، والذي يستخدم الذكاء الاصطناعي، ودراسة معمقة للكشف عن حماية الحيوانات البرية، وتحديد والإحصاءات. وذلك لتحقيق هدف الحفاظ على الحياة البرية، والتوازن الإيكولوجي للبيئة. وفقا لمتطلبات الوطنية، لتعزيز الوعي بحماية الحياة البرية، وحماية البيئة، وخاصة للبحوث وحماية الحياة البرية المهددة بالانقراض، ولكن أيضا لتكثيف، من البحث العلمي، وجهة نظر فنية لحل الحفاظ على الحياة البرية وعدد من الوضع في الوقت الحقيقي.

الرسم البياني التالي، هو الكشف عن التبت الظباء، وتحديد والإحصاءات:

الرسم البياني التالي، هو رصد التبت البرية الحمار، وتحديد والإحصاءات:

مفهوم ملاحظة

دقة: مؤشر كشف الهدف هو قياس دقة التعرف خريطة (يعني متوسط الدقة). الكشف عن الكائنات في فئات متعددة، كل فئة قد رسم منحنى وفقا لاستدعاء والدقة، AP هي المنطقة تحت المنحنى، ومتوسط عدد وافر من فئات خريطة AP، وأقصى خريطة النظرية 1.0، وهذا هو، ونحن نقول 100 نقطة، 89 نقطة هو في الواقع 0.89 الخريطة، وفيما يلي توضيحية.

ذكية وذكية سحابة الأمامية : تم تجهيز الأمامية الذكية إلى الواجهة الأمامية للتحليل خوارزمية المخابرات الجهاز، على سبيل المثال أخذ الكاميرات الأمنية، ومحتوى الفيديو التي تم التقاطها بواسطة الكاميرا وتحليلها المستخرج على الفور الصورة الرئيسية، من الفائدة، معلومات فعالة، بنية البيانات من النموذج. الاستخبارات على حافة بسبب مجموعة متنوعة من القيود المفروضة على الموارد، والحاجة لفرض قيود على تعقيد الخوارزمية، حجم نموذج الشبكة.

يتم جمع البيانات محرك ذكي من مستشعر لاستكمال الواجهة الأمامية للتحليل ذكي من الغيوم، ويتم إنجاز ذلك بشكل عام من قبل الملقم GPU كبير. لذلك، مع احترام لذكاء الأمامية، والموارد الحاسوبية، موارد الذاكرة وموارد التخزين، وموارد الشبكة، كبيرة جدا، لذلك القيود المفروضة على نموذج الخوارزمية هي صغيرة نسبيا، يمكنك نشر الكثير من نموذج شبكة معقدة جدا.

[] تاريخ المجتمع

جي وون AI التكنولوجيا + قطاع التوظيف المجتمع الجديد، رحب هبطت طلاب + AI صناعة تكنولوجيا الفائدة، بالإضافة إلى ليتل مساعد مايكرو إشارة: aiera2015_3 في المجموعة، وإذا سيدعى في المجموعة المعتمدة، تأكد من تعديل التصريحات بعد الانضمام إلى جماعة المجتمع (الاسم - الشركة - فرص العمل، مجموعة المهنية للمراجعة أكثر صرامة، يرجى فهم).

لي البالغ من العمر 39 عاما دونغ غوك أربعة أهداف في ثلاث مباريات كفاءة الإرهاب، لا تزال أكبر تهديد للحق في الصحة، والحق في احترام بمثابة قيود المصادر الرئيسية

انظر ركض الشرطة الهارب بعيدا، أقل من 500 متر الشلل متعب والشرطة: يسمح لك 800 متر

عندما سقطت مبيعات بنتيوم من الطراز الهاوية، X40 لا تهدف إلى النجاح، لكنها محاولة للغاية

تشينغمينغ كنت وضعت ثلاثة أيام، وانا ذاهب لوضع فى قوانغشى خمسة أيام!

AFC معاينة: الصين وجمهورية كوريا شاملة PK، Hengda قاء التأهل الحرب الرئيسية، والحق في الصحة القتال من الصعب جيونبوك

مورسيلاغو LP670-4 SV سرعة الطوطم

لماذا FBI القبض على مهندسين صينيين؟ أبل المركبات غير المأهولة التعرض التقاضي سبعة من الداخل

الخطوة أبل كبير! وجنبا إلى جنب سيري، CoreML، استأجرت رأس جوجل AI إكسبلورر السابقة

تغذية بيليه مرتين كعكة المهارات مرور عميقة كبيرة، قوس رائع لونينغ لم تعد تقلق بشأن الممر

بيع 18-25000000 وقطاع التنقيب تمكنوا من جعل عودة شيفروليه لتعميم منظور المستهلك؟

هو في الواقع هونج كونج، و 90 من الناس قد غاب عن هذا! بينما الكثير من الناس لا تذهب إلى حانة ~ هذه فام

الطلاب الهنود البالغ من العمر 22 عاما المؤهلة جوجل العرض الفلكي، وفاز 6000 مليون سنة