للمبتدئين: قائمة كأس العالم الوجه المفرج عنهم، سهم Microsoft مليون المشاهير الفائز مسابقة الاعتراف

1 جي فاز تقرير جديد

يونيو 2016، أطلقت مايكروسوفت للجمهور على نطاق واسع في العالم الحقيقي صورة الوجه مجموعة البيانات من MS-المشاهير-1M، تحتوي على حوالي 10 ملايين الطلقات (10M) وجه المشاهير 100000، وتشجيع الباحثين لتطوير التعرف على الوجه المتقدم التكنولوجيا.

كما أعلن أن هناك مليون MS-المشاهير-1M وجه التحدي. يحتاج المشاركون إلى مجموعة البيانات (ولكن ليس على سبيل الحصر) المقدمة التحدي عن بيانات التدريب، وتطوير نظام التعرف على الصور، وتحديد 1000000 من الصورة المشاهير الوجه.

، تم الإعلان اليوم عن نتائج المسابقة، ومنها:

مليون المشاهير الاعتراف الفرعية الاقتراح،

  • فصول غير محدودة (مجانا لاستخدام البيانات الخارجية)، وفاز باناسونيك-جامعة سنغافورة الوطنية (جامعة سنغافورة الوطنية) على الجائزة الأولى، والأكاديمية الصينية للعلوم في معهد تشونغتشينغ التكنولوجيات الخضراء الذكية (CIGIT)، والأكاديمية الصينية للثاني العلوم شارك في الفريق، وجامعة ثالثة شمال شرق.

  • وتقتصر هناك (سباق الوحيد لتوفير البيانات)، هي أول بكين أوريون ستار التكنولوجيا المحدودة

  • عينات تدريب الطفل المشاهير لتحديد اقتراح واحد،

  • فئة غير محدودة (البيانات الخارجية يمكن استخدامها بحرية)، هي أول جامعة سنغافورة الوطنية باناسونيك

  • وتقتصر هناك (فقط المسابقة قدمت بيانات)، هي أول جامعة نورث إيسترن

  • وقد اعتمد الفريق الفائز في التكنولوجيا وسيلة تستند إلى عمق التعلم، فضلا عن شبكة كبيرة من البيانات. كما يمكن أن يرى، الشبكة اتجاه التنمية للبيانات كبيرة، والتكامل المتعدد النماذج هو الفوز الآن كل لعبة السلاح.

    يحدد مايكروسوفت مليون المشاهير مسابقة MS-المشاهير-1M: سد الفجوة بين الأوساط الأكاديمية والصناعة

    هناك الكثير من مسابقة التعرف على الوجه، والملايين مايكروسوفت المشاهير الاعتراف مسابقة التحدي مع القائمة ما هو الفرق؟

    ووفقا للدكتور تشانغ لى، كبير الباحثين في تكنولوجيا مايكروسوفت ومعهد بحوث (التكنولوجيا مايكروسوفت وبحوث) / مدير البحوث: أولا وقبل كل شيء، MS-المشاهير-1M الهدف هو التعرف على وجوه الملايين من الناس، هو الأكبر في تصنيف رؤية الكمبيوتر، واحدة من يتوافق مع كيان شخصية، وقاعدة المعرفة المربوطة، قاعدة المعرفة، وتوفير كل شخص الاحتلال والجنس وهلم جرا ثروة من المعلومات، وذلك لإيجاد حل لمشكلة الطابع الذي يحمل نفس الاسم، ويمكن الوصول إليها من الاعتراف المعرفي. "نحن نواجه بداية من المجتمع الأكاديمي للقيام هذه البينات." وقال تشانغ لي نيو جي وون: "ولكن بعد الكثير من صناعة الأقران أعرب أيضا عن مجموعة من البيانات لدينا للعمل أبحاثهم مفيدة."

    حققت تقدما دراسة متعمقة للخوارزمية التعرف البصري تقدما كبيرا في السنوات القليلة الماضية. ومع ذلك، الحياة مبتكرة وذكية بين الخدمات ضعت فعلا حيز الاستخدام في الفجوة الكبيرة الأكاديمية لا يزال موجودا، وذلك بسبب:

    (1) عدم وجود بيانات في العالم الحقيقي البحوث الأكاديمية على نطاق واسع، وبالتالي إعاقة الخوارزميات التدريب والتقييم الفعالة؛

    (2) عدم وجود المعرض منصة مفتوحة وشفافة والتقييم الفعال للنتيجة الاعتراف استنساخه، وسهلة الحصول عليها.

    حاليا، عدة مجموعات بيانات التعرف على الوجه الرئيسية المتاحة للجمهور (الرقم الأخضر أدناه) هي:

    • LFW هو مجموعة من البيانات من جامعة ماساتشوستس، بهذا الحجم بين جميع المستويات (13K)؛

    • مركز مجموعات البيانات وجه، رؤية الكمبيوتر والتحكم YFD ييل التي أنشأتها جامعة ييل، ويحتوي على تغييرات مختلفة الإضاءة، وتعبيرات الوجه والموقف، ولكن عدد قليل.

    • CelebFace يحتوي على أكثر من 20 مليون صورة.

    • CASIA WebFace الأكاديمية الصينية للعلوم في معهد أتمتة العديد من مجموعات البيانات، والتي تشمل طباعة النخيل، والكتابة اليدوية، وعمل الإنسان وغيرها من ستة أنواع من مجموعات البيانات؛ ضرورة اتباع الإرشادات لتطبيق، مجانا.

    بعد ذلك، الفيسبوك وجوجل مجموعات البيانات على الرغم كبيرة في الحجم، لكنهم لا يستطيعون متاحة للجمهور.

    هذه تعكس كل وجود فجوة كبيرة بين الأوساط الأكاديمية والصناعة.

    ولذلك، المعهد الفني ل Microsoft والدكتور قوه يان دونغ المواهب في عام 2016 اقترحت MS-المشاهير-1M المعيار. MS-المشاهير-1M على الرغم من أن البيانات المشاهير وجه، ولكن مع المشاهير التي تم جمعها من شبكة لجمع كل ما يمكن من صورة الوجه كبيانات التدريب. واستنادا إلى قاعدة معرفية غنية بالمعلومات يساعد على إزالة الغموض وتوفر ثروة من المعلومات الشخصية، وتحسين دقة التعرف، على مقربة من مجموعة متنوعة من التطبيقات في العالم الحقيقي، مثل تعليق صورة وتحليل الفيديو الأخبار، وتحليل الرأي العام وهلم جرا.

    جعل فعال حتى بين الأوساط الأكاديمية والصناعية بسبب الثغرات في البيانات الناجمة عن خوارزمية نموذج.

    مؤشر مسابقة تصميم: حد للاعتراف نهاية، والمساهمة في التطبيقات في العالم الحقيقي

    من حيث مجموعة مؤشر المنافسة، جعلت مايكروسوفت MS-المشاهير-1M أيضا لملء المنافسة القائمة.

    في الوقت الحاضر، يمكن أكثر معروفة التعرف على الوجه المنافسة بيانات متاحة للجمهور يكون LFW وMegaFace. LFW نطاق بين جميع هذا المستوى، لأن البيانات لا تتم مشاركة التدريب وغيرها من الأسباب، في السنوات الأخيرة أظهرت اتجاها المحتمل أن الإفراط في المناسب، ووجد الباحثون مايكروسوفت، LFW أفضل الخوارزمية غالبا ما يصعب استنساخها تماما . وبالإضافة إلى ذلك، LFW المنافسة هي نسبة التشابه بين صورتين من ممارسة مسافة معينة.

    جامعة MegaFace واشنطن مجموعات البيانات المنشورة، وعشرات من محتوى الإنترنت هي صور نجوم بالإضافة إلى البيانات تدخل نحو مليون الصور من الناس العاديين. ومع ذلك، تحديد الأهداف MegaFace مختلفة، مقارنة ب "الاعتراف" أكثر عرضة "التحقق الوجه في حالات صاخبة" (التحقق الوجه) . على وجه التحديد، والمنافسة MegaFace المستهدفة هي في الملايين من الناس التعرف على عشرات محددة من الناس. العشرات من الصعب تقييم دور الأداء التعرف على الوجه شامل جدا، والتطبيقات العملية لا تزال بعيدة بعض الشيء. وعلاوة على ذلك، اختبار MEGAFACE لم اتسمت البيانات بشكل مصطنع، ويحتوي على الضوضاء. بيانات الاختبار الضوضاء عند قياس نموذج عالية الأداء من تدخل خطير جدا.

    ولهذه الغاية، تعديل مايكروسوفت مؤشر تقييم MS-المشاهير-1M. دخول المسابقة هي صورة، والناتج هو اسم قريب جدا من الواقع، وسيناريوهات تطبيق التعرف على الوجه - لتحديد ما إذا كان وجه الإنسان هو صورة لشخص معين.

    "مهمتنا هي لإنهاء المهمة، وتحديدا، فإن المهمة هي من الصورة إلى رمز المشاهير تحديد مستودع. وفي هذه الحالة، هو عرض طبيعي العديد من المشاكل البحثية القيمة، مثل كيفية الحصول على البيانات بفعالية من شبكة ( نحن نسمح لأنفسنا بأن زيادة بيانات التدريب)، وكيفية الاستفادة من بيانات التدريب صاخبة المسمى (ضخمة، وتكلف أكثر من الشرح اليدوي)، وكيفية التعامل مع كميات هائلة من البيانات (هدف واحد مليون شخص، والآلاف من مستويات الرسم البياني)، عند بعض الناس البيانات نادرة للغاية، وبيانات متفاوتة كيفية القيام بذلك، وهلم جرا، وهذه هي السيرة الذاتية للاهتمام داخل المشكلة. وقال قوه يان دونغ ".

    وتهدف الفرق هو تحديد الفرد مختلطة مليون شخص في 1000، ولكنها محددة 1000 المشاركين لا يعرفون. ولذلك، من أجل تحقيق أعلى معدل ممكن، ودقة تذكر، ونماذج المشاركة تحتاج إلى تغطية أكبر عدد من الناس، حتى عن نطاق المليون. وضع هذا النموذج إلى الأمام الطلب مرتفع جدا. وبالإضافة إلى ذلك، دليل فريق البحث مايكروسوفت جدا تميز بعناية مجموعة الاختبار في مجموعة اختبار يضمن دقة عالية جدا، لذلك أن النموذج عالية الأداء ونموذج لقياس الأداء في معدل دقة ما يقرب من 100 (أذكر @ دقة عالية ) هي فعالة جدا.

    ليس ذلك فحسب، MS-المشاهير-IM مليون المشاهير هو أيضا مسابقة لتحديد "التعلم عينة صغيرة" (التعلم lowshot) المناطق، حيث اهتماما خاصا عندما تكون البيانات في وقت التدريب بعض الناس قليلا جدا، وكيف تفعل نتائج النموذج ترتفع.

    هنا، لا بد فرق لتحديد 1000 شخص من 21،000 شخص. ولكن أن 1000 شخص كل إنسان لديه صورة لقطار. في كثير من الحالات، مثل التعرف على الوجه الأمن العام، وأظن إلا صورة غامضة أو محمية، لمعرفة أن في البحر الشاسع، وينتمي إلى التعلم عينة صغيرة.

    هذا هو آخر في الاتجاه الرأسي دعا اليوم إلى حد الذكاء الاصطناعي: تعلم المفاهيم البصرية من عينة محدودة.

    الفريق الفائز حصة الفنية: انخفاض شوت رابط التعلم

    بعد أن تم الإعلان عن نتائج المسابقة، ومقابلة جديدة جي وون مع جامعة منخفضة شوت الفائز مسابقة التعلم سنغافورة الوطنية مع معهد سنغافورة للفريق باناسونيك، وأعضاء تشاو جيان كممثل لتبادل طرق أفكارهم وخبرة المنافسة.

    الفريق الفائز: NUS باناسونيك، الأعضاء: تشاو جيان (جامعة سنغافورة الوطنية)، تشنغ يو (باناسونيك)، وانغ Zhecan (جامعة سنغافورة الوطنية)، شو يان (باناسونيك)، كارليكار Jayashree (باناسونيك)، شن Shengmei (باناسونيك)، فنغ جيا عند (جامعة سنغافورة الوطنية).

    نيو جي وون: لماذا تشارك في Microsoft MS-المشاهير-1M مليون تحديد سباق المشاهير؟

    NUS باناسونيك: يحدد مايكروسوفت مليون السباق معترف بها المشاهير التعرف على الوجه السنوي "كأس العالم". وترعى المسابقة من قبل مايكروسوفت للبحوث، مع مجال رؤية الكمبيوتر اجتماع رئيس الوزراء منصة ICCV عام 2017، على مستوى عال، صعوبة رفيعة المستوى. مواجهة الفرق الكبرى في العالم جميعا نريد أن يكون الذهاب في هذه اللعبة، وعلامة واحدة ل. وهذا يشمل كلا من السباق والسباق الأخير مماثل على نطاق واسع التعرف على الوجه (مجموعة الصلب ومجموعة عشوائية)، ولكن أيضا وضع، أكثر تحديا منخفضة شوت منافسة جديدة تعلم الأمام. ويأمل المنظمون أن كلا الفريقين تحقيق التحديد الدقيق لوجه الإنسان على نطاق واسع، ولكن أيضا أن تكون قادرة على التعرف بدقة حل فعال لمشكلة عينات تدريب وجه البشرية النادرة.

    مجموعة NUS LV إنشاؤها من قبل البروفيسور يان في الماء، عندما قاد البروفيسور جيا فنغ، هو حاليا واحدة من أفضل الفرق في المؤسسات الأكاديمية الكبرى في التعلم عمق ومجال الرؤية الحاسوبية. وكان التعرف على الوجه فريقها مجموعة عمود LV لا يتجزأ، وكرر النجاح - لأول مرة لتصل إلى 99.7 دقة التعرف في مجموعة البيانات الاعتراف LFW الوجه، والمنافسة في NIST 2017 IJB-A التعرف على الوجه مباراتين معهد ماتسوشيتا في سنغافورة للعمل معا من أجل الفوز باللقب. نختار للمشاركة في هذا العام (2017) مايكروسوفت مليون المشاهير تريد أن تكون قادرة على تحديد مسابقة لإثبات نفسه على أعلى الاعتراف منصة الوجه، وتعزيز التقدم السريع والتنمية على نطاق واسع تقنية التعرف على الوجوه.

    نيو جي وون: من الناحية الفنية، ما يحصل المشاركون هو أكبر مصدر إلهام؟

    NUS باناسونيك: المنافسة للحصول على أكبر مصدر إلهام ل أنظمة التعرف على الوجه دقة وكفاءة المطلوبة عادة لتصميم القضايا المعقدة وحدات، من جمع البيانات، والتنظيف، ما قبل المعالجة، إلى تصميم نموذج، والتدريب، والاختبار، وبعد ذلك إلى دمج نماذج مختلفة، والتعلم قياس وتقييم الأداء، كل بعد وحدة من ومحاولة بعض الأفكار الجديدة والاستراتيجيات المختلفة، وتأثير كل وحدة التصحيح لأفضل، ثم المشاركة على مستوى النظام .

    جديد تشي يوان: هل لك أن تخبرنا عن أفكارك وطرق وأسباب الفوز بها؟

    NUS باناسونيك: انخفاض شوت تعلم التركيز على فرق يمكن حل فعال لمشكلة ندرة التحديد الدقيق لعينات التدريب الوجه. وقدمت منخفض شوت المسابقات التعلم مجموعتين من البيانات مجموعة --Base ورواية تعيين. حيث، مجموعة قاعدة يحتوي 20K المشاهير، 50-100 ورقة لكل المشاهير توفر بيانات العينة، رواية مجموعة يحتوي 1K المشاهير، فقط من المشاهير كل بيانات العينة. في الاختبار، فإن الاختبار المقدمة من قبل المنظمين التركيز على المشاهير مختلطة مع رواية طقم قاعدة البيانات، والتأكيد على أداء الخوارزمية في مواجهة عينات التدريب الشحيحة رواية تعيين.

    لحل هذه المشكلة، ونحن 100K المشاهير التعرف على الوجه القائم على المنافسة على نطاق واسع لتوفير بيانات التدريب، وتضمنت البيانات رواية يقع في المشاهير 1K إزالة إلى بناء "بلاس" قاعدة بيانات، وتدريب العديد من الهياكل المختلفة نموذج الشبكة، علمت الشبكة التي على درجة كافية من التمييز الخصائص، متانة وتعميم الأداء، علمت نماذج مختلفة الشبكة ميزات لها آثار التكميلية. نعتمد ميزة البحث لاختبار كل نموذج، عندما قام عدد من الاختبارات لتحديد استراتيجيات فعالة عن طريق تصديق متقاطع.

    بالمقارنة مع الفرق الأخرى وكذلك الطرق التقليدية منخفضة شوت الحلول، والتعلم لدينا تحسن الرئيسي هو استخدام المبنى وذلك تمشيا مع أحكام بيانات اللعبة إضافية، نموذج تعدد قدر من التعلم والاندماج التصويت ارشادي واختبار مرحلة تعزيز البيانات .

    تعتمد اللعبة النتائج الحصول جيدة أيضا على معهد سنغافورة ماتسوشيتا من الأجهزة والمعدات الملائمة، مثل مجموعات GPU على نطاق واسع وأحدث DGX. معهد ماتسوشيتا سنغافورة هو أيضا تميز فريق البيانات في هذه البطولة لعبت دورا كبيرا.

    جديد تشي يوان: ما هو واجه صعوبة أكبر في اللعبة؟ كيفية حلها؟

    NUS باناسونيك: كيف المليون التعرف صعوبة المشاهير نموذجا فعالا للاستخدام الفعال للتأثير الموجود التدريب الأمثل البيانات. من أجل حل مشكلة عينات التدريب الوجه الإنساني النادرة، لدينا 100K المشاهير التعرف على الوجه على أساس المنافسة على نطاق واسع لتوفير بيانات التدريب، وإزالة من البيانات الواردة فيه رواية يقع في المشاهير 1K، وبناء "بلاس" قاعدة بيانات والتدريب نموذج الشبكة عدة هياكل مختلفة. مساو لعدد من الخلايا العصبية في فئة تصنيف عملية التدريب، وأخيرا طبقة شبكة مرتبطة ارتباطا كاملا (FC)، ومستوى تدريب عدد كبير من المعلمات وغالبا ما يصعب تؤدي مباشرة إلى شبكة التدريب، إلا أن فقدان وظيفة من صدمات تقلب لن تسقط. نحن هنا أدخلت بعض التعديلات، وتنقسم عملية التدريب برمتها إلى مرحلتين، وشبكة التدريبية الأولى للتميز 1/10 نوع العينة، بعد تميل شبكة للتجمع، والطبقة الأخيرة FC استبداله، والمرحلة الثانية التدريب وضبط، وذلك لحل نوع عينة كبيرة، ومشاكل التدريب كفاءة الشبكة.

    نيو جي وون: الخوارزمية المقترحة لديك أي تطبيق عملي؟

    NUS باناسونيك: لدينا الخوارزمية المقترحة يمكن حل فعال لمشكلة ندرة التحديد الدقيق لعينات تدريب الوجه، والتي لها قيمة عالية وفرص عمل للمجال الأنظمة الأمنية وأنظمة المنزل الذكي، من دون طيار، وبين الإنسان والكمبيوتر التفاعل. أنا متفائل جدا حول خوارزميات الهبوط المستقبل، مثل البحوث يمكن دمجها مع خوارزمية التعرف على الوجه، تقنية ضغط الشبكة والتكنولوجيات ذات الصلة FPGA التصميم على مستوى النظام، وتوفير المزيد من الراحة لحياة الناس والإنتاج.

    على الرغم من أن دقة التعرف على الوجه هو بالفعل عالية، ولكن معظم تعميم التكنولوجيا والخوارزميات المطلوبة سلفا موقف أو شرط كما فرضية، مثل ن الوجه أو الوجه الحقيقي إلى حد كبير، وصورة واضحة ودون عائق، وتعبيرات الوجه، مثل الخلفية واحدة. وبالمعنى الحقيقي ذكية للتعرف على الوجوه المستقبل سيكون حلا جيدا لمشكلة المذكورة أعلاه، ومواصلة تحقيق اختراقات جديدة في نطاق واسع، وظروف غير الحد وندرة عينات تدريب مشكلة التعرف على الوجه.

    نيو جي وون: مبروك للحصول على درجات جيدة، وأخيرا شهدنا الفوز الشعور به.

    NUS باناسونيك: التعاون المخلص من قبل مجموعة NUS LV وباناسونيك، وبعد ثلاثة أشهر من الجهود المشتركة والنضال، ونحن نجحت أخيرا في الفوز ثلاث مسابقات مايكروسوفت المشاهير التعرف على الوجه (مجموعة الصلب، وهناك مجموعة عشوائية، قليلة شوت التعلم) بطل. سعيد جدا أن تصبح يمكن لفريق بطل تحقيق مثل هذه النتائج، والتفاني والتعاون جزء لا يتجزأ من جامعة سنغافورة الوطنية مع باناسونيك وحدتين معا كل عضو في الفريق لا يمكن فصلها، والنضال المشترك. شكرا أستاذ جيا معلمي فنغ، والثقافة الأستاذ يان مائي والتوجيه والثقة، وذلك بفضل لمعهد CAS الأتمتة - مضاءة العسكرية مساعدة المعلم والتوجيه، وذلك بفضل لجامعة الدفاع الوطني وتمويل المجلس الصيني للمنح الدراسية، وسوف تستمر في العمل الجاد، والأمل للناس وجه الحقل الاعتراف إلى آفاق جديدة، دفعت تطوير التكنولوجيا ذات الصلة والتقدم.

    مراجع

  • . Y. قوه، L. تشانغ، Y. هو جين تاو، X. و، وJ. قاو MS-المشاهير-1M :. مجموعة البيانات ومعيارا لنطاق واسع التعرف على الوجه في بروك من أسيوط الأوروبي على رؤية الكمبيوتر (ECCV) .. . الوثاب، 2016.

  • Y. قوه وL. تشانغ، دفعة واحدة التعرف على الوجه من خلال تشجيع فئات ممثلة تمثيلا ناقصا، أرخايف ورقة أرخايف: 1707.05574 و 2017.

  • انقر هنا لقراءة النص الأصلي لمعرفة وظائف جديدة فاز جي

    فيتنام الاعتماد الاقتصادي المفرط على الدولار، بعد أن تحذو حذو كندا، وهو أول انخفاض أو الأغنياء، ويعتقد فجأة من RMB

    البحر المتوسط التركي الأزرق للقيام حلما، ابتسم وسقطت في الحب مع هذا البلد رومانسية

    ما Weiying، وقال تشو يونيو، مي تشياو تشو، ليو يانغ، تشين تاو، وتقاسم العميقة الأخرى، CCIR 2017 نظرة عامة

    قاد الريف إلى خندق مواجهة جدا؟ العضو: الآن كل شخص لديه سيارة، ليست هناك حاجة!

    بعد الاعلان الرسمي من قبل تسوية أموال النفط الفنزويلية، تتقدم الأمور، هناك نوعان من الدول الكبرى على أن تحذو حذوها

    والد Keras "دراسة أربعة اتجاهات التكنولوجيا الكبرى، في العمق"، وآلة للباحث جوجل تفكيك دراسة مستقلة

    عن طريق الخطأ، ويدفعون الضرائب ...... IQ

    قلب مثقوب! الفاخرة مفتوحة السيارة مرة أخرى إلى الريف، لماذا الناس حول الموقف من كل هذا؟

    للاشتباه في ورطة، الاحتجاز! و!

    200000 يمكن شراء صافي SUV المستورد! التركيز على النوعية وليس يجب عليك ملكة جمال

    الشتاء هو الأكثر كلمات الحب لمس "العودة! الذهاب إلى الينابيع الساخنة!"

    لديك لسرد الملاحظات رجل جاء أخيرا | القيء التشطيب الدم