منظمة العفو الدولية إلى "كلب" معترف بها "القط"، لأنه يجسد خصائص البصر الإنسان

مؤخرا، قام فريق من معهد ماساتشوستس للتكنولوجيا (MIT) تفصح عن نتائج أبحاثهم. النقاط المقال الى، ضد العينة (الخصومة عينة) تؤدي إلى ظاهرة التعرف على الصور (تصنيف صور) الفشل، وربما مجرد إنسان "الذاتي الصالحين". نموذج الاعتراف القبض، في الواقع، لا يمكن أن ينظر إليها من قبل العين البشرية "ميزات غير قوية" (ميزة غير قوية). إلا إذا كان هؤلاء على أساس الميزة على مستوى بكسل، وتحديد نموذج من نماذج المواجهة لا يمكن أن يعتبر الفشل.

تقريبا كل خوارزميات التعرف على الصور وجود نقطة ضعف - مكافحة مشكلة العينة. تشير عينة المواجهة إلى الصورة الطبيعية، إلى أن يتم تعديل قيمة عدد قليل من بكسل، حتى إذا ما يكفي تعديل لأن ينظر إليها من قبل العين البشرية، ولكن الاعتراف الخوارزمية خاطئ تماما لجعل الأحكام، مثل كلب يدعى النعام. هذا يمكن أن يكون الثغرات الأمنية القاتلة، مثل صنع السيارات التي تقود نفسها تنحرف عن الطريق، أو السماح لتحقيقات مراقبة لا يمكن العثور على وجود المجرم. (الرابط: إلى نمط مطبوعة على تي شيرت يمكن تحقيقه تحت إشراف "الشبح"؟)

خريطة | يسار الصورة الطبيعية، التي تعرف بأنها "كلب". الحق في مواجهة التغيير المتعمد من العينات، التي تعرف بأنها "النعامة". (المصدر: كريستيان Szegedy / شركة جوجل)

العديد من المؤسسات البحثية (مثل شركة جوجل، معهد ماساتشوستس للتكنولوجيا وتينسنت كوهين المختبر) تحاول حل المشكلة ضد العينة. واحدة من التحديات الكبرى موجودة في ثلاثة مجالات، أولا، ومدى تعقيد العالم المرئي، مثل صورة تتواجد عادة في ملايين بكسل. ثانيا، لم نفهم تماما الشبكة التفاف العصبية (CNN) تنفيذ صورة آلية للاعتراف. وبالإضافة إلى ذلك، لا العلماء لا يعرفون سبب المشكلة هو عدم تحديد نموذج أو كمية البيانات المستخدمة تدريب لتدريب الطريقة ليست كافية الكبيرة؟

ووجد فريق البحث MIT أن النموذج الحالي هو في الواقع تستخدم عادة لتحديد والتعرف على الصور ويتحقق من خلال الالتفات إلى الصورة، لا يمكن للعين البشرية التفاصيل إدراكه. البشر مثل مقارنة آذان مختلفة، والكلب والقط صور تميز نفسها. ولكن نموذج AI تتميز على مستوى بكسل.

المؤلف الأول من الورقة، MIT طلبة الدكتوراه وقالت أندرو إلياس: "لتلك الميزات على مستوى بكسل، لا ينظر إلى أكبر ميزة بالعين البشرية."

AI ترغب في معرفة ما في النهاية يعتمد على التوقيعات لتحديد الصورة ليست سهلة. أندرو إلياس، الذي عرف لأول مرة مجموعة من الإطار النظري. وتتميز الصورة إلى فئتين: "ملامح قوية" (ميزات قوية)، ويشير التغييرات جعلت حتى إلى مستوى بكسل لن يؤثر على النتيجة من ميزات تحديد الهوية (مثل الأذنين، واللحية)، و "ميزات غير قوية" (غير ميزات -robust)، أي سيتم تعديل بكسل تؤثر على خاصية (عادة لا يمكن التعرف على الإنسان).

ثانيا، أنها تعرف طريقتين من نموذج التدريب، و"التدريب القياسية" (التدريب قياسي) و "تدريب قوي" (تدريب القوي). يأخذ فقدان المعادلة إضافية في الاعتبار وجود تدريب قوي ضد العينة بحيث نموذج يمكن أن تعزز الاعتراف ميزة قوية في مجال التدريب.

الخريطة | معايير التدريب معادلة الخسارة وتدريب الصوت. أكد التدريب القوي أجزاء تمثل تعديل البيانات الأصلية، مما يجعلها ضد العينة. (المصدر: أندرو إلياس / MIT)

افترضوا ثابتة وغير ثابتة السمات المميزة موجودة. ومجموعة توليد واستخدام أساليب مماثلة ضد شبكة (غان)، ومجموعة بيانات التدريب الأصلي (D) من الصورة إعادة المعالجة، وتوليد بيانات جديدة اثنين: غسل تشغيل ميزات غير قوية، والصوت يتميز تحتوي فقط D_R، وعلى ما يبدو تسميتها في البشر، ولكن لا يتماشى مع ميزات قوية لها ملحوظ D_NR.

خريطة | اليسار: الأصلي التدريب البيانات D، مع ميزات قوية فقط D_R، وخصائص فقدان D_NR الاتساق. اليمين: ثلاثة بيانات تحدد التدريب دقة بطرق مختلفة. (المصدر: أندرو إلياس / MIT)

وأشار الباحثون إلى أن الميزات فقط قوية والمعلومات الواردة D_R أقل من البيانات الأصلية D. تم العثور عليه، ثم D_R أساس نموذج لتحديد الطريقة القياسية تدريب للحصول على نفس الشيء يمكن مقاومة ضد العينة. لإثبات تغيرات مستوى بكسل (العين البشرية لا يمكن أن أقول)، لا تؤثر على ميزات قوية في الصورة.

من ناحية أخرى، فإن الباحثين في بيانات التدريب (D) لتعديل مستوى بكسل، وتعمل باستمرار الأمثل، بحيث النموذج القياسي قدر الإمكان لوضع إلى نوع آخر من تحديد الصورة. على سبيل المثال، ميزة قوية (الإنسان العين) هي "كلب" بدلا من ميزات قوية والتسمية (نموذج اعتبار) هو "القط".

عد الباحثون تعديل الصور كما D_NR والتدريب وحصلت على إضافة الطبيعية لبيانات "القط" اختبار الصورة. وضع الاعتراف بنجاح هذه الصورة هي أيضا الاعتراف الأجنبية أصبحت "القط". وصف هذا "القط" الطبيعي، وD_NR على "القط" لديه نفس الخصائص يمكن تحديد نموذج، وهذه الخاصية هي أننا لا نرى "ميزات غير قوية."

الشكل | "الكلب" الصورة على اليمين في الرسم، و "القط" الصورة أدناه، تم تحديدها في "القط"، لديهم نفس الميزات غير قوية. (المصدر: أندرو إلياس / MIT)

تجريبيا، أندرو إلياس وفريقه: ملامح ثابتة وغير ثابتة سمة موجودة في الصورة بين الاعتراف العام وصورة نموذج اعتراف إلا من خلال ميزات غير قوية، بدلا من الميزات القوية التي لا يمكن أن ينظر إليها من قبل العين البشرية. لذلك، على صورة من العينة نفسها لا يتم التعرف على الضعف، لا يمكن أن يكون مجرد ميزة أخرى نراها.

"هذه ليست النموذج نفسه لديك أي أسئلة، فقط تلك الأشياء التي تحدد حقا لا ينبغي النظر إلى نتائج الاعتراف." المؤلف الثاني من الورقة، مشيرا الى ان معهد ماساتشوستس للتكنولوجيا الدكتوراه طالب Shibane Santurkar: "إذا كنا نعرف فقط خوارزمية صنع القرار يعتمد على عدد من الأشياء التي لا ترى، فكيف يمكن لنا أن نفعل ذلك من المسلم به أن هذا القرار هو الصحيح؟ "إذا كان الشخص يحتاج إلى إثبات الناس في فيديو للمراقبة في المحكمة من تلقاء نفسها سيكون من الصعب للغاية، لأننا لا رصد المعرفة هو كيفية تحديد نتائج خاطئة تأتي.

يحتاج العلماء دائما لمواجهة خيار، ما هو النموذج ينبغي أن القرار "دقيق"، أو ينبغي اتخاذ قرار "الإنسان"؟ إذا كان النموذج هو ميزة التعرف على الحكمة فقط، قد لا تكون دقيقة جدا. ومع ذلك، إذا ملامح صنع القرار غير متحيزة آلية قوية لا يمكن أن ينظر إليها، ثم العينة ستكون ضد الضعف المحتملة. واليوم، فإن تكنولوجيا التعرف على صورة وقد استخدم على نطاق واسع في الحياة اليومية، ونحن بحاجة إلى إيجاد توازن بين هذين الخيارين.

"بعد العاصفة" سوق القادمة؟ 2900 نقاط المعركة، فمن تخطيط المساومة الصيد أو ناقص المسيرات

أكثر الليل أكثر جمالا! صدر عشرة هانغتشو تخطيط المدن مخصص الليل "إضاءة الآسيوية الفصل الخاص"

واحد وخمسون المتظاهرين باريس تصر على فرض وحدة العناية المركزة في المستشفى! موكب أعمال العنف وإلى ما لا نهاية؟

استطلاع: أكثر من نصف الفرنسيين يريدون الإصلاح وفقا للنوتردام الأصلي

"Chigua الجماهير" زراعة المصير: كيفية فتح بشكل صحيح القيل والقال؟

"أنت لا تستطيع أن تسمع لي أن أتكلم،" هانغتشو هدوءا حصاد هذه القهوة متجر الكثير من النوايا الحسنة

أعطى فرنسا خمسة آلاف لشراء منزل في أوروبا؟ الشعب الصيني لا يفهمون هذا النوع من الألم: السكان صغير جدا!

حقا تحترق! هانغتشو شياوشان بالمعنى الكامل للممارسات الجيران طقوس أيضا الاستفادة منها! ولكنهم يقولون عناء مضيعة للمال ......

باريس نهر السين "حقيبة خضراء" نقش، ولكنها لا تزال bookstalls في التاريخ؟

عكس العرض والطلب؟ سوق الإيجار بكين في قضية "أواخر الربيع": انخفاض الإيجارات في بعض المناطق أكثر من ثلث!

قرية بجوار مصنع الألومنيوم: أكثر الغبار في أشجار الصنوبر والانحناء، والأطفال في كثير من الأحيان الباردة طفح الجسم

ستة بالغين لشراء الأحذية الرياضية على ارتداء الفناء، يمكن نايك صالح حل هذه المشكلة؟