الجاف | الشمس كيشاو: التفاف العصبي تطبيق الشبكة في تقنية التعرف على الوجوه

AI تقنية الصحافة : مع الافراج عن اي فون X، بدأ الوجه ID الوجه تقنية التعرف إلى دخول الحياة اليومية للناس، ونحن عندما تلتقط الهاتف ونظرة على ذلك، يمكنك تحقيق فتح وظائف الهاتف. التكنولوجيا الرئيسية من التعرف على الوجه هو شبكة التفاف العصبية.

مؤخرا، في الفئة المفتوحة شبكة لى فنغ AI Yanxishe، جامعة مونبلييه، فرنسا بتاريخ الأحد كيشاو يصف كيف أن المبادئ الأساسية والتعرف على الوجه التفاف تقنية الشبكات العصبية قيد التشغيل. الطبقة فتح مقطع الفيديو URL التشغيل: HTTP: //www.mooc.ai/open/course/524

سهم شخص

الشمس كيشاو: ماجستير في إدارة الأعمال في جامعة مونبلييه، فرنسا قراءة، CSDN بلوق خبير المليون.

حصة الموضوع: تطبيق التفاف الشبكة العصبية تقنية التعرف على الوجوه

حصة الخطوط العريضة:

  • ويصف المبادئ وسير العمل التفاف الشبكة العصبية

  • ويصف أربعة عناصر أساسية للشبكة العصبية التلافيف: عملية تجمع، وظيفة التنشيط، طبقة اتصال كاملة، دالة الهدف

  • عزم تقنية التعرف على الوجوه المشترك

AI Yanxishe لمشاركة المحتوى تتلخص فيما يلي:

حصة اليوم أنا معك التفاف تطبيق الشبكة العصبية في تقنية التعرف على الوجوه. أولا، يقول لنا عن العلاقة بين عمق التعلم وتعلم الآلة. AI الواردة في هذا المجال فرعية من تعلم الآلة، ويتعلم تعلم آلة يحتوي أيضا على (نوع من استخراج تلقائيا التعلم الميزة)، في حين عمق التعلم هو الدراسة الأكثر تمثيلية تظهر التعلم. قصتنا اليوم هو التفاف الشبكة العصبية CNN، هو التعلم العميق.

والفكرة الأساسية للتعلم الآلة هو في الواقع باستخدام ميزة لتعلم المعرفة نحتاج إلى وهكذا ظهر العمل الجديد الذي تتخصص في هندسة خصائص فئة من المهندسين. وميزات جيدة وسيئة للمشروع يؤثر على النتائج النهائية للتعلم الآلة. ويعتقد العلماء، بحيث لا يمكن للآلة تعلم تلقائيا الخصائص، ويضم أعمال من دون الحاجة للرجل أن يفعل ذلك؟ والاستنتاج هو: نعم. يتعلم لمعرفة لاستخدام هذه الميزة.

استخدام التعلم العميق، في الواقع، في غاية البساطة، وهذا هو نهاية لتعلم، يتطلب سوى ثلاث خطوات: أولا، البيانات به (الجهاز)، وثانيها، مثل التعلم العميق معالجة، وثالثا، للحصول على النتائج.

أدناه، ونحن ننظر في عملية التنمية من الحديث اليوم شبكة التفاف العصبية لدينا:

عام 1980، اقترح العلماء "عصبي" الآن تعتبر "عصبي" هو السلف من الشبكة العصبية الإلتواء.

في عام 1998، اقترح عالمان التفاف الشبكة العصبية على أساس التعلم الانحدار، ودعا LeNet . وهذا هو أول تطبيق على نطاق واسع من التعرف على الصور. أبلغت الولايات المتحدة في ذلك الوقت عددا كبيرا من العمل البريدي، ونحن بحاجة لشخص للعمل الرمز البريدي وعنوان التسليم وهلم جرا. اصطناعية للقيام بذلك، وكفاءة منخفضة جدا، عدد قليل من الناس يمكن التعرف ثانية واحدة؟ حتى لو كان اعتراف سريع، ولكن الناس أسرع، قد تكون نسبة الخطأ أعلى، لذلك هذا LeNet سيتم تطبيق التعرف على الحروف المكتوبة بخط اليد الرقمية، ونسبة الخطأ 1 فقط، ويمكن استخدامها على نطاق واسع؛

اقترح 2012 فريق نيان، هينتون التلافيف الشبكة العصبية أليكس صافي، شارك الفريق في البروفيسور لى Feifei صورة اللعبة صافي، للحصول على البطولة. وكان متقدما بفارق كبير عن المركز الثاني مع أكثر من 12 من الدقة. سابقا، وعادة سوى أول من تقدم ثانية واحدة أو نقطتين أو ثلاث أو أربع نقاط مئوية على الكثير، وهذه المرة، يقود الفريق إلى اثني عشر نقطة مئوية. وذلك لأن أليكس صافي لأول مرة استخدام الدالة ReLU تفعيل، والحد الأقصى تجميع، والانقطاع وتسريع GPU من هذه التكنولوجيات الجديدة .

2014 نيان، اقترح جوجل  بداية صافي ، والتي هي الفكرة الأساسية يمكن أن تكون مكدسة مرارا التفاف كفاءة هندسة الشبكات العصبية، انخفض معدل الخطأ إلى نصف أليكس صافي،

عام 2015، مايكروسوفت  ResNet تدريب بنجاح 152 طبقات شبكة عميقة الجذور. بعض من الشبكة العصبية السابقة، وعلى الجانب المدخلات، وسط الكثير من الخلايا العصبية، ولكن طبقة واحدة فقط. ورفع مستوى التكنولوجيا، فإنه من الصعب تحقيق اختراق في ذلك الوقت. مايكروسوفت زادت هذه ResNet إلى حوالي 152 طبقات، ويعتبر انفراجة. في نفس الوقت، وسوف تقلل نسبة الخطأ إلى 3.46 في المئة، لتحديث السجل مرة أخرى.

ومنذ ذلك الحين، وأساسا كل بضعة أشهر أو حتى سنة وتظهر تقنيات الجيل القادم، مثل هندسة الشبكات الجديدة، وهي شبكة أعمق من أساليب التدريب. يمكننا ان نقول ان CNN تقود موجة من عمق التعلم .

هذه الشبكة العصبية الإلتواء في النهاية ما هو؟ جوهرها هي عملية التفاف.

ويمكن أن نشير إلى FIG.، الزاوية اليسرى العليا هي الخضراء 5 * 5 مصفوفة، مصفوفة هي في المنطقة الصفراء من نواة 3 * 3 الإلتواء. دور المنطقة الصفراء، وهي مغلفة على مبلغ المرجح لعدد المصفوفة، سيتم وضع عدد من حساب (انظر منطقة البنفسجية) في مصفوفة جديدة.

ثم ننظر إلى الصورة الثانية الزاوية اليمنى العليا، والمنطقة الصفراء إلى الحق واحد، هو خطوة، وهذا "خطوة" يشير إلى مقياس آخر الخطوات داخل --CNN (معلمة هي التفاف النواة)، حيث يتم تعيين حجم الخطوة إلى الخطوة 1. بعد انتقاله خطوة واحدة، وهي نفس المنطقة من المبلغ المرجح للأصفر، ووضع رقم جديد (يتم وضع الرقم الأول في منطقة البنفسجية).

يمكننا الأصفر يتم إصلاح المنطقة بأسرها إطار الصورة والحجم والطول والعرض، وبالترتيب من اليسار إلى اليمين ثم لأسفل، والانتقال ثلاث مرات، تليها ثلاث رقم جديد ستخرج منه، ثم تتحول إلى القادم حساب مصفوفة. هذا هو العملية المحلية، والبيانات الخام (المدخلات 5 * 5) من خلال تلافيف 9، نتيجة الإلتواء يمكن الحصول. وهذا ما يسمى نتيجة التفاف تتميز في أنها مصفوفة جديدة من 3 * 3 - هذه المصفوفة الطبقة التالية وعملية الإدخال، وتشغيل بعض تجمع.

التالي ونحن ننظر في سير العمل سي إن إن. نلقي نظرة على بعض المفاهيم الأساسية: الأول هو أن تحدثنا فقط عن عملية الالتواء، والثاني هو عملية تجمع، وهذا مهم جدا، والثالث هو وظيفة تفعيله، طبقة الربط الكاملة ودالة الهدف.

بعد ذلك ننظر في هذه المدة إلى الأسفل في الرسم. أولا، وضعنا إدخال البيانات الخام إلى ذلك (الجهاز)، ثم تعرض لتجمع التفاف تكوين + + طبقة في شكل، على سبيل المثال، التفاف طبقة وظيفة التنشيط. ثم، مرة أخرى باستخدام نفس مجموعة من مزيج من هذا القبيل للالتفاف القادم ...... أبقى تشغيل دورة، حتى يتم استخراج كافة الميزات. وفي وقت لاحق، كل طبقة ميزات استخراج يرتبط بشكل كامل مع لرسو السفن، المستمدة من القيم المتوقعة ومقارنتها مع القيمة المستهدفة. وأخيرا، فإن الفرق بين الجهازين وسيتم اصلاح وإعادة التدريب. هذا هو العمل الكامل.

بعد ذلك، دعونا ننظر في عملية التفاف أن يأخذ بدون وسائط، ونحن بحاجة فقط لإعطائها لتعيين الحد الأقصى وتجميع تجميع نفسه. تجميع أكبر منطقة التغطية يشير إلى قيمة الحد الأقصى أخرجت - الغرض منه هو معظم السمات الهامة يؤخذ بها، بعض الميزات أقل وضوحا تجاهلها.

عملية التفاف على ثلاثة ملامح رئيسية هي:

الميزة الأولى هي ثابتة. ولنا أن نتخيل صورة بعد الإلتواء، في الزاوية اليمنى السفلى من خط مستقيم، إذا كان (الرسومات) المتفق عليها في الزاوية اليسرى العليا من التعرف على الصور ميزة التفاف التفاف يتميز خط مستقيم، وأن الزاوية اليسرى العليا من الرسومات أمر لا بد منه خط مستقيم، لأن نفس الخصائص. وهذا هو أيضا سمة من التفاف داخل الشبكة العصبية، أي الوضع النسبي للميزات اثنين من موقف المطلق في الصورة لتكون مهمة.

والسمة الثانية هي تخفيض البعد مميزة. نحن نستخدم المصفوفة أعلاه هو 5 * 5، ولكن في الحقيقة 10024 * 798 بكسل الصور تحتاج إلى تستهلك الكثير من الأداء، ولكن معظمهم لا يطلب الحسابات، هو أكبر تجمع من أكثر السمات الهامة يؤخذ بها، تجاهل تلك الميزات أقل وضوحا لتوفير بعض الموارد الحاسوبية.

والسمة الثالثة هي لمنع الإفراط في تركيب. كما هي الأكثر وضوحا استخراج ميزة، فمن الممكن لمنع overfitting.

هنا ننظر في وظيفة التنشيط. قد يتعرض خبرة سابقة في تعلم الطلاب الجهاز إلى وظيفة مختلفة تفعيل وظيفة --sigmoid، وهو منحنى في حدود 0-1.

ونحن نتحدث عن هذه الوظيفة ReLU يمكن التعبير عن الخط الأزرق في الشكل أدناه. هو في الواقع وظيفة دالة متعددة التعريف، عند إعطاء قيمة وظيفة أقل من الصفر، بغض النظر عن عدد سلبية، بإرجاع 0. عند إعطائها أكبر قيمة من أو يساوي 0 عندما يعطى بغض النظر عن القيمة يمكن أن تعيد نفسها (X)، الذي هو في الواقع وظيفة بسيطة جدا.

أن وظيفة التنشيط في النهاية ما هي الفائدة؟

مجازيا، وأنا الآن عقد إبرة، انتقل إلى شريط من ناحية أخرى، بدأت بعيدة عن بعضها البعض، وأنا لا أشعر بألم، ثم تقترب الإبرة ببطء يدي الأخرى، وحتى التعادل الأخير ل أسلم هذا العصب سوف اقول ذهني، يا واحد لمجلة ل- أنا سوف يشعر بالألم، وهو ما يعادل "تفعيل" و.

إبرة مع يدي الأخرى من قيمة العتبة، عندما كانت المسافة أقل من هذه العتبة، وفي النهاية قريبة تماما، وسوف أعصابي أقول على الفور ذهني (ألم)، وبالتالي تفعيل بلادي "الإحساس بالألم" - وظيفة التنشيط مبدأ. آلات عادة المدربين شيء، إذا لم يتم الوصول إلى العتبة، لن يتم تفعيل الميزة، وإذا تجاوز قيمة العتبة، وحيث يتم تنشيط الإخراج.

مزيد من أسفل، علينا أن ننظر في منظور كامل لتشغيل الشبكة العصبية الإلتواء. FIG نظرة أقل من هذا، فمن بريد إلكتروني A، عملية التفاف التي يتعين القيام بها أولا، ثم بعد نواة التفاف طويلة ملامح وجدت وفقا للنواة الالتواء وتحديد الخطوات، وأخيرا كل الخلايا العصبية نشطة وكاملة الماضي طبقة الاتصال المراسلات، من خلال الضرب مصفوفة، لمعرفة ما إذا يتم تفعيلها في الواقع.

مرتبطة ارتباطا كاملا وظائف طبقة كدور "المصنف" في CNN بأكملها، ويتحقق عموما التأثير النهائي.

ثم دالة الهدف. الإلتواء الانحدار الشبكة العصبية في معظم المشاكل مع والأوروبي (الإقليدية) مسافة، الخوارزمية هي:

. ونحن عادة استخدام صيغة أقصى اليمين، الصيغة لصيغ الجمع، والتي اتخذت من البداية إلى n، يتم حساب الفرق بين الرقمين.

المسافة الإقليدية ما هو استخدامه؟ على سبيل المثال، هدفين من الماضي إذا كان التشابه مرتفع نسبيا. وهكذا عن طريق حساب المسافة الإقليدية، يمكننا تحديد ما إذا كانت متشابهة.

المبادئ الأساسية والمفاهيم الأساسية الإلتواء وقدم الشبكات العصبية انتهى. التالي ندخل وجه الروابط الاعتراف، تنقسم عموما إلى أربع خطوات: الخطوة الأولى هي الإطار كشف الوجه، والخطوة الثانية هي لمعايرة صورة، والخطوة الثالثة هي مقدار التحول صورة، والخطوة الرابعة هي مقارنة النواقل.

الخطوة الأولى في إطار كشف الوجه. الصورة السابقة، قد يكون هناك أكثر من وجه، ولكن عدة وجوه. لا يهم كيف وجوه كثيرة، علينا أولا تلبية ملامح الوجه من الحدود العثور عليها، والحدود لاعتراض عليه.

كيفية اعتراض؟ تحديد المواقع. ويستند على ميزة الوجه لتحديد، كما قلت قبل قليل، إذا كان الموقع قد عين واحدة، يكون اماكنها متناظرة كما عين واحدة، فإنه (الجهاز) سوف تكون قادرة على العثور على الموقع من العين، ومن ثم يمكن العثور على قسم الزاوية . في الاعتراف، ومجموعة يتميز الحدود مهم جدا، لأن هذه تعتمد على الجهاز، يمكنك رسم موقف الوجه الكامل. يمكن للمرء أن من السمات الرئيسية للجهاز تشير إلى الذقن، وذلك لأن الفم يمكن فتح أو مغلقة معا، والذقن ولكن بصفة عامة لا تتغير كثيرا. والثاني هو الحاجبين - عيون بحث، الحاجبين مثل تبحث عنه. والثالث هو جسر الأنف، وطرف الأنف، والجزء العلوي والشفة السفلى.

مرة واحدة تم العثور على هذه الميزات، فمن الضروري إيجاد مواجهة الحدود - يمكن أن تولد بعض النقاط على الحدود لمواجهة وجه مربع، وجه بيضاوي ووجه مستدير، الجهاز، ثم استخدام الحدود الرسم (مثل الحدود دائرة) للمقارنة، وجدت ليس صحيحا تماما، وانها لن توقف عامل التعديل حتى الامتثال الكامل.

ولكن عندما اعترضت بالقرب من الحاجة وجها لتخصيص مسافة معينة، ونحن لا يمكن أن يكون تماما وفقا للحدود لاعتراض، على سبيل المثال، الشكل أعلاه الجزء الشعر، (الناس) قد ارتداء قبعة، وبالتالي فإن الجهاز لا يمكن اعتراضها بشكل كامل، ولكن ترك حول مساحة، ومن ثم اعتراض الصورة. إذا كان هناك نقاط الوجه متعددة، ثم قطع تعدد الحدود الوجه.

الخطوة الثانية هي صورة المعايرة. في الواقع، وهذا المفهوم يتفق مع فكرة البيانات المحوسبة. سواء كنت تعطي الجهاز الصورة والصوت والأرقام والسلاسل، أو بعض البيانات الأخرى، فإنه سيتم تحويله إلى بيانات يمكن أن نفهم الكمبيوتر.

معايرة الوجه هو، سواء كان لرئيس الجهاز مائلا، وغمط أو نظرت إلى أعلى - موقف ليس إيجابيا، ثم قطع أول إطار الوجه، و(نقطة خضراء في الشكل أدناه) لتحديد المواقع لكل نقطة، ثم إحداثيات المواقع نقطة، مقارنة مع إحداثيات الوجه الحقيقي التربيعية، والفرق الزاوية بين الاثنين هو ملتوية زاوية الرأس ودوران عكس الصورة عن، تصبح الصورة الإيجابية.

هذا التأثير مفيد جدا لأنه يمكن الحد من الأخطاء التي لا داعي لها. تعلم الآلة، أيضا، عند إعطاء مجموعة من أنه لم تتم معالجة البيانات للتدريب ودربت في نهاية المطاف نتيجة ممكنة ليس فقط ليست جيدة، قد يكون هناك العكس، لاتخاذ قرارات لأنك أنت خطأ. على سبيل المثال، سلعة التي توصية ذكية، إذا لم تتم معالجة البيانات المدخلة، وحتى تعيين أبعاد غير ذات جدوى، قد يكون أوصى الجهاز للقيام الاتجاه الخاطئ.

ولذلك، معالجة البيانات مهم جدا لإزالة الأخطاء التي لا داعي لها، وجميع الخوارزميات هي مفيدة حقا في الحسابات المذكورة أعلاه - هذه الفكرة مهمة جدا.

والثالث هو مبلغ تحول الصورة. الصورة الناتجة عن كمية التوجيه هو كيف؟ يتم إنشاء ناقل الصورة بعد عملية الالتواء وحمام سباحة. ناقلات كلا مقدار واتجاه، إذا كانت الزاوية بين متجهين صغيرة جدا، وأن هذه النواقل اثنين قريبة جدا.

الزاوية بين ناقلات على سبيل المقارنة، يمكن تحديد ما إذا كانت الكائنات متشابهان. على سبيل المثال، فإننا بحاجة إلى تحديد اثنين من المواد ذات الصلة الى رؤية الكمبيوتر متشابهة، نحن بحاجة إلى العثور على اثنين من المواد، مقال الذي يتم استخراج الكلمة - كلمة رئيسية واحدة متجه، فإن جميع كلمات معرفة وقت لاحق، حساب في اتجاه ومقدار المتجه. ورقة أخرى هي أيضا نفس العملية، وآلة لفترة أطول مقارنة مجموعتين من ناقلات، إذا تتزامن تقريبا، ثم محتويات المادتين هي مشابهة جدا. دور تعلم الآلة ناقلات مهم جدا.

صورة بعد تحويل المبلغ، تحتاج إلى وضع يتم احتساب هذه النواقل، ومن ثم القيام ناقلات مقارنة دالة الهدف، ومن ثم مبرهنة الباقي للحصول على زاوية بينهما - مقارنة مماثلة من المادتين السابقتين، يجب استخدام هذا إدارة. لم يكن هذا ناقلات وناقلات الهدف لتتزامن تماما، وشملت زاوية صغيرة، طالما أن قيمة العتبة، فإنه يمكن تحديد حد سواء ما شابه ذلك، ويتم تعيين عتبة جيدة بشكل مصطنع.

والخطوة الأخيرة هي المقارنة النواقل. نفس الوجه، على بعد مسافة صغيرة ناقلات المقابلة؛ وجه مختلف، وبعد المسافة ناقلات كبيرة بشكل طبيعي.

مصطلح ناقلات الحساب - المنتج الداخلي، الذي هو نتاج العنصر تلخيص المقابلة، زاوية يمكن حساب ذكرت للتو أعلاه. الصيغة:

. أصغر زاوية، مشيرا إلى أن اثنين من وجوه أكثر مماثلة.

هذه هي الضيوف الحالي جميعا. أكثر انفتاحا الذهاب فئة فيديو لشبكة لى فنغ AI Yanxishe وتش المجتمع. التركيز على عدد جمهور قناة الصغرى: AI Yanxishe (okweiwu)، يمكنك الحصول على أحدث إشعار وقت الفئة المفتوحة الحية.

يمكن بعد قسم المبيعات TGP، بيتا تينسنت تشارك في لعبة الطيران بها؟

جامعة تسينغهوا Kepei: الجملة محادثة دردشة مراقبة | AI Yanxishe 65 محاضرة

وعلى الرغم من تايوان ألف آلة يوان، ولكن التقاط الصور، فإنه لم ألف دولار! جولات مخطط لينوفو S5 برو Bingpo

هناك جيل جديد من الرقم الرسمي هيونداي أكسنت صدر: الشباب وديناميكية النمذجة

مبيعات لعبة تينسنت بيتا في حفرة المقبل، لتكرار البخار آخر ذلك؟

أعلن ضابط مؤتمر ربيع جديد هواوي: استمتع استمتع 9E + 9S + قرص نسخة M5 الشباب على الانضمام إلى الإضرابات

الجوار س CORE JEWELS المجوهرات، بغض النظر عن قيم اللون والملمس خارج!

تلك المخرجين الذين عملوا مع يو نان، وكنت على بينة من وو جينغ و "وولف 2" لا فقط؟

تينسنت اتبع جوجل في المكتب، الألعاب السحابية ستكون كبيرة المقبل تنفيس عن ذلك؟

الشيب ليست رهيبة! ولتوضيح العلاقة بين الشعر الأبيض والجسم

الجيل AirPods المظهر، هي التي شنت أبل H1 رقاقة، ومجهزة مع حالة شحن لاسلكية

قبل عشر سنوات، تايوان الدراما المعبود، وتشن تشياو أون سيندي احتلت معا نصف البلاد