الشبكات العصبية عادة ما يقومون ماذا؟ خصائص بصرية تشرح قليلا

شبكة لى فنغ: مثل تعلم الآلة والذكاء الاصطناعي، فقط لتجد مملة من الصعب على ممارسة الصعب أيضا لقتل الوقت؟ أنابيب قناة أرخايف البصائر أسبوعية خاصة، من وجهة النظر الفنية، وعمق التعلم معك بسهولة.

ترجمة / الرئة

التدقيق / جيانغ فان

التشطيب / لياو يينغ

بعض الناس يقولون: إن نموذج الصندوق الأسود هو خوارزمية التعلم الآلي، الخوارزمية نفسها ليست للتفسير. عندما كنا تدريب الشبكة العصبية، فإنه من الصعب أن تعرف لماذا تصدر مثل هذا التنبؤ. هذه الخوارزمية لا للتفسير، في كثير من الحالات، مرت رن رن، ولكن ليس في الطيار الآلي، والحكمة الطبية، المشهد أمن المعلومات.

للتفسير النموذج هو حاسم في السيناريو أعلاه، والناس تريد أن تعرف لماذا الخوارزمية لجعل مثل هذا القرار. ولذلك، من أجل معرفة إمكانية تفسير نموذج، أحمل لهذه السلسلة من أشرطة الفيديو.

مشاهدة هذه المسألة أرخايف البصائر يستغرق حوالي 15 دقيقة

الخطوط العريضة

في هذه السلسلة، وسوف نناقش كيف تعلم الشبكة العصبية وإخراج تدريب الشبكة العصبية.

حيث سيركز الجزء الأول على التصور، ويجب أن يفهم أن عدد وافر من منظور تدريب الشبكة العصبية، ومراقبة انتاجها بعد التدريب النهائي مهام معينة.

الجزء الثاني سوف نرى بعض الأمثلة، وذلك أساسا حول كيفية الشبكة العصبية لتضلوا وجعل التنبؤ الخاطئ. حتى هنا سوف نناقش هذه الشبكات العصبية يمكن البرهنة بشكل واضح، على الرغم من أن هذه الشبكات مستوحاة من طريقة العمل المقررة أدمغتنا.

في الجزء الثالث، وسوف يناقش أحدث الإفراط في تركيب عدة أوراق، المفاضلة بين الذاكرة ونموذج عالمي، وكيف ترتبط هذه مع عملية التعلم من الشبكة العصبية.

تصور فيه

تخيل، قمنا بتدريب شبكة التفاف العصبية لتصنيف الصور، والمشكلة الآن هو أن نتمكن من رؤية هي مجموعة كاملة من الضرب مصفوفة والعديد من العمليات الحسابية أخرى، إذا أردنا أن نفهم ما يحدث في الشبكة ، هذه العمليات وحدها، يريد تفسير مجدية نتائج من الصعب جدا. لكن لحسن الحظ، هناك طرق للسماح لنا لمعرفة أن الصندوق الأسود الغامض.

دعونا نبدأ من التصور الميزة. أبسط شيء ملامح التصور يمكن القيام به هو مجرد عرض الشبكة. بعد تدريب جميع الصور إلى إعادة إدخال الشبكة ومراقبة الشبكة التي يتم تنشيط الخلايا العصبية. على سبيل المثال، إذا كان لنا أن إزالة الخلايا العصبية معينة من الشبكة، ومن ثم إعادة إدخال صورة الشبكة. عادة هذا لن تكون مضيئة الخلايا العصبية، ولكن عندما يظهر نمط معين في الصورة المدخلات، والخلايا العصبية تكون خفيفة. دعونا هذا السلوك: مرة واحدة تفعيلها. كما لو أن الخلايا العصبية قائلا: "يا شباب، ورأيت في مدخلات نموذج معين، قد يكون من المفيد تصنيف هذه الصورة لفئة معينة، ونظرة على هذه الصورة".

أمثلة

على سبيل المثال، نحن تتخذ الآن على عمق 4 الخلايا العصبية في الشبكة العصبية، ومن ثم عرض الصور من فيه جميع البيانات التدريب، حيث كل عصبون حدد تسعة الصور يمكن أن تقلل تفعيل هذه الخلايا العصبية. من هذه الأمثلة، لدينا فهم جيد من الخلايا العصبية يمكن محاولة للكشف عن أي شيء. قبل مزيد من التوضيح، وأنا أريد أن أشير إلى أن هذا الأسلوب لا يقتصر على ملامح الصورة.

ومن المثير للاهتمام، تم إنشاء هذا بلوق من خلال العمل في جوجل DeepMind من LEMOND. الموضوعات الرئيسية بطريقة مشابهة جدا للتعامل مع الصوت. أهداف المشروع للتحقق ما إذا كان عمق مجال الشبكات العصبية لتوصيات الموسيقى. ويستند توصية الموسيقى التقليدية على تقنية تسمى تصفية التعاونية ويتم إنجاز، وهذا يعني أنك ببساطة بحث عن الموسيقى المفضلة المستخدم، ومن ثم عرض قائمة من أشخاص آخرين أيضا مثل للعب هذه قطعة من الموسيقى أو الموسيقى المفضلة لديك، بحث عن الأعضاء مماثل، يقابل ذلك جيدا من قبل العازفين أو الموسيقى المفضلة. وبناء على هذا، يمكن أن يكون تصفية التعاونية. يمكن للمستخدم ببساطة مثل توصية الموسيقى للمستخدم مع مشابهة جدا التفضيلات الموسيقية B.

ولكن هنا نواجه مشاكل على تصفية التعاونية - إذا كان هناك أغنية جديدة، لا أعرف من أحب هذه الأغنية ظل هذه الظروف، لا يمكن أن يكون تصفية التعاونية التطبيقية. نشير إلى هذه المشكلة يسمى مشكلة بدء البرد.

الحل لهذه المشكلة هو استخدام الشبكات العصبية العميقة. قبل الاستخدام التعاونية تصفية لا، يتم تعيين هذه الأغنية إلى الفضاء التضمين نفسه هو مجرد رسم شكل الصوت إلى الطيفية للأغنية، ملف صوتي لتحويل الصورة. بعد باستخدام الشبكة العصبية التلافيف، تم تضمين صورة خريطة في الفضاء، ويمكن استخدامه تصفية التعاونية. إذا كان هذا ممكنا، يمكن أن يكون أي من أغنية ليست أغنية الناس حتى سمعت يدخل عمق الشبكة العصبية للحصول على توصيف هذه الأغنية، هذه الأغنية ومن ثم أوصى للمستخدم بواسطة هذا التوصيف.

وهذا يعني أن عمق للتدريب الشبكة العصبية، سيتم تحويل أغنية في الفضاء الإدراج نفسه لتصفية التعاونية. بعض الأداء في الطيف الصوت هو ميزة مثيرة للاهتمام للغاية من هذا التعلم الشبكة العصبية العمق. نقوم به الآن وتفعل بالضبط نفس الشيء ينطبق على ملامح الصورة. نأتي مع الخلايا العصبية المحددة للبيانات أغنية المدخلات الشبكة، ثم مراجعة ما هي الأغنية أكبر قدر من تنشيط الخلايا العصبية اختيار لدينا. في الفيديو، ونحن نتعلم لتحديد الخلايا العصبية الإناث لحن الاهتزاز صوت. عندما كنت تستمع إلى مجموعة العينة، وسوف تجد هذه مثيرة جدا للاهتمام. لأن كل من الأمثلة سوف تعطيك شعورا مشابها جدا.

بطريقة ما، يمكنك سماع ما الذي تبحث عنه في محاولة لفهم الخلايا العصبية. والخلايا العصبية الأخرى في الكشف عن الطبول والموسيقى الالكترونية تبرد. تتيح لنا هذه الأمثلة تجربة مباشرة لماذا شبكة يتعلم. وبطبيعة الحال، بعض التساؤلات حول إرادة، عندما نعيد النظر في هذه الأمثلة، مثل عندما تنظر في وجه هذا الكلب، لا يزال من الصعب التمييز بين اكتشاف الخلايا العصبية في وجه الكلب، أو تسبب مجرد العين. يبحثون الخلايا العصبية في خلفية السماء، أو تبني في المقدمة الكشف عن ذلك؟ لا يمكنك الحصول على إجابات قاطعة.

إذا كنا نريد حقا أن نجد أفضل شبكة في سياق التعلم، وتريد أن تفعل، وكيف نفعل ذلك؟ عمل واحد في مجال الميزات المرئية هو اول ورقة مؤثرة في عام 2014 وروب فيرغوس متى سايلر. يتم تدريبهم للقيام تصنيف الصور التفاف الشبكة العصبية، في حين أن التدريب شبكة مراقبة في محاولة لتصور خصائص يتعلمون.

ويبين الجدول التالي كيف يعمل: أدخل الخريطة، دخول شبكات التفاف العصبية، واحدة لكل سجل تفعيل هذا التنشيط (القيمة)، وطبقة من تفعيلها قبل استخدامها لإعادة بناء، ندعو عملية التفاف المساعدة. يمكنك تشغيل مع نزول التدرج ملزم العادي، وتتضمن فقط خطأ صغير إعادة الإعمار، بعد تصور تدريب ميزة معينة.

كل ما عليك القيام به هو إدخال الصورة، التي التقطت على الخلايا العصبية نشطة، وتجاهل كل الطبقات الأخرى من نفس التنشيط، وحسن مراقبة الشبكة، وسيضم خطوة خطوة لاستعادة مساحة المدخلات بكسل باستخدام التدريب. وبهذه الطريقة لإظهار ميزات مصممة، يمكنك التركيز وتعزيز ميزات معينة في الصورة لتفعيل العصب المحدد. وهذا يسمح لنا أن ما يجري هو شبكة لديهم فهم أكثر تفصيلا.

دعونا ننظر بعض النتائج البصرية. يمكننا أن نرى أن من مجموعة من الطبقات من الشبكة العصبية التلافيف، والتي كانت تصور عرضها. هنا، يمكننا أن نرى ما يحدث في العديد من الشبكات، يمكن أن ينظر إليه على الطبقة الأولى مثل الكشف عن رقم السطر، مثل حافة نموذج بسيط جدا من الشبكة، بينما يستند طبقة مرة أخرى على هذه البسيطة لبناء ميزات أكثر تعقيدا هيكل.

مع زيادة عدد الطبقات، والطبقة العليا من الشبكة أن يكون للكشف عن ميزة معقدة جدا، وجميع المعلومات من طبقة أمام الجمع بين هذه الخلايا العصبية مفيدة للكشف عن أن الأخيرة الناتج صورة بطاقة فئة التصنيف الميزة. لاحظ أنه عند استخدام هذه التقنية، يجب إدخال رسم تخطيطي للشبكة. بهذه الطريقة، لا يوجد مدخل معين، وخصائص بصرية لا يمكن أن يتحقق. الآن تصور من عمل توصيف أوائل أنجبت العديد من المهارات الجديدة ناجحة جدا. واحد هو بكسل المدخلات نفسها، وذلك باستخدام طريقة التدرج النسب، الصفر ولدت، لتحقيق أقصى قدر من الصورة المحددة النشطة الخلايا العصبية.

تظهر هذه الصور على الجانب الأيسر أعيد بناؤها من الفضاء المدخلات، والصور على اليمين تظهر المدخلات صورة حقيقية للشبكة

دعونا نرى كيف يعمل. بداية من صورة بشكل عشوائي، كل بكسل يقترب رقم عشوائي، وهذه الصورة تكون مدخلا للشبكة العصبية، نود أن إزالة محاولة معينة للخلايا العصبية تفعيل من الشبكة، ومن ثم حساب عكس التدرج التعلم نشر. هذا وسوف اقول لنا كيفية تغيير هذه الصورة لكل بكسل. حيث هذا مزيد من تفعيل الخلايا العصبية، عن طريق حساب التدرج وفقا لالخلايا العصبية معينة، وتعديل القيم بكسل من المدخلات. كرر هذه العملية عدة مرات، يمكنك إنشاء صورة جيدة جدا للخلايا العصبية محددة تفعيل من الصفر.

ونحن نرى مثالا على آلاف التكرارات من خلال. وبالمقارنة مع الطرق السابقة، والفرق الرئيسي مع هذا النهج هو أننا لم نعد بحاجة إلى إدخال الصورة الفعلية، ولكن اختيار ببساطة الخلايا العصبية، ومحاولة لتوليد أقصى حد ممكن لتفعيل صورتها. لعب القليل من الإبداع، ونحن يمكن أن تخلق الخلايا العصبية الحد الأدنى تفعيل في صورة معينة. هنا يمكنك ان ترى بعض النتائج. يتم إنشاء الجانب الأيسر باعتباره الصور أدنى تفعيل الخلايا العصبية معين، والحق هو محاولة لتحقيق أقصى قدر من تفعيل الخريطة، في حين أن الشرق هو مجموعة التدريب لاستكمال الصورة من هذين الأمرين. كما يمكن أن يرى، وكانت النتائج مثيرة للاهتمام حقا، حتى نتمكن من توليد بعض تفعيل في وقت واحد صورة اثنين من الخلايا العصبية.

قبل المتابعة، فمن الضروري أن نذكر، على الرغم من أن هذه توليد الصورة الناتجة يمكن أن يشعر الأعصاب إلى حد ما على ما تم الكشف يوان، ولكن في الواقع توليد هذه الصور ليست بسيطة كما يبدو، ليس فقط باستخدام العودة نشر، ولكن أيضا في محاولة لاستخدام مجموعة من التقنيات تنظيم مختلفة. وستؤثر هذه الآثار الإيجابية يتم إنشاء صورة من المهارات إلى حد كبير نهائي.

تعمل هذه الميزات في المجال البصري الشبكات العصبية يسمح لنا أن نفهم ما يجب القيام به. يستخدم الطبقة الأولى للتعرف على البيانات المدخلة في نموذج بسيط للغاية، نشر العودة إلى عملية كطبقة العملية، وخصائص الشبكة التي هي بسيطة جدا، من قبل الطبقة التالية من الخلايا العصبية، بطرق مختلفة معاد لتقديم المزيد FIG ميزات أكثر تعقيدا. في الشبكة النهائية، كل ميزات كافية لمجمع FIG، والتي يمكن أن تستخدم لكشف فئة محددة الصورة.

عرض الأبحاث

لسنوات عديدة، والكثير من الناس مخصصة لميزات بصرية. هنا، عرضا خاصا فيها العمل هو الأدوات التصور العميق. ويمكنك معرفة ذلك من خلال صفحة جيثب. أقاموا نظاما، يمكنك تحليل ما ينظر إلى عمق في الوقت الحقيقي من الشبكات العصبية. يمكنك وضع بعض العناصر أمام الكاميرا، وعرض أي طبقة من الشبكة، في حين تحليل الشبكة من الصورة المدخلة، لمعرفة الوقت الحقيقي السلوك تفعيل الميزة.

على سبيل المثال، يمكننا أن نرى أن تعلم كيفية اكتشاف النص في الصورة. ومن المثير للاهتمام، والشبكة نفسها ليست على النص على مجموعة من البيانات من التسمية الانتاج التدريب، وهو ما يعني أنه حتى لو كان النص ليس فئة التصدير، علمت عمق الشبكة العصبية لدينا إلى التعرف على النص في الصورة. وهذا يعني أنه عندما ترى بيانات التدريب، والنص في الواقع مفيدة جدا للتنبؤ الفئات، مثل الكتب أو إشارات المرور. يمكن التعرف على النص في تصنيف الصورة المدخلة من هذه الصور سوف يكون من المفيد جدا.

وأخيرا، لتظهر لك تطبيق التصور يتميز الحالة - تم إنشاء مشروع يسمى "DeepDream" من قبل مهندسي غوغل. في أعماق الحلم، اختر صورة المدخلات، وعدد المدخلات الخلايا العصبية للشبكة المحددة بطريقة أصل التدرج، الصورة المدخلة ضبط تدريجيا إلى الخلايا العصبية لتفعيل حيث أن العديد من الذين تم اختيارهم.

هنا يمكنك ان ترى، إذا كان لنا أن اختيار الخلايا العصبية أكثر سطحية في الواقع الحصول على هو لأولئك الذين يمكن أن تحصل على الطبقة الأولى، الميزات المحسنة مثل خطوط حافة بسيطة، ولكن إذا اخترنا، وأكثر من كبار تلك الخصائص، يمكنك التعرف على وجوه محددة في صورة تظهر فجأة، مثل الوجه والعينين. لهذا السبب يسمونه "ديب الحلم". ويمكن أن يرى ميزة الاختيار وتصور لهم، مع رمز معالجة البيئة المحيطة بها، ويمكن أن تنتج تأثير ملحوظ.

ملخص

وخلاصة القول، إذا اخترنا عمق الشبكات العصبية، واستخدام التدريب الخلفي نشر في مجموعة التدريب على ذلك، في نهاية المطاف سوف يتعلم ميزة بسيطة جدا في الطابق الأول في الجزء الخلفي من مزيج من هذه الطبقات، حتى معقدة للغاية، كافية للقيام بهذه المهمة مع الميزات. وبما أن التدريب الشبكة المستهدفة، وذلك ببساطة يتميز سيلة بصرية، هو أن ننظر في البيانات في مجموعة التدريب معظم الخلايا العصبية يمكن تفعيل المحدد. وأفضل طريقة هي أن تبدأ من نقطة الصفر مع التدرج لتوليد إشارة الصورة، وذلك لتحقيق أقصى قدر من تفعيل الخلايا العصبية معينة. وميزة هذه الطريقة هي أن أي عملية جميع البيانات المدخلة، وهي ميزة البصرية تتطلب الوحيد الذي التنظيم نفسه هو المفتاح.

هذه هي ملامح الجزء المرئي من القسم التالي سنناقش أمثلة من المواجهة. نحن يمكن أن تولد بعض الصور وهذه الصور عندما ندخل الشبكة العصبية، التي صنفت عن طريق الخطأ كما الموسومة خطأ، ليس هذا ما نريد أن نراه. ولكن هذه التصنيف الخاطئ يمكن أن تجلب بعض الإلهام عن أدلة حول كيفية تحسين الشبكة العصبية بالنسبة لنا.

لى فنغ شبكة ملاحظة: أرخايف هو عبارة عن مجموعة من الورق لورقة الموقع يمكن إثبات الأوراق الأصلية.

فيديو من أرخايف البصائر، لى فنغ لى فنغ مجموعة شبكة جمعت ترجمات.

طريق الحرير

الشبكات العصبية عادة ما يقومون ماذا؟ خصائص بصرية تشرح قليلا

"منغ دودة نهر" ليتل شنيانغ كلمات يون هوا حملة ترويجية الفطائر التحدي والفواكه والصغيرة شنيانغ ليصبح مدير الحشرات شرسة

2018 قسم تايرون سحابة قفل المؤتمر ورقة بيضاء نجاحا كاملا!

تخطيط لسنوات عديدة، ودفع غرامة طحن - كاي لهجة سبارك لاعب (CAYIN) N8

جيا يويتينغ زوجة صخبا، تم حل جزء من الدين؛ المقترحة FAW زيادة رأس المال حصة في المغرب بفضل السفر؛ وLG الافراج عن لفة - حتى التلفزيون OLED | لى فنغ الصباح

2018 الدراما ماذا ترى؟

عندما "تايرون اجتماع قفل سحابة 2018 ورقة بيضاء" التفسير الكامل اختراق السوق سوف عشرة ملايين الأقفال الذكية الدخول في انفجار؟

بعض "الشبكة الحمراء" منتجات العناية بالبشرة، قد نفدت "وجها سيئا"، لا تحذو حذوها ذلك!

"تمرير المستقبل"، مدير الردود روي يونيو: استمرار الإصدار كان السكين لا قطع

"الوحش هنتر العالم" 2019 تحديث رئيسية: خرائط جديدة، وحوش جديدة!

تشو شيون مقابل الأطفال لين يون، الفقرة نفسها شانيل، الذي اخترت؟

الترقية شور الجديد (شور) هذا التغيير يمكن تجلب لنا أي نوع من المفاجأة؟

فيليبس واردة قوية تستعد السوق AI TV

نصف جيك خوان يي نصف الصيف خلال فصل الشتاء، وكان خائفا الناس نظرة!

مقطورة قصة "الله آكلى لحوم البشر 3": بطل الرواية الرقيق من عملية النمو

مقابلة "انفجار الصمت" للمخرج شين يو كون: أننا أشكال مختلفة من "غبية"

فيلم الرسوم المتحركة الصينية حتى 6؟ ! "هارب ذلك! فقدان الذاكرة سوبرمان "كان" احتلال "نيتفليكس

وهي تعرف باسم "حسن الصوت" و "لؤلؤة"، والغناء الآن للدراما زي متعددة

بكين الثقيلة الثلج، سون لي تشانغ تونغ "الطائر" ل

جرس والصوت الأساسية جودة - أقول لك معرفة تفصيلية لل"الحجاب الحاجز رئيس"، و

دونغ شوان: عالية Yunxiang نجني

تفسير معظم الصوت الحقيقي: دانمركية Audiovector قوة فخورة QR1 رف الكتب

وشوان يي القيم حلاقة اللون سقوط الحمل، والأصدقاء: مو أورانج هل هذا أنت؟

الأحكام ذات الصلة