تعلم لمراقبة الشبكة العصبية: تفعيل نموذج التصور كامل طبقة التدريب الإلتواء

النص الكامل 3425 الكلمات، وعندما يكون التعلم مدى المتوقع 10 دقيقة

مصدر الرقم: www.raincent.com

عمق مجال تعلم الآلة هو التعلم اتجاها جديدا، هو عرض ذلك آلة التعلم منها أقرب إلى الهدف الأصلي - الذكاء الاصطناعي.

التعلم العميق هو أن نتعلم القانون الأصيل وتمثل مستويات من بيانات العينة، المعلومات التي تم الحصول عليها في سياق هذه التعلم عونا كبيرا لشرح مثل بيانات النص والصورة والصوت. ولذلك، فإنه في تقنية البحث، واستخراج البيانات، والتعلم الآلي، والترجمة الآلية، ومعالجة اللغة الطبيعية، تقنيات التعليم، والصوت، توصية والتخصيص الوسائط المتعددة، فضلا عن غيرها من المجالات ذات الصلة حققنا الكثير.

مقارنة مع غيرها من التقنيات تعلم آلة، والميزة الرئيسية هي القدرة على التعلم تلقائيا عمق تعلم التمثيل المجرد من إدخال البيانات. ومع ذلك، فمن المعروف.

. FIG المصدر: سيان مولوي

في وقت مبكر من عام 1969، نشرت Minkey وبابيرت كتاب لإثبات أن المستقبلات طبقة واحدة، والسلف الشبكات العصبية الاصطناعية، لا يمكن أن تحل المشكلة XOR.

لشعب بلا خلفية في علم الحاسوب أو غيرها من الصناعات، يشير المشكلة XOR لاثنين من المدخلات الثنائية: A و B. إذا وفقط إذا A أو B صحيح هناك عودة إلى true، ومن هنا جاء اسم "XOR (خاص أو") ". وهناك طبقة المستقبلات واحد لا يمكن أن تحل هذه المشكلة هو السبب في أنها يمكن أن تحل إلا نوع خطي للانفصال إذا يمكن وصفها المدخلات XOR مجموعة المشكلة والمخرجات باستخدام FIG:

أسوأ في العالم تيك تاك تو (المصدر: ويكيميديا كومنز)

يمكنك رسم خط مستقيم على الخريطة، والدوائر والصلبان على حدة؟

لا، لا تستطيع، والتصور هو لا.

لحسن الحظ، بعض التصور الثاقبة هو بين اثنين، ولدت من عمق الميدان من الدراسة. والسبب في ذلك هو أن كل طبقة من الشبكة العصبية يمكن النظر فيها قبل طبقة التضمين، على الرغم من أن الدوائر الرقم أعلاه ويعبر الجانب الأولي لا يجوز فصل خطيا، ولكن بنسبة بسيطة الترميز، فإنها تصبح فصله خطيا.

تذكر الزاوية اليسرى العليا والزاوية اليمنى السفلى من الخريطة. ثم، تخيل البعد الثالث للصورة مطوية من الزاوية اليمنى العليا من الشاشة، والضغط وصولا الى الزاوية اليسرى السفلى. وينبغي أن يكون النهج الصحيح من هذا القبيل:

ننظر عن كثب، وسوف تجد أن ليس لدي أي الفنية

الآن، يمكنك رسم خط مستقيم على الخريطة، والدوائر والصلبان على حدة؟ وينبغي أن يكون على ما يرام. وتتمثل المهمة الرئيسية للشبكة العصبية هي جيدة في هو استخراج المعلومات، وصياغته في أشكال أخرى أكثر فعالية. وقال في الواقع، ليس لتدريب الشبكة العصبية القوة التنبؤية، ولكن لتعلم أن يجد انه كان من دراسة عمود عمق والبحوث.

تعلم لمراقبة

الشبكة العصبية التلافيف (CNNs) هو دراسة متعمقة من أكثر العمارة الشعبية تطبق على بيانات الصورة. لفترة وجيزة، والشبكة العصبية التلافيف تعلم عدد من المرشحات، تطبيق هذه المرشحات إلى كل بكسل وطبقة الصورة. من خلال تطبيق هذه المرشحات للصورة، وتكرار الاختزال، والذي الشبكة العصبية للتعلم لتحديد بسيطة، وانخفاض مستوى ملامح من الطبقة الأولى، وتتميز في أن الطبقة النهائية من التعقيد حددت في مرحلة متقدمة. هذا هو التفسير العام.

المصدر: عمق التفاف شبكات الاعتقاد لتمثيل الهرمي قابلة للتعلم غير خاضعة للرقابة، وانتظر لي.

كما هو مبين، ومجموعة متنوعة من التعلم نموذج الاعتراف الحافة، ثم ملامح الوجه، والوجه كله (تتم إزالة العديد من طبقة وسيطة). إذا كنت تستخدم جوجل للبحث عن "التفاف الشبكة العصبية طبقة التصور"، وسوف تجد الكثير من صور مماثلة.

ومع ذلك، لم يسبق لي أن رأيت في التصور التفاف طبقة الشبكة العصبية عملية التدريب، لذلك أريد أن تعطيه رصاصة واحدة. في هذه التجربة، واستخدمت مجموعة البيانات MNIST عام، وهي مجموعة من الشخصيات رسمت باليد بالأبيض والأسود، أي ما مجموعه ستين ألفا، وارتفاع وعرض كل رقم هناك 28 بكسل. يمكنني استخدام نموذج التفاف بسيطة، على النحو التالي:

6 هيكل الشبكة التلافيف تضم ثلاث طبقات وطبقات كثيفة

تصور

تم تدريب الشبكة العصبية خمسة الحقبة، يتم تقسيم الصورة 1024 في مجموعة صغيرة، ما مجموعه 290 خطوات التدريب. بعد كل خطوة، ومجموعة من الصور عينة 10 (كل رقم في) انتقاؤه المستوردة إلى نموذج، وإنقاذ الطبقة النشطة من كل التفاف. رغم أنه في السنوات الأخيرة أصبح عفا عليها الزمن، وأسهل التدريب ReLU الوظيفة هي الأكثر شعبية، لكنني قررت أن تستخدم كطبقة التفاف وظيفة تفعيل تان. وذلك لأن تان محدودة بين -1 و 1، بحيث يكون تصور بسهولة. عندما يتم تطبيق تفعيل الطبقة الأولى إلى حمراء وزرقاء خريطة ملونة، على النحو التالي:

Conv1: تفعيل الصورة المدخلة (الصف العلوي) وطبقة التفاف أربع قنوات. مجموعة التنشيط من +1 (الأزرق) إلى 0 (الأبيض) إلى 1 (الحمراء). الإطار (أعلى اليسار) هو عدد من الإجراءات التدريب المستخدمة.

يبدو Conv1 لتعلموا التعرف على القناة الأولى والقناة الثانية من عرض السكتة الدماغية، لأن داخل كل شخصية هو الأحمر الداكن، في حين أن الخارج هو الضوء الأحمر. في القنوات الثالثة والرابعة، والتي يبدو أنها قد تعلمت لتحديد حواف الأزرق الرقمي، الخلفية الوردي، حافة الرقمية بيضاء. ومع ذلك، جزء صغير من معايير التعلم عمق تعليمي تفعيلها، أي كل قناة سوف تتعلم خصائص واضحة وفريدة من نوعها، مثل الحواف العمودية والأفقية، CONV1 نسخها إلى حد كبير المدخلات الأصلي، وأدلى بتعليقات قليلا .

Conv2: نفس الإعدادات وConv1.

وConv1 ما شابه ذلك، يبدو Conv2 أيضا لنسخ الإدخال الأصلي. A أولا، والثانية، متطابقة تقريبا مع بعضها البعض بين القناة الرابعة، وعلى حافة Conv1 أبرزت متطابقة تقريبا، باستثناء القناة الثالثة مدخلات عدم وضوح نسخة.

قدمت Conv1 مع نفسه، إلا أن 8 قنوات: Conv3. هذه الطبقة هي نصف قرار من الصورة الأصلية، وبالتالي زيادة تفعيل التصور بدون الاستيفاء.

في Conv3، رأينا ربما الميزات أولا تعلمت حقا. في القناة السادسة، بالقرب من نهاية التدريب، تستطيع أن ترى في الأرقام الزرقاء، فإن الكثير من خلفية غير وردي، ويجري ظل خلفية من كل جزء من عدد حمراء. هذا يدل على أن هذه القناة قد تعلم التعرف على مستوى الحافة السفلية. وبالمثل، فإن الأحمر الرقمية القناة السابعة، الخلفية الوردي، والأبيض كل مستوى رقمي فوق الحافة. ومع ذلك، يبدو أن قنوات أخرى لمجرد نسخ الصورة الأصلية.

Conv4: مع مجموعة Conv3.

في Conv4 يمكن أن ينظر إليه خصائص محددة أكثر وضوحا. على وجه الخصوص، يمكنك أن ترى حواف زوايا مختلفة. والأولى والثانية والسادسة قناة معرف أعلى الحافة الأفقية. ثالثا، القناة السابعة والثامنة معرف حواف قطري. القناتين الأخرى هي نسخة الخام من الصورة الأصلية.

Conv5: تعيين نفسه Conv1، إلا أن 16 قنوات. هذه الطبقة هي ربع القرار من الصورة الأصلية، وبالتالي زيادة تفعيل بدون الاستيفاء التصور. (صورة كبيرة جدا، كما هو موضح هنا بعد الانتهاء)

Conv5 الكثير من أسفل أخذ العينات، والقرار هو فقط 7X7 بكسل، ولكن استخراج ميزة لها يبدو أكثر وضوحا. في المراحل الأولى من التدريب، كل القناة الخلفية الوردي، والكثير من نقص المعلومات. إلى الخطوة 70، وقد علمت أنه طبقة اكتشاف غامضة المدخلات مماثل. ومع ذلك، قبل نهاية التدريب، هذه القنوات وقد تميز بوضوح عن بعضها البعض، وتفعيل أظهر تغييرات جذرية. باسم "ميزات مستقلة" منخفضة القرار، والنضال، وليس من الواضح ما هي الميزات لتعلم هنا، من الواضح، حيث كل قناة لها أهمية خاصة بها.

Conv6: هذه الصورة كبيرة جدا، فإنه يظهر هنا تفعيلها بعد اكتمال التدريب.

للأسف، تجاوزت Conv6 الحد الأقصى لحجم ملف المتوسطة، لذلك اضغط هنا للالتعلم بالملاحظة. وConv5 وبالمثل، الميزات المستفادة هي واضحة للعيان، ولكن من الصعب تمييز ما المناظرة في الواقع إلى نعم.

دقة والخسارة (categorical_crossentropy) عملية التدريب

خاتمة

ثم هذه المادة تقول أي شيء على الإطلاق؟ هناك ثلاث نقاط.

أولا وقبل كل شيء، ونتيجة القليل التعلم العميق مثل دورة قياسي وضعه واضحة. العديد من الكتب، بما في ذلك "التعلم العميق" (غودفلوو الانتظار)، مقارنة مع طبقة منخفضة المستوى غابور مرشحات الالتواء وغيرها من إنتاج اليدوي للمرشح رؤية الكمبيوتر. على الرغم من أن بيانات الاختبار على نموذج لتحقيق أكثر من 95 من الدقة، ولكن كان الأولى أربعة التلافيف طبقة استخراج ميزة نجاح يذكر.

وباعتراف الجميع، وهذا هو نموذج بسيط جدا، يمكنك تنفيذ مهام بسيطة. لمهام أكثر تعقيدا، من المرجح أن يكون نموذج أكثر تقدما لمعرفة بعض الخصائص المفيدة على مستوى منخفض، ولكن عموما أستاذ دراسة متعمقة من الطريق (في تجربتي) يبين أنه حتى بالنسبة لمهام بسيطة، واستخراج ميزة والتكرير هو مطلوب منها أيضا، ليس هو الحال بوضوح.

والنقطة الثانية هي أن تتعلم هي أقل عرضة للاختيار، وميزات مباشرة ومستقلة خصائص البشر. Conv5 Conv6 تعلمت بشكل واضح وخصائص معينة، مثل أن ترميز الصورة الأصلية يمكن أن تكون طبقة كثيفة من الشبكة لتصنيفها وفقا لنوع الرقمية، لكنهم يتعلمون بسرعة ولن يتم ملاحظتها.

هذه مشكلة شائعة في التعلم العمق، لا سيما في النمذجة جيل. النمذجة ولدت، قد يكون نموذجا اثنين أو أكثر من تعلم الميزات على ما يبدو لا علاقة لها جزءا لا يتجزأ من كسمة واحدة.

مصادر FIG: مائة رقم

والنقطة الثالثة هي أنا، أنا، كعالم البيانات، سوف أذكر نفسي كل يوم أن كل شيء التصور هو يستحق كل هذا العناء. I مشاركة في المشروع، على أمل لكتابة مقالة مختلفة تماما. أنا متحمس لخصائص التعلم عرض والصقل، من الكشف على مستوى أدنى الحافة إلى دورة متقدمة والبديل. كما أنني وجدت الخمول الرجل حتى آخر تقريبا أي ملامح المكرر.

وعلى الأخص، وفوجئت أنه بمجرد مستوى معين من التعلم المدخلات أشارت إلى أنها تقريبا لا تغيير في عملية التدريب.

تصور هذا عزز فهمي التلافيف تدريب الشبكة العصبية. آمل أن تتمكن من تعلم شيء ما في بعد قراءة هذا المقال.

الدراسة الجادة، وأتمنى لكم حظا سعيدا ~

انتباه رسالة الابهام

معا نحن نشارك في التعلم وتطوير AI الجاف

مثل طبع، يرجى ترك رسالة وراء الكواليس، والامتثال للمعايير طبع

كيفية بناء أمن الشبكة؟ هدف الحماية هو أفضل كتاب مدرسي

وقال انه وصديقته للترخيص قائلا: "فراق صعب": G4345 القطار والطريق إلى البيت

الطلاب الذين يدرسون في قوانغدونغ انجلترا لعودتهم في الاعتبار: ليس على طول الطريق قبالة الطب قناع، والاستيلاء على منع وجده فصل الهواء مباشرة من عائلاتهم

ووهان "البلغم تنظيف تقسيم": سيقوم الطبيب تاج أسفل المنظار الجديد إلى الرئتين من المرضى الذين يعانون من الالتهاب الرئوي

بدأت الحيوانات للطعن على المحك! قوانغدونغ تاج البحث الجديد في فعالية مرحلة التقييم لقاح

14 مجموعات من 42 مليون يوان / مجموعات تبدأ القصر، 8 ثواني سرقة! شنتشن الفاخرة وانفجار

تقرير اخبارى: حرائق الغابات الاسترالية مستعرة لتوفير وكالات الإغاثة جديدة

ليس موجها التدريبات المشتركة الباكستانية في الوضع في المنطقة مع افتتاح "المحيط الجارديان -2020" ضد أي طرف ثالث لا علاقة لها

600 ساعة من الثلوج في المدينة المحرمة للاستماع إلى صوت الثلوج

"على طول الطريق" في مساعدة التعاون الصداقات الجديدة والقديمة كاملة من المجد

تعيين الجناح على الخط لواء النص حتى رأس مال الشركة مملوكة بالكامل مسجلة 9.99 مليون يوان

خفضت إلى النصف صافرة حول Xupu الصمت: تحية لذكرى البطل الميت