كيفية تحسين صورة نتائج النموذج تصنيف الخاصة بك؟

هذا المقال هو عبارة عن تجميع للAI Yanxishe بلوق التكنولوجيا، والعنوان الأصلي:

تعزيز صورة الخاص بك تصنيف نموذج

الكاتب | أديتيا ميشرا

الترجمة | MichaelChen المحرر | جيف ديمبس، با با الأسماك ايه

الرابط الأصلي:

https://towardsdatascience.com/boost-your-image-classifier-e1cc7a56b59c

يعتبر تصنيف الصور ما يقرب من حل المشكلة. ومن المثير للاهتمام، لديك لنفعل كل ما بوسعنا لتحسين دقة اضافية 1. عندما حضرت "إنتل المشهد تصنيف التحدي الذي استضافته فيديا تحليلات (برعاية تصنيف المشهد تحليلات فيديا تحدي إنتل)" أنا أحب هذه اللعبة، لأنني محاولة لاستنزاف كل من المحتمل بلدي التعلم نموذج العمق. الأساليب التالية عادة ما تكون قابلة للتطبيق على تسليم أي رئيس تصنيف الصور للذهاب.

مشكلة

السؤال التالي هو تصنيف الصورة المقدمة للفئات الست التالية للذهاب.

فئة البيانات

البيانات يحتوي على 25000 صور المناظر الطبيعية الطبيعية، وهذه الصور من مختلف أنحاء العالم.

التقدمي (صورة) تغيير حجم

عندما تدريب نماذج CNN، وضبط من الصغيرة الى الكبيرة الخطية حجم الصورة هو التكنولوجيا. تعديل تدريجي في حجم يوصف بالطبع الثناء fastai على النحو التالي: دراسة متعمقة وممارسة مبرمج. وهناك طريقة جيدة لاستخدام صغيرة الحجم، مثل 64 64 للتدريب، ثم معالم هذا النموذج يتم تدريب على حجم 128 128، وذلك في الماضي. كل واحد من أكبر النماذج تضم نماذج من الطبقة السابقة والأوزان الصغيرة في الهندسة المعمارية الخاصة بهم.

تغيير حجم التقدمي

FastAI

مكتبة fastai يعد مصدرا قويا لمكتبة التعلم عميقة. إذا وجد فريق fastai ورقة المهتمة جدا، وسوف يتم اختبارها على مجموعات البيانات المختلفة، وتحقيق التكيف المعلمة. في حال نجاحها، سيتم إدراجها في المكتبة ومستخدميها مفتوحة القراءة. تحتوي هذه المكتبة لديها عدد من المدمج في المهارات المتقدمة. pytorch مقرها، fastai بالنسبة لمعظم المهام ديك المعلمات الافتراضية جيدة. جزء من النصائح ما يلي:

  • معدل التعلم الدوري

  • دورة التعلم

  • منظم دراسة متعمقة البيانات

  • كاملة الوزن التهيئة

    عند عرض قواعد البيانات المتاحة، عثر عليها مجموعة من البيانات Place365. يحتوي على مجموعة البيانات Place365 تصنيف 1،800،000 المناظر الطبيعية من 365 أنواع من الصور. جمع البيانات في التحدي التي قدمتها مجموعة البيانات هذه هي مشابهة جدا، وبالتالي فإن نموذج هذه البيانات تدريب مجموعة، مع عدد من الميزات للتعلم، وترتبط مشاكل تصنيفنا. لأن فئة مشكلتنا هي مجموعة فرعية من مجموعات البيانات Place365، لذلك أنا استخدم نموذج ResNet50 مع Place365 الوزن التهيئة.

    ويركز النموذج الصحيح على توفير "الأوزان pytorch" في. وظيفة الأداة التالية تستخدم لمساعدتنا بشكل صحيح لتحميل البيانات إلى fastai في المتعلم CNN.

    خلط تعزيز

    خلط تعزيز من قبل المرجح اثنين من صورة الاستيفاء الخطي التقليدي، طريقة جديدة لتعزيز صورة تشكيلها. ونحن اتخاذ صورتين، ومن ثم استخدام هذه الصور الموترة تركيبة خطية.

    خلط تعزيز

    يخضع لبيتا توزيع العينة العشوائية. على الرغم من أن الكتاب توصي باستخدام = 0.4، ولكن يتم تعيين مكتبة إلى القيمة الافتراضية fastai 0.1.

    تحسينات fastai مختلطة

    التعلم أسعار ضبط

    معدل التعلم هي واحدة من معظم التدريب المهم الشبكة العصبية من المعلمات المفرط. fastai هناك طريقة للعثور على حق معدل التعلم الأولي. وهذا ما يسمى تقنية التعلم دورة أسعار، ونحن اختبار أدنى معدلات التعلم، وزيادة أضعافا مضاعفة، وفقدان عملية التسجيل برمتها. ثم نرسم منحنى الخسارة على أساس معدل التعلم، واختيار للدراسة في أشد معدل فقدان القيمة.

    fastai في LR Ffinder

    في معدل التعلم من 1E-06، أشد خسارة

    وتوفر المكتبة أيضا لنا مع عملية إعادة تشغيل التلقائي التدرج العشوائية أصل (SGDR). في SGDR، فإن معدل التعلم في بداية كل تكرار يتم تعيين إلى التحديد الأصلي من القيم، وهذه القيم تنخفض التكرار، مثل الصلب جيب التمام. الفوائد الرئيسية للقيام بذلك هي لأن نسبة التعلم يمكن أن تكون إعادة تعيين في بداية كل تكرار، لذلك التعلم قادر على الهرب من الدنيا المحلية أو نقاط سرج.

    إعادة تشغيل fastai التدرج العشوائية يتناقص مع

    شبكة المواجهة العالمي

    صيغة المواجهة شبكة (GAN هو اختصار لشبكات الخصومة المولدة) في عام 2014 قدم إيان غودفلوو، GANS عميقة هيكل الشبكة العصبية تتكون من شبكة المكونة اثنين، فإنها تتنافس مع بعضها البعض. يمكن GANS محاكاة أي توزيع البيانات. يمكننا أن نتعلمه لتوليد بيانات مماثلة إلى البيانات الأصلية، ويمكن أن يكون في أي مجال - صورة والصوت والنص، وهلم جرا. كنا تحقيق fastai من اسرشتاين GAN لتوليد المزيد من بيانات التدريب.

    GANS تتكون من تدريب الشبكة العصبية، ويشار إلى مولد، الذي يولد مثيل جديد من البيانات، ويسمى الآخر الممي، وتقييم صحتها منه، والذي يحدد ما إذا كان كل مثيل بيانات التدريب البيانات الفعلية مجموعة. يمكنك أن تقرأ أكثر من هذا الرابط.

    https://github.com/fastai/course-v3/blob/master/nbs/dl1/lesson7-wgan.ipynb

    GAN الصورة عينة ولدت

    إزالة الصورة من الارتباك

    الخطوة الأولى في تدريب الشبكة العصبية لم يتم كتابة أي رمز من الشبكات العصبية، ولكن نظرة شاملة على البيانات الخاصة بك. هذه الخطوة الحاسمة. أود أن تنفق الكثير من الوقت (ساعة) تصفح الآلاف من العينات، فهم توزيعها، وتبحث عن نموذجهم. --Andrej Karpathy

    كما قال أندريه Karpathy "بيانات المسح" خطوة هامة. على التحقيق، وجدت البيانات أن الكثير من البيانات التي تحتوي على ما لا يقل عن اثنين من الفئات.

    عملية 1

    قبل استخدام نموذج التدريب، وكان من المتوقع لبيانات التدريب بأكملها. ثم تراجع درجة احتمال أكثر من 0.9 لكنه توقع صورة خاطئة. الصورة التالية هي نموذج واضح أساء تصنيف. بعد مزيد من المراقبة، وجدت تصنف هذه الصور عن طريق الخطأ البشري.

    صورة مشوشة

    بعض الصور وتوقع احتمال ما بين 0.5 و 0.6، وهذه الصورة من الممكن نظريا أن تظهر أكثر من فئة واحدة، وبالتالي منحهم نموذج تعيين نفس الاحتمال، وأنا أيضا إزالة الصور. نظرة على هذه الصور وهذه النظرية أثبتت في النهاية أن يكون صحيحا.

    طريقة 2

    يوفر fast.ai المكونات في مريحة "تنظيف صورة في المكونات،" والذي يسمح لك لتنظيف وإعداد البيانات نموذج. نظافة يمكن لا ينتمي صورة نظيفة لمجموعة البيانات صورتك. ويعرض الصور في صف واحد، بحيث يكون لديك الفرصة لحذف الملف في نظام الملفات.

    زيادة وقت الاختبار

    زيادة اختبار الزمن، بما في ذلك عدد من إصدارات مختلفة من الصورة الأصلية المقدمة وتمريرها إلى النموذج. نحسب قيمة متوسط من إصدار مختلف، ويعطي صورة الناتج النهائي.

    زيادة Fast.ai في وقت الاختبار

    تقنيات 10 المحاصيل المقترحة سابقا مع مهارات مماثلة. قرأت لأول مرة عن مهارة 10 المحاصيل في شبكة مخلفات الورق. بما في ذلك مهارات 10 المحاصيل، والحصول على خمس صور على الزوايا الأربع ونقطة وسط كل المعالم. مقلوب تكرار العملية المذكورة أعلاه، للحصول على صور إضافية خمسة، أي ما مجموعه عشرة. وقت الاختبار طريقة الزيادات على أي حال هو أسرع من المهارات 10 المحاصيل. شبكة شبكة شبكة لى فنغ لى فنغ لى فنغ

    مندمج

    تعلم آلة متكاملة هو خوارزمية التعلم باستخدام مجموعة متنوعة من التقنيات، يمكن هذه التكنولوجيا تحقيق أداء أفضل من التنبؤ خوارزمية واحدة. التعلم المتكامل يعمل أفضل فقا للشروط التالية:

  • تكوين نماذج ذات خصائص مختلفة. على سبيل المثال، متكاملة ResNet50 وInceptionNet من مزيج ResNet50 وInceptionNet مفيدة وأكثر من ذلك، لأنها تختلف في جوهرها.

  • يتكون من نموذج ارتباط أقل.

  • مجموعة التدريب لتغيير النموذج، يمكنك الحصول على المزيد من التغييرات.

  • في هذه الحالة، وأتوقع لدمج جميع النماذج عن طريق تحديد الحد الأقصى يحدث الطبقات. إذا كانت هناك فئات متعددة لديها القدرة العظمى، واختيار عشوائي واحدة من الطبقات.

    النتائج:

    المتصدرين العامة --29 اسم (0،962)

    تصنيفات خاصة --22 اسم (0.9499)

    استنتاج

  • تغيير حجم التدريجي هو فكرة جيدة في البداية.

  • تأخذ من الوقت لفهم البيانات والتصور أمر لا بد منه.

  • مثل معلمات التهيئة fastai هذا ممتازة مكتبة دراسة متعمقة ممتازة، ويساعد حقا.

  • كلما أمكن ذلك، علينا أن نحاول استخدام دراسة الهجرة، لأنه حقا مفيدة. مؤخرا، تم تطبيق عمق التعلم ونقل التعلم إلى البيانات المهيكلة، يجب أن تكون الهجرة أول شيء يجب أن تعلم بالتأكيد لمحاولة.

  • أكثر التكنولوجيات المتقدمة مثل الهجين عززت، وزيادة الفترة الزمنية اختبار معدل التعلم مما لا شك فيه تساعدك على تحسين معدل دقة من 1-2 في المئة.

  • دائما بحث مجموعات البيانات المرتبطة سؤالك، قدر المستطاع ووضعها في التدريب الخاص بك مع بيانات التركيز. إذا كان ذلك ممكنا، ونموذج التعلم عمق بعد التدريب نموذج على هذه المعلمات باستخدام حقهم كنموذج أولي من وزنك.

  • أريد الاستمرار لعرضها روابط ذات صلة والمراجع؟

    انقر على [ كيفية تحسين صورة نتائج النموذج تصنيف الخاصة بك؟ ] الوصول إلى:

    https://ai.yanxishe.com/page/TextTranslation/1724

    أوصى الرئيس اليوم: 2017 الربيع CS231n ستانفورد عمق الإدراك

    لي Feifei رئيس الآس الدورات والرؤية الحاسوبية لتعميق المناهج الدراسية، وتطبيق الشبكات العصبية في مجال الرؤية الحاسوبية، ويغطي تصنيف الصور، وتحديد المواقع، واختبار وغيرها من المهام التعرف البصري، وكذلك في تقريرها البحث، فهم الصورة، وتطبيق، ورسم الخرائط، والطب، من دون طيار الطائرات والمركبات الذاتية في مجال التطبيقات المتطورة.

    هذا بالطبع هو خال تماما! للانضمام إلى مجموعة لمشاهدة الآن!

    دورات تصل: الشبكي: //ai.yanxishe.com/page/groupDetail/19

    سحبت رجل بضعة جنيهات عشرة كبير صيد سرطان البحر، وطهي وتناول الطعام على الفور، ويسمح للمستخدمين لممارسة القفز جنون

    الله اختراع! الممرضات إلى التحول إلى الطيور تفعل حفاضات، والدخل الشهري من 30000! الأجانب يأخذون بعيدا البضاعة

    نفى هواوي "نشر نظام التشغيل الغموض 24 يونيو". Microsoft Windows لوقف لهواوي، ونقل بايت يجري الضرب الهاتف الذكي | لى فنغ الصباح

    حول وعاء وضل مكتب في مشهد العرس! القرى شنتشن رومانسية اللعب على السطح لم يكن لشرائه

    النقاط الساخنة في العالم | وقال ترامب أن نتحدث عنه؟ رفضت ايران أن يكون روتين

    نائب رئيس التعبير هواوي، الكشف عن أحدث تصميم هواوي في عدة مناطق 5G شو معرض 2019

    اقترب حراس النووي في بحر الصين الشرقي، سر الشرطة المسلحة 10 عاما كيف "معا حية مع النووي"؟

    البطيخ اختيار صفع شى هاى؟ يعلمك طريقة لضمان Pibozhiduo أيضا حلوة جدا

    ساندرا نغ تشان لمرافقة ابنتها الى السينما تبدو تماما مثل والدتها البالغة من العمر 13 عاما

    الفرح التمارين الرياضية الوطنية

    لمواجهة "يوم السياحة الصينية"، بدأت مقاطعة هوبى السفر السياحي المتحضر هويمين العمل

    تأسست منطقة خليج قوانغدونغ، والمنازعات هونغ كونغ للملكية الفكرية مركز القرار! وقع ممثلو "اقتراح"