ما هو برنامج التشفير التلقائي؟ يعلمك كيفية استخدام التشفير التلقائي لتحسين صورة ضبابية

المؤلف: PRATEEK JOSHI

ترجمة: تشنغ تشاو

التدقيق اللغوي: فنغ يو

هذا المقال عن 2200 كلمة ، اقترح القراءة 9 دقائق

تقدم هذه المقالة أولاً برنامج التشفير التلقائي بناءً على الشبكة العصبية ، ثم يقدم كيفية استخدام برنامج التشفير التلقائي لتحسين الصورة المشوشة.

التسمية: رؤية الكمبيوتر

نظرة عامة

  • ما هو برنامج التشفير التلقائي؟ كيف يعمل برنامج الترميز التلقائي؟ ستجيب هذه المقالة على هذه الأسئلة.
  • سنناقش مفهوم أجهزة الترميز التلقائي من خلال حالة كيفية زيادة دقة الصور المموهة.

المقدمة

هل تتذكر عصر كاميرات السينما؟ إن معالجة الصور عملية غامضة ، ولن يتمكن سوى المصورون والمهنيون من التعامل معها بسهولة. معظم الناس لديهم غرفة مظلمة مليئة بالضوء الأحمر الخافت. باختصار ، تطوير الصور عملية تستغرق وقتًا طويلاً.

في وقت لاحق ، بدأت ثورة الكاميرا الرقمية ، وذهب الماضي! لا نريد حتى طباعة الصور بعد الآن - يتم تخزين معظم صور الأشخاص على هاتف ذكي أو كمبيوتر محمول أو سحابة.

غرفة مظلمة

حتى الآن ، سنواجه (عند النقر بالماوس) صورًا ضبابية ومقطعة وغير واضحة. أنا مذنب بشدة بهذا ، والعديد من الناس يحاولون تقديم الصورة المثالية. هذا هو المكان الذي يأتي فيه التعلم العميق وأجهزة الترميز التلقائي.

فيما يلي عرض لما هو برنامج التشفير التلقائي وكيف يعمل. بعد ذلك ، سنقدم حالة عملية تستند إلى المشفر التلقائي في Python لتحسين دقة الصورة.

الشروط: مألوفة مع Keras ، تصنيف الصور على أساس الشبكات العصبية والطبقات التلافيفية. إذا كنت بحاجة إلى مراجعة هذه المفاهيم ، يمكنك الرجوع إلى ما يلي:

  • مقدمة في الشبكات العصبية (دورة مجانية) https://courses.analyticsvidhya.com/courses/Introduction-to-Neural-Networks؟utm_source=blog&utm_medium=what-is-autoencoder-enhance-image-resolution
  • قم ببناء نموذج تصنيف الصور الأول الخاص بك https://www.analyticsvidhya.com/blog/2019/01/build-image-classification-model-10-minutes/؟utm_source=blog&utm_medium=what-is-autoencoder-enhance- دقة الصورة

جدول المحتويات

1. ما هو برنامج التشفير التلقائي؟

ثانيًا ، عن الصورة التي تنكر التشفير التلقائي

ثالثًا ، يستخدم المشفر التلقائي لوصف المشكلة لتحسين دقة الصورة

رابعًا ، استخدم Python لتنفيذ التشفير التلقائي

1. ما هو برنامج التشفير التلقائي؟

أعطى بولكيت شارما التعريف التالي في المقالة:

"أجهزة الترميز التلقائي هي في الأساس هياكل شبكة عصبية تتعلم تمثيلات ميزة الأبعاد المنخفضة لبيانات الإدخال."

يتكون المشفر التلقائي من شبكتين متصلتين: التشفير وفك التشفير. الغرض من برنامج التشفير هو إدخال إدخال (x) وإنشاء خريطة ميزات (z):

عادة ما يكون حجم أو طول خريطة المعالم (z) أقل من x. لماذا هو كذلك؟

نظرًا لأننا نريد z فقط لالتقاط عامل تغيير ذي معنى يمكن أن يصف بيانات الإدخال ، فإن شكل z يكون عادةً أصغر من x.

الآن ، السؤال هو كيف نحصل على تمثيل الميزة (ض)؟ كيف ندرب هذا النموذج؟ لهذا ، يمكننا إضافة شبكة وحدة فك ترميز أعلى الميزات المستخرجة ، ثم تدريب النموذج:

ثانيًا ، عن الصورة التي تنكر التشفير التلقائي

تتعلق المشكلة التي سنقوم بحلها في هذه المقالة بوظيفة الصورة التي تزيل التشفير التلقائي. فيما يلي نقدم بالتفصيل كيفية استخدام برنامج التشفير التلقائي لإزالة الضوضاء في الصورة.

لنفترض أن لدينا مجموعة من الصور الرقمية المكتوبة بخط اليد ، وبعضها تالف. فيما يلي بعض الصور التي تحتوي على ضوضاء (تلف):

تسمى إزالة هذا الضجيج من الصورة مشكلة إلغاء الصورة. الإخراج المطلوب هو صورة نظيفة مع إزالة معظم الضوضاء ، كما هو موضح أدناه:

ولكن كيف يزيل التشفير التلقائي هذا التشويش من الصورة؟

كما رأينا بالفعل في القسم السابق ، يحاول برنامج التشفير التلقائي إعادة بناء بيانات الإدخال. لذلك ، إذا أخذنا الصورة التالفة كمدخلات ، سيحاول برنامج الترميز التلقائي إعادة إنشاء الصورة الصاخبة.

اذا ماذا يجب ان نفعل؟ تغيير الهيكل؟ الجواب سلبي!

ما هو مطلوب هنا هو تعديل صغير. يمكننا حساب الخسارة باستخدام الصورة الأصلية والصورة المعاد بناؤها بدلاً من استخدام المدخلات والمخرجات المعاد بناؤها لحساب الخسارة. يوضح الرسم البياني التالي وجهة نظري:

صورة تزيل التشفير التلقائي

الآن بعد أن أصبحنا على دراية بوظائف برنامج ترميز الصوت التلقائي ، فلنعد إلى المشاكل التي نتوقع حلها باستخدام برنامج الترميز التلقائي.

ثالثًا ، يستخدم المشفر التلقائي لوصف المشكلة لتحسين دقة الصورة

أعتقد أنك ستكون على دراية بهذه المشكلة. يشعر معظمنا بالاكتئاب الشديد عندما نواجه صورًا ضبابية ، ونأمل أن تكون الصور أكثر وضوحًا. أدناه سنستخدم التشفير التلقائي لحل هذه المشكلة!

لنفترض أن لدينا مجموعة من صور الوجه منخفضة الدقة. مهمتنا هي زيادة دقة هذه الصور. يمكن القيام بذلك بمساعدة أدوات تحرير الصور مثل Photoshop. ومع ذلك ، عندما تكون هناك آلاف الصور في متناول اليد ، نحتاج إلى طريقة أكثر ذكاءً لأداء هذه المهمة.

فيما يلي بعض عينات الصور وصورها الأصلية:

رابعًا ، استخدم Python لتنفيذ التشفير التلقائي

دعونا نفتح دفتر ملاحظات Juyter الخاص بنا ونستورد المكتبة المطلوبة:

  • تنزيل مجموعة البيانات

يعتمد بحثنا على مجموعة بيانات "الوجوه المصنفة في البرية" الشائعة. وهي مصممة لدراسة مشاكل التعرف على الوجه غير المقيدة. ومع ذلك ، فإن هدفنا هنا ليس التعرف على الوجوه ، ولكن بناء نموذج لتحسين دقة الصورة.

لنقم بتنزيل واستخراج مجموعة البيانات:

# تنزيل مجموعة البيانات! wget استخراج مجموعة البيانات! tar -xvzf lfw.tgz

سيتم استخراج مجموعة البيانات هذه في مجلدات متعددة. لذلك ، فإن مسار الملف لالتقاط جميع الصور مهم للغاية. يمكننا القيام بذلك بسهولة بمساعدة مكتبة glob.

#capture المسارات إلى imagesface_images = glob.glob ('lfw / ** / *. jpg')
  • تحميل ومعالجة الصور

الحجم الأصلي للصورة هو 250 250 بكسل. ومع ذلك ، تتطلب معالجة هذه الصور على نظام مكون بشكل عام موارد حوسبة كبيرة. لذلك ، نحتاج إلى اقتصاص حجم جميع الصور.

  • إعداد بيانات التدريب النموذجي

بعد ذلك ، نقسم مجموعة البيانات (الصورة) إلى مجموعتين - التدريب والتحقق من الصحة. سنستخدم مجموعة التدريب لتدريب نموذجنا ومجموعة التحقق لتقييم أداء النموذج:

دعنا نلقي نظرة على الصور في مجموعة البيانات:

تشبه فكرة هذه الحالة إلى حد كبير المبرمج التلقائي المخفف.

سنقوم ببعض التعديلات على الصورة المدخلة ونستخدم الصورة الأصلية لحساب الخسارة. كمهمة لزيادة الدقة ، نقوم بتقليل دقة الصورة الأصلية وإدخالها في النموذج.

فيما يلي صورة المدخلات المعالجة:

سنستخدم الوظيفة التالية لتقليل دقة جميع الصور وإنشاء مجموعة منفصلة من الصور منخفضة الدقة.

  • تحضير صورة الإدخال

قلل دقة جميع الصور ، بما في ذلك مجموعة التدريب ومجموعة التحقق.

  • إنشاء النموذج

يتم تعريف هيكل النموذج على النحو التالي:

يمكن تعديل الهيكل حسب الحاجة. يمكنك تغيير عدد الطبقات وتغيير نوع الطبقات واستخدام التسوية والعديد من المعلمات الأخرى. الآن نواصل استخدام هذا الهيكل.

يعتبر تصور هيكل النموذج مفيدًا لتصحيح الأخطاء (في حالة حدوث أخطاء). من السهل تنفيذها في Keras ، فقط نفذ < اسم النموذج > يمكن للدالة .summary ():

ملخص تلقائي ()

يمكننا أخيرا تدريب نموذجنا:

  • التوقعات (صورة محسنة)
التنبؤات = autoencoder.predict (val_x_px)

بوستسكريبت

يشرح هذا البرنامج التعليمي برنامج التشفير التلقائي. استنادًا إلى فكرة إزاحة الصورة ، قمنا بتحسين دقة الصورة. يمكننا تمديده إلى أماكن أخرى كثيرة.

على سبيل المثال ، يمكننا أيضًا استخدام هذه التقنية لتحسين جودة الفيديو منخفض الدقة. لذلك ، حتى إذا لم يتم تصنيف الصورة ، يمكننا معالجة بيانات الصورة وحل بعض المشاكل العملية. إذا كانت لديك حالات أو تقنيات أخرى لمعالجة الصور تعتمد على التعلم غير الخاضع للرقابة ، فالرجاء مشاركته في قسم التعليقات أدناه.

العنوان الأصلي:

تعرف على كيفية تحسين صورة غير واضحة باستخدام برنامج ترميز تلقائي!

الرابط الأصلي:

https://www.analyticsvidhya.com/blog/2020/02/what-is-autoencoder-enhance-image-resolution/

المحرر: هوانغ جيان

التدقيق اللغوي: لين Yilin

مقدمة المترجم

تشنغ تشاو ، بنك البيانات الصيني ، مركز البيانات الكبيرة ، ماجستير في جامعة جنوب شرق. العمل المتضمن معقد ، من تطوير DSP ، تطوير QT ، إلى استخراج البيانات ، منتجات البيانات ، وأعمال أمن البيانات الحالية. التمركز هو أن يصبح عالِمًا كاملاً في مجال علم البيانات. خارج العمل ، آمل أن أتمكن من استكمال المعرفة والأفكار الحديثة لعلوم البيانات ، وتبادل التعلم معك.

-إنهاء-

اتبع منصة WeChat العامة التابعة لمعهد Tsinghua-Qingdao Data Science Research الرسمي "  فطيرة بيانات AI  "ورقم الأخت" فطيرة البيانات  "احصل على المزيد من فوائد المحاضرات وجودة المحتوى.

فائقة المعمرين الخلايا الجسدية التيلوميرات استعادة كطفل رضيع! خلايا الإناث عمرها 114 عاما تعود إلى الخلايا الجذعية 0 سنة

كيفية اللعب بشكل جيد لمباراة لكرة القدم علميا!

PCA باستخدام K-وسائل والجينوم تحليل تسلسل COVID 19 ثم كيف الطفرات؟

يعلمك ppt من 46 صفحة كيفية دمج محرك القاعدة وتعلم الآلة!

إيطاليا شقيق طباعة صغيرة للمساعدة في 3D! وفي مواجهة خطر الملاحقة القضائية، والأصدقاء: الطبعة الإيطالية من "الطب الله"؟

تحت موجة جديدة من البنية التحتية، لنرى كيف عملاق التكنولوجيا للاستيلاء على المبادرة!

سوف أصدقاء يعود قريبا! القصة الكلاسيكية: الأصدقاء في النهاية أن أقول كم مرة يا إلهي؟

كيفية إنشاء مجموعة اختبار لتقدير مؤشرات الأعمال دون اتصال؟ (مع رمز ورابط)

مائة جهة Yunchuang المالية في جامعة تسينغهوا ناحية أصدرت تقريرا بحثيا، "اقتصاد الصين في وباء"

تسجيل وفقا للفصل الذاتي مابري الابهام الشمس

سوف CBA استضافة الحجر الصحي البريطاني بأنه "السجن"، وفريق شنغهاي: وقف التعاون!

أنت تقول شيئا وتفعل شيئا آخر! الساسة البريطانيين والأمريكيين هذه قبيحة، ألمانيا، إيطاليا، وحتى لا يمكن أن تصمد