الصورة القائمة على "الأكاديمية" تلوين شبكة التفاف العصبية

ملخص

يتم تعيين الملونة صورة هدف لكل لون صورة بكسل الرمادية، وهو موضوع ساخن في مجال معالجة الصور. في U-صافي شبكة الخطوط الرئيسية، مع عمق التعلم الشبكة العصبية التلافيف ومؤتمتة بالكامل تصميم الملونة نموذج الشبكة. في هذا النموذج، والتلافيف فرع الشبكة العصبية SE-التأسيس-ResNet-V2 كما على مستوى عال مستخرج الميزة التي مقتطفات الصورة المعلومات العالمية، في حين تستخدم PoLU وظيفة (الطاقة الكهربائية وحدة الخطي) بدلا من دالة خطية من المعدل (شبكة RELU ). وقد اظهرت النتائج أن هذا النموذج شبكة يمكن الملونة بشكل فعال الملونة صورة رمادية.

ضيق تحسين المنزل: يشير إلى الديكور الداخلي، المناظر الطبيعية هو من وجهة نظر بحيث المساحة الداخلية أكثر جمالا.

تعميم وتحسين المساكن وتشمل: التحول من المساحة الداخلية، والديكور، واليوم نحن نتحدث عن تحسين المساكن وعلى نطاق أوسع لتحسين المنزل هو الديكور الداخلي الشامل والديكور.

شكل الاقتباس الصيني: Xuzhong هوى، Lvwei وسيم تقديم صورة التلافيف العصبية التطبيقات المستندة إلى شبكة التكنولوجيا الالكترونية، 2018،44 (10): 19-22.

الإنجليزية شكل الاقتباس: شو Zhonghui، والوقف Weishuai صورة التلوين على أساس التفاف تطبيق الشبكة العصبية للتقنيات الالكترونية، 2018،44 (10): .. 19-22.

0 مقدمة

الصورة الملونة الزائفة هي صورة رمادية لعملية اللون، ولها قيمة بحثية عالية. وينقسم أوائل طريقة تقديم صورة أساسا إلى فئتين: يستند واحد على التوسع اللون المحلي، ويستند البعض على نقل اللون. السابق يتطلب من المستخدم لتحديد لون من الصورة الكاملة، مطالبة المستخدم على حل المشاكل الأمثل العالمية، وتميز لون الفرشاة كأساس لعدد معين من صورة ملونة على الهدف، ثم التوسع اكتمال التدرج اللوني للصورة بأكملها. مثل هذه الأساليب يمكن الحصول على بعض الصور الملونة جيدة، ولكن يتطلب عملية معقدة وكمية كبيرة من مواد تدخل الإنسان، وألوان مختلفة مع المناطق اللون في فرش مطالبة ملحوظ بشكل واضح في ألوان مختلفة. لذلك في جميع مراحل عملية الطلاء، وعبء العمل الثقيل وتأثير التلوين يعتمد بشكل كبير على المهارات الفنية للمستخدم. التدخل الأخير والقضاء على تأثير العوامل البشرية في عملية تقديم صورة، والسابق هو مختلف، فإن مثل هذا الأسلوب يتطلب صورة ملونة كصورة مرجعية، لنقل معلومات اللون. تطبيق هذه الأساليب للحصول على صورة ملونة مماثلة إلى الصورة المرجعية، وبالتالي تقليل عدد الألوان في هذا النوع من النتائج، ولكن أيضا لإيجاد صورة عينة مناسبة وقتا طويلا. مع تطور واستخدام التعلم العميق، والبيانات مدفوعة عمق الألوان أصبحت طريقة الشبكة العصبية الاتجاه. على سبيل المثال، CHENG Z اصفات أخرى كصورة عمق باستخدام الشبكة العصبية صورة أسلوب الإدخال تقديم باستخدام ميزة استخراج صورة الشبكة العصبية. ايزوكا S بناء على المستوى العالمي مثل استخدام ميزات وخصائص صورة نظرية أحادية اللون الوسطى ترميز تلوين ثم شطري إعادة الانصهار فيها وتوقع المعلومات لون بكسل، وشبكة يجوز مزيد من تصنيف الصور. زانغ R مثل استخدام تجسيد المتعدد الوسائط، وتعطى كل بكسل قيمة احتمال الألوان الممكنة، وأساليب، وبالتالي عدة ألوان مختلفة من الصورة الملونة سوف تظهر.

مستوحاة من عمل ما سبق، فإن عمق الشبكة العصبية أدرجت هنا التأسيس-ResNet-V2 تصميم مؤتمتة بالكامل نموذج الشبكة الملونة، ونموذج سينيت حدة أضاف، سينيت يمكن بوضوح الترابط بين القنوات يتميز بنيت العفن، عن طريق التعلم للحصول تلقائيا على درجة أهمية كل خصائص القناة، ويعزز من فائدة تتميز وفقا لدرجة من الأهمية، وقمع الإسراف أزواج الميزة المهمة الحالية. بداية، ResNet-V2 سينيت جنبا إلى جنب مع مستوى عال كما مستخرج ميزة، في حين تستخدم وظيفة بدلا من الخطية PoLU تصحيح وظيفة وظيفة (مصحح حدة الخطي، ReLU)، وتحسين أداء الشبكة.

1 نموذج وخوارزمية

1.1 النهج النظري

الصيغة، n هو الوزن في الجزء السلبي من وظيفة السيطرة على معدل التغير PoLU. وظيفة PoLU ديها انتاج الصفر غير لإدخال سلبي، مما يزيد ليس فقط على استقرار القدرة على التعلم وممثلة، ولكن يمكن أن يعني وحدة الانتاج هي قريبة من الصفر، مما يقلل من تأثير التحول التحيز. وظيفة نشط سابقا لمختلف، عندما ن > 01:00، وظيفة PoLU في ولاية ذ سلبية = س هناك تقاطع، فإنه يمكن زيادة مساحة استجابة. من أجل تدريب الشبكة، والعثور على المعلمات الأمثل للنموذج، في حين أن نموذج فقدان تكميم باستخدام مربع الخطأ نفسه (MSE) بين القيم التقديرية بكسل اللون والقيم الحقيقية في لون الفضاء، وخسارة من خلال شبكة العودة نشر، لتحديث المعلمات نموذج لتحقيق الأفضل. للحصول على صورة P،

لأنها تمثل مكونات-X التاسع للصورة الهدف وأعيد بناؤها الأول ط قيمة بكسل، الصيغة التالية:

1.2 خوارزمية

هذا النموذج هو * ب * عنصر اللون والصورة التنبؤ، وجنبا إلى جنب مع المكون الإنارة للصورة المدخلة، للحصول على صورة ملونة النهائية. المستخدمة في نموذج SE-التأسيس-ResNet-V2 من الطبقة الأخيرة من الشبكة ويحصل جزءا لا يتجزأ من الصورة على نطاق والرمادي، وبنية الشبكة كما هو موضح في الشكل (2). ويتكون أساسا من ثلاثة أجزاء، وهي وحدة ميزة استخراج، وحدة الانصهار، وحدة إعادة الإعمار. حيث الشبكة الرئيسية U-صافي استخراج "السمات المحلية"، SE-التأسيس-ResNet-V2 استخراج "ميزة الشاملة"، وهما غير التدخل جزء "الميزات العالمية" أن يوجه "السمات المحلية"، على سبيل المثال، صورة المعلم هو في الداخل أو في الهواء الطلق أو الماء أو تحت الماء، في حين أن "ملامح المحلية" قد يعطي الملمس المحليين وبعض التفاصيل؛ ميزة وحدة موتر الانصهار الربط اثنين جزئية وحدة استخراج الميزة لاستخراج، التي تنصهر معا، إعادة بناء صورة وحدة الإدخال والذي تم إعادة بنائه و المكون الإنارة للصورة المدخلة الجمع بين مخرجات صورة ملونة. فيما يلي وصف لهذه المكونات الثلاثة.

1.2.1 ميزة وحدة استخلاص

وحدة استخراج ميزة هو مبين في الشكل 2، U-نت، صورة الرمادي مساهمة

حجم H W، خرج هو H / 8 W / 8 512 يمثل ميزة، والطبقة الأخيرة طبقة معالجة الموتر الإلتواء، وانخفاض 512-256 القنوات قناة الموتر الموتر. التفاف طبقة، والالتواء نواة كلها 3 3، وامتلأ طبقة واقية من حجم المدخلات. للحد من الشبكة الحاسوبية، وذلك باستخدام حجم خطوة من 2 2 طبقة التلافيف في الشبكة، بدلا من طبقة أقصى خلية للحد من حجم الموترة. باستخدام SE-التأسيس-ResNet-V2 مقتطفات صورة مضمنة في شبكة الفروع، وبعض رفيع المستوى يضم مثل باب، مركبة تحت الماء، في الهواء الطلق، يمكن أن تستخدم لنقل المعلومات صورة لعملية اللون. من أجل تلبية صورة متطلبات التأسيس إدخال 299 299 3، وإدخال أول لتحويل حجم الصورة 299 299، وفرضه على الصورة نفسها للحصول على صورة ثلاثية القنوات، ثم الصورة التي تم إنشاؤها مساهمة في الشبكة، وSoftmax استخراج قبل وظيفة الانتاج الطبقة الأخيرة. تم تضمين الحكم إطار التأسيس-ResNet-V2 في إخراج 1001 1 1 ل. الرئيسية حدة استخراج ميزة هي حجم الانتاج النهائي H / 8 W / 8 256 الموترة، سيتم تنصهر هذا الإخراج مع شبكة SE-التأسيس-ResNet-V2 انتاج وحدة الانصهار. معايير محددة هو مبين في الجدول 1.

1.2.2 وحدة الانصهار

الانصهار وحدة هو مبين في الشكل 2، وهما جزئية وحدة استخراج ميزة لاستخراج ميزة أنه يمثل تنصهر معا. استخراج شبكة من ناقلات ميزة SE-التأسيس-ResNet-V2، نسخ HW / 64 مرات، تعلق على استخراج ميزة الفضاء انتاج وحدة U-صافي الرئيسي على طول محور العمق. في تطبيق الشبكة لهذه الطريقة للحصول على سمة شكل الموتر H / 8 W / 8 1257 أ. بواسطة النسخ المتطابق موتر ميزة وخياطة متعددة، وضمان المعلومات ميزة الدلالي تسليمها توزيع موتر بشكل موحد في جميع المنطقة المكانية للصورة. موتر الخصائص أثناء تطبيق 2561 1 حجم التفاف نواة في الشبكة، وتوليد H / 8 W / 8 256 الأبعاد.

1.2.3 وحدة إعادة الإعمار

تتميز موتر بعد وحدة الانصهار، وتدفق وحدة إعادة الإعمار. في وحدة إعادة الإعمار، وطبقة معالجة الإلتواء والجزء العلوي من عينة طبقة ميزة الموترة، لمرور الصورة أعيد بناؤها. الرئيسية حدة استخراج ميزة، فإن الخطوة التطبيق هو 2 2 موتر التفاف طبقة يقلل من حجم العينة على طبقة التطبيق بحيث زاد موتر وحدة إعادة الإعمار العرض والارتفاع. الطبقة الأخيرة هي التفاف وظائف نقل PoLU، تليها طبقة من العينة، كانت الصورة الناتج موتر H W 2، جنبا إلى جنب مع المكون الإنارة للصورة المدخلة لتوليد صورة ملونة النهائية. يستخدم وحدة قاعدة حجم إعادة الإعمار أيضا لحماية حجم التعبئة من الصورة، المعلمات محددة هو مبين في الجدول 2.

النتائج والتحليل

2.1 التجربة

حدد مجموعة البيانات الصحيحة لها تأثير كبير على النتائج التجريبية زيادة، واستخدام صورة ملونة على أساس استخدام تعتمد على البيانات الأسلوب الأكثر على نطاق واسع هو مجموعات البيانات ImageNet. لتعزيز أثر التدريب، وإعادة ضبط حجم الصورة، مساهمة في SE-التأسيس-ResNet-V2 لضبط حجم الصورة 299 299، إدخالها في حجم الصورة ويتم تعديل إلى 224 224 في الرئيسي U-نت. وتسارع استخدام الشبكة NVIDIA CUDA أدوات NVIDIA GTX غيفورسي التدريب، وذلك باستخدام حوالي 120 بيانات الصورة 000 ImageNet تدور أحداثها خلال التدريب، وذلك باستخدام 5 كمجموعة التحقق من صحة البيانات أثناء التدريب.

2.2 تحليل النتائج

نتائج من أجل مقارنة تأثير أساليب مختلفة للتلوين، أزواج مختلفة من FIG 3 (أ) تطبيق الرمادي شخصية صورة نطاق حصلت عليها الأسلوب كما هو مبين في الشكل. FIG 3 (ب) هو صورة ملونة حصلت عليها تطبيق طريقة ريان دال، التي رسمت الجسم ثلجي تظهر لون غير مرغوب فيه صورة - البني. ريان دال طريقة تقديم صورة ليتم التعامل معها على أنها مشكلة الانحدار في عملية التلوين، وهي وظيفة المسافة الإقليدية في الشبكة بوصفها وظيفة الخسارة. على الرغم من أن هذه العملية تبدو مناسبة جدا كمشكلة الوراء، ولكن نهج تصنيف بسبب الطبيعة المستمرة من لون الفضاء، في عملية استخدام المستندة هو أفضل. FIG 3 (ج). يتم تطبيق طريقة Larron لتوليد صورة، ولها تأثير جيد البصرية من طريقة ريان دال، ولكن أيضا جزءا من الجبل ظهر البني، واللون Larron الرسم البياني من خلال لون كل بكسل من التنبؤ موقف المكاني لم تكن المعلومات الحساسة. FIG 3 (د) هو نتيجة لتطبيق طريقة وصفها حصلت هنا، مقارنة مع نتائج طرق ريان دال Larron وأساليب، ونتائج الطريقة المقترحة في استمرارية لون الصورة اللون معقول معقول وتوزيع اللون في المواقع مساحة الصورة جوانب الأداء الجيد. تطبيق الطريقة المقترحة في شبكة دقة الحالية من مهمة تصنيف الصور على أعلى نموذج الشبكة، في حين اضاف سينيت وحدة لتحسين القدرة على تمثيل الشبكة.

طريقة بلون مختلف (أ) تطبيق الصورة على نطاق والرمادي من الطيور FIG 4، أظهرت النتائج في FIG. FIG 4 (ب) هو نتيجة لتطبيق طريقة الحصول ريان دال، يمكننا أن نرى أجزاء كثيرة من العشب لا يتم تلوين جيدا الأخضر، واستمرارية اللون سيئة، واللون الداكن في الطيور. FIG 4 (ج) هو نتيجة لتطبيق طريقة الحصول Larron، وهذا الرقم هو أفضل من FIG البصرية. 4 (ب)، ولكن ليس في الحديقة الخضراء، ويستخدم أسلوب Larron نهج متعدد الوسائط في التجربة، سوف اللون هناك العديد من الاحتمالات، والعشب قد تكون خضراء، ويمكن أن يكون أصفر. FIG 4 (د) هو نتيجة لFIG. طرق الحصول على هذه الوثيقة، بالمقارنة مع FIG 4 (ب) و 4 (ج)، ونتائج الطريقة المقترحة في فضاء اللون وتوزيع اللون الاستمرارية أقرب إلى الصور الحقيقية.

3 الخاتمة

صورة التلوين لديها غرفة كبيرة لتطوير وتطبيق القيمة، وشبكة التفاف العصبية الورقية، تصميم البرنامج بناء على تلوين البيانات صورة بالأبيض والأسود مدفوعة، فإنه لا يمكن أن تكون ملونة صورة بالأبيض والأسود من دون أي تدخل من المستخدم. و* ب * عنصر اللون من القيمة المتوقعة من البرنامج باستخدام تدرج تحويل صورة ملونة كمدخل، وإخراج الصورة على نطاق والرمادي والمقابلة لصورة ملونة. وبعد ذلك بالتزامن مع L * على *، ب * من تدرج الإخراج، يتم الحصول على صورة ملونة على أساس لون الفضاء CIE، وأخيرا تشكيل صورة رمادية من التعيين غير الخطية إلى صورة ملونة. استخدام مجموعة فرعية من ImageNet مجموعة البيانات فقط في التجربة، سوى جزء صغير من موضوع اللون هو التدريب الشبكة، لذلك، في بعض الصور الصغيرة المواضيع ذات الصلة، قد تظهر برامج من هذا المقال أن لا يكون مثاليا، ولكن إذا اخترت شبكة أكبر وأكثر ثراء حول موضوع تدريب مجموعة التدريب البيانات، يمكن أن يكون هذه المشكلة حلا أفضل، وهو الاتجاه القادم من الجهود.

مراجع

 CHIA Y S، تشو S، GUPTA R K، وآخرون al.Semantic التلوين مع المعاملات images.ACM الانترنت على الرسم، 2011،30 (6): 1-8.

 GUPTA R K، CHIA Y S، RAJAN D، وآخرون al.Image التلوين باستخدام المؤتمر الدولي مماثلة images.ACM على الوسائط المتعددة، 2012: 369-378.

 CHENG Z، يانغ Q، colorization.Proceedings SHENG B. ديب المؤتمر الدولي IEEE 2015 على الكمبيوتر الرؤية (ICCV) جمعية الحاسبات .IEEE، 2015: 415-423.

 ايزوكا S، SIMO-SERRA E، ISHIKAWA H.Let يكون هناك لون :! المشتركة نهاية إلى نهاية تعلم مقدمو الاديره الصورة العالمية والمحلية من أجل التلوين التلقائي صورة مع المعاملات classification.ACM متزامنة على الرسومات (TOG)، 2016،35 ( 4): 110.

 زانغ R، ISOLA P، المؤتمر colorization.European صورة EFROS A A.Colorful على الحاسوب Vision.Springer، شام، 2016: 649-666.

 SZEGEDY C، IOFFE S، VANHOUCKE V، وآخرون al.Inception-V4، بداية، resnet وتأثير الاتصالات المتبقية على learning.AAAI، 2017،4: 12.

 HU J، شن L، SUN G.Squeeze-والإثارة صافي works.arXiv ورقة أرخايف: 1709.01507،2017.

 LI Y، دينغ P L K، LI B.Training الشبكات العصبية باستخدام الطاقة الخطي وحدات (بولس) .arXiv ورقة أرخايف: 1802.00212،2018.

 RONNEBERGER O، P FISCHER، BROX T.U نت: شبكات التلافيف لمؤتمر segmentation.International صورة الطبية الحيوية على الصور الطبية الحاسبات وبمساعدة الحاسوب Intervention.Springer، شام، 2015: 234-241.

الكاتب المعلومات:

شو Zhonghui، والوقف وي شواي

(كلية هندسة المعلومات، جامعة جيانغشي للتكنولوجيا، قانتشو، وجيانغشى 341000)

تطارد الدب البني لاحظ من فضلك! بل انه لديه BMW أودي يواجه القلب!

المشاهير الريف البريطانية "من الأرنب بيتر" واحد يأخذك من خلال عمر 50 سوف تذهب إلى مشاهد كبيرة على الولايات المتحدة

جرد التكنولوجيا السوداء القادمة في MWC 2019

Zotye التسعير السمسم في جميع المجالات التي تتمثل في التخلص من البطيخ؟

نسق أسعار سائق السيارة التقليدية، والاستماع إلى الحديث الجناح فاي رحلة استكشاف بيكي

الأزياء! وانغ كاي ما تيانيو وانغ البر الرئيسى وسيم الزبيب تفسير أخت الطاغية صيغة الرئيس ندف

"الأكاديمية" البحوث على أساس الإصبع الوريد شبكة الاعتراف كبسولة

100000 يوان لشراء MPV، كل شيء في القلب، والذي كان الصف الرابع النماذج بشكل صحيح أكملت

تعليق HTC اعتبارا من اليوم، وجوجل الأعمال الهاتف المحمول أو العبودية. فرشاة مجرد بداية لدفع الوجه، وجاءت المدفوعات فرشاة الوريد، بل كان الجوع التجزئة غير المراقب واردة، يدعى "ه نقطة الراحة" | لى فنغ

الأجهزة التي "بوين اختيار" الحاجة إلى استخدام تقنية بلوتوث لتحديد المواقع؟

هذه لديها جهاز تلفزيون في المنزل لمشاهدة تارتار بارد كبير

ضرب حقبة كبيرة - الجديد اختبار قيادة السيارة مواطنين الله هارفارد H6