"الأكاديمية" التعلم التعرف على الكتابة اليدوية والتطبيقات الرقمية عمق TensorFlow مقرها

خلاصة القول:

الاعتراف أرقام مكتوبة بخط اليد هو جزء مهم من نظام التعرف على الذكاء الاصطناعي. بسبب الاختلافات في الأرقام المكتوبة بخط اليد الفردية، وهي دقة أقل من أنظمة التعرف التقليدية. استكمال تحديد وتطبيق الأرقام المكتوبة بخط اليد على أساس TensorFlow تعلم عمق الإطار، أولا إنشاء TensorFlow تعلم عمق الإطار، ويحلل Softmax، هيكل نموذج تلفيفي العصبية شبكة (CNN)، ثم 000 عينات من خط اليد مجموعة البيانات MNIST 60 دراسة متعمقة، ثم اختبار عينات المقارنة من 10000، وأخيرا نموذج الأمثل زرع لتطبيقات منصة أندرويد. قياس التحقق من المعلومات، فيما يتعلق النموذج التقليدي Softmax، وتعلم عمق نموذج CNN استنادا TensorFlow معدل الاعتراف تصل إلى 99.17، وتحسنت بنسبة 7.6، وتوفير بعض القيمة العلمية لتطوير الاصطناعي نظام التعرف على الذكاء.

شكل الاقتباس الصيني: هوانغ روي، شو مينغ لو يي لين وو تعلم رقم الهوية والتكنولوجيا الالكترونية بخط TensorFlow عمق مقرها، 2018،44 (10): 6-10.

الإنجليزية شكل الاقتباس: هوانغ روي، لو شو مينغ، وو يي لين التعرف على الكتابة اليدوية الرقمية وتطبيقا مبنيا على TensorFlow تطبيق التعلم العميق للتقنيات الالكترونية، 2018،44 (10): .. 6-10.

0 مقدمة

مع تطور العلم والتكنولوجيا، وقد الاصطناعية تقنية التعرف الاستخبارات تستخدم على نطاق واسع في مختلف المجالات، ولكن أيضا لتعزيز تطبيق الكمبيوتر نحو تطوير ذكاء. من ناحية، ونموذج الذكاء الاصطناعي للتعلم العميق، والشبكات العصبية، الممثلة فاز باهتمام واسع في الداخل والعلماء في الخارج، ومن ناحية أخرى، الذكاء الاصطناعي، وآلة أنظمة التعلم مفتوحة المصدر، تقنية مفتوحة لبناء منصة لتطوير بحوث الذكاء الاصطناعي. واستنادا TensorFlow عمق إطار التعلم، لبناء Softmax، نموذج CNN والكامل الاعتراف أرقام مكتوبة بخط اليد.

وضع LECUN Y الأمام متعدد الطبقات العصبية شبكة نوع واحد LeNet 5 لتحديد الأرقام المكتوبة بخط اليد 0-9، والتعلم نموذج الدراسة عن طريق الإكثار الخلفي (خلف دعوة وBP) الخوارزمية، أولا تأسيس نموذج تطبيق CNN. مع ظهور الذكاء الاصطناعي، والتعرف على الصور، CNN أصبح موضوعا ساخنا في السنوات الأخيرة، وتستخدم أساسا في تصنيف الصور، والكشف عن الهدف، وتتبع الهدف، التعرف على النص، وما إلى ذلك، التي AlexNet، GoogleNet ResNet الخوارزميات وحققت نجاحا كبيرا.

التي تعتمد على منصة مفتوحة المصدر المخابرات الجيل الثاني من جوجل اصطناعية TensorFlow، جنبا إلى جنب مع إطار التعلم العميق، Softmax نماذج الانحدار للمقارنة الخوارزميات والتحقق CNN، وتدريب أخيرا نموذج كانت التطبيقات التي تعتمد على منصة أندرويد.

1 TensorFlow مقدمة

9 نوفمبر 2015، أصدرت جوجل الجيل الثاني من الذكاء الاصطناعي والمفتوحة المصدر نظام التعلم TensorFlow. وهو يمثل موتر التنسور (البعد من N من تكوين)، وتدفق (تدفق) يظهر عملية حسابية استنادا إلى بيانات تدفق الرسم البياني، وأعرب عن TensorFlow موتر كتدفق واحدة من نهاية للمخطط تدفق حساب الطرف الآخر. شبكة دعم TensorFlow الذاكرة على المدى القصير (شورت شبكات الذاكرة طويلة المدى، LSTMN)، الشبكة العصبية المتكررة (الشبكات العصبية المتكررة، RNN) وشبكة التفاف العصبية (CNN) وغيرها من عميق نموذج الشبكة العصبية. TensorFlow الأساسية هيكل هو مبين في الشكل.

كما هو واضح من الشكل 1، TensorFlow الهندسة المعمارية الأساسية يمكن تقسيمها إلى الأمام وينتهي الخلفية. الجبهة: دعم وبناء متعدد اللغات بيئة البرمجة، API للوصول للجهة الخلفية نموذج البرمجة عن طريق استدعاء النظام. الخلفي: بيئة التشغيل التي توفرها بيئة التشغيل الموزعة، وطبقة الشبكة النواة وطبقة الجهاز.

عودة 2 Softmax

لوجستية الانحدار Softmax الانحدار خوارزمية قادرة على التوسع ثنائي تصل إلى تصنيف. يفترض نموذج الانحدار عينة من الطبقات K، أي ما مجموعه م، ومجموعة التدريب يمكن أن يمثله الصيغة (1):

حيث، س (ط) R (ن + 1)، ص (ط) {1،2، ...، K}، ن + 1 من البعد ناقلات ميزة العاشر. لقيمة مدخلات معينة من يقدر K احتمال س، ويمثل الناتج من صيغة (2):

المعلمات 1، 2، ...، k أداء أصل التدرج، لإعطاء Softmax نموذج الانحدار، الذي نفذ في TensorFlow 2 هو مبين في الشكل.

FIG 2 هو تمثيل المصفوفة، الصيغة (5):

يتم استبدال مجموعة بيانات الاختبار في الصيغة (5)، واحتساب احتمال الفئة، فئة لديها أعلى احتمال هو نتيجة المتوقعة.

3 CNN

الشبكة العصبية التلافيف (CNN) هو عبارة عن شبكة ال feedforward، البيانات وهي عادة ما تتكون طبقة المدخلات، وطبقة التفاف حساب، وطبقة الإثارة RELU، طبقة المجمعة، طبقة متصلة بشكل كامل، وما إلى ذلك، من خلال عملية التفاف بدلا من الضرب مصفوفة التقليدي الشبكة العصبية. CNN يشيع استخدامها في معالجة البيانات من صورة، التقليدية LenNet 5 نموذج الشبكة العصبية هو مبين في الشكل (3).

يتكون هذا النموذج من طبقتين الإلتواء، وعينات من طبقتين (طبقة الخلايا)، وثلاث طبقات مرتبطة ارتباطا كاملا.

طبقة 3.1 الإلتواء

يتم تنفيذ التفاف من قبل طبقة التفاف النواة هي طبقة من الانضباطي حيث التفاف FIG انزلاق، زائد تعويض لإعطاء الناتج الصافي، ومن ثم استدعاء نتيجة التفاف وظيفة تفعيل حصلت عليها كلها FIG انزلاق الناتج التفاف الرسم البياني المميزة للجديدة، صيغة (6) إلى (7):

3.2 طبقة أخذ العينات

يتميز FIG عينة طبقة بتقسيم نافذة مساهمة في عدد وافر من ن ن لا تداخل، ثم يتم احتساب قيمة الحد الأقصى أو القيمة المتوسطة لكل منطقة، وخفض صورة ن مرات، وأخيرا بإضافة مبلغ تعويض وظيفة تفعيل الحصول على بيانات العينة. حيث طريقة قيمة الحد الأقصى، متوسط الأسلوب والإخراج وظائف مثل صيغة (8) إلى (10):

3.3 طبقة الانتاج مرتبطة ارتباطا كاملا

طبقة متصل تماما لتصنيف الصورة الأصلية قبل استخراج المعلمة الميزة. تصنيف المشترك لصيغة (11):

4 تحليل تجريبي

وبناء إطار TensorFlow عمق التعلم، ومصدر البيانات مجموعات البيانات MNIST، على التوالي، وCNN عمق Softmax الانحدار خوارزمية لتدريب التعلم نموذج، وتدريب والتحقق من صحة النموذج ومقارنة، وتطبيقها على الروبوت.

مجموعة البيانات 4.1 MNIST

ويضم مجموعة البيانات MNIST مجموعة بيانات التدريب 60000 صفوف (صور تدريب idx3) و 10،000 صفوف مجموعات بيانات الاختبار (اختبار الصور-idx3). كل عينة له تسمية فريدة المقابلة (التسمية)، ووصف عينات رقمية، كل صورة تحتوي على 28 28 بكسل النقاط، كما هو مبين في الشكل.

4 يبين الشكل أن كل صورة عينة من 28 28 بكسل النقاط، قد يكون ناقلا للطول 784 من FIG. يمكن تحويله MNIST مجموعة بيانات التدريب إلى الموترة، حيث يتم استخدام البعد الأول لتمثيل البيانات صورة الفهرس، والبعد الثاني من البيانات التي تمثل كل بكسل الصورة. وبما يتطابق مع العلامة العينة (التسمية) هو رقم 0-9، من خلال ترميز الساخن (ترميز الساخنة واحد) تكون ممثلة. بالإضافة إلى المشفرة الساخن هو الآخر من الرقم 1، وأبعاد المتبقية هي الأرقام من 0، 0 يتم تمثيل هذه العلامات، بحيث العينة وصفت الموترة.

4.2 تنفيذ نموذج Softmax

(5) الصيغة، قد تتحلل Softmax نموذج في مصفوفة من العمليات الأساسية ودعوة Softmax، تنفيذ النموذج على النحو التالي: (1) استخدام المتغيرات رمزية لإنشاء وحدة التشغيل قد تتفاعل، (2) خلق قيمة الترجيح وكمية الجزئي، (3 ) وفقا للمعادلة (5)، لتحقيق Softmax الانحدار.

4.3 تنفيذ نموذج CNN

LenNet 5 ملزمة نموذج الشبكة العصبية، حققت تعلم عمق TensorFlow أساس نموذج على النحو التالي:

(1) الوزن والتحيز التهيئة.

(2) إنشاء مجموعة من الالتواء والقوالب.

(3) convolving، المجمعة مرتين.

(4) كامل متصلا الإخراج؛

(5) Softmax العودة.

4.4 مؤشر تقييم

وظيفة التكلفة باستخدام التقليدية "عبر الكون" (عبر الكون)، كما هو مبين في المعادلة (12):

4.5 نموذج فحص

طريقة التنبؤات الاختبار على النحو التالي:

(1) نموذج تدريب على حفظ.

(2) عينات الاختبار التسمية التنبؤ المدخلات؛

(3) وظيفة للحصول على دعوة توقع tf.argmax قيمة العلامة.

(4) قيمة علامة لمباراة يحسب الفعلي، ومعدل الاعتراف النهائي.

وفقا للخطوات المذكورة أعلاه، على التوالي Softmax تلفيفي العصبية نموذج الشبكة ورقم الهوية، وأرقام معدل الاعتراف 0-9 في الشكل 5، كما هو مبين في الجدول رقم 1.

ويتنبأ النموذج النتائج يتضح من الجدول 1، نموذج رقمي للSoftmax معدل الاعتراف 97.9، وهو أعلى معدل الاعتراف. 3 و 8 الرقمي معدل الاعتراف عدد صغير نسبيا، هو 84.9، 87.7 على التوالي. Softmax نموذج معدل الاعتراف العام من الأرقام المكتوبة بخط اليد 0-991.57.

بالتزامن مع التين. (5) والجدول رقم 1، نموذج معدل الاعتراف الكلي في نموذج Softmax CNN، حيث تم تحسين معدل الاعتراف عدد بنسبة 14.7 3، وعدد من تحسين معدل الاعتراف هو فقط 1.7. نموذج CNN استنادا إلى دراسة متعمقة بشأن الاعتراف العام من الأرقام المكتوبة بخط اليد 0-9، بزيادة 99.17 في المئة، مقارنة نموذج Softmax زيادة إجمالية قدرها 7.6.

4.6 تطبيق نموذج

شهدت بمقارنة التحقق من صحة النموذج، ومعدل الاعتراف نموذج من Softmax دراسة متعمقة من CNN. نموذج تدريب استدار الآن إلى منصة أندرويد، وتطبيق عبر منصة، يتبع التنفيذ.

(1) UI التصميم

بخط اليد شاشة تعمل باللمس مسارات المستخدم مع جهاز تحكم عن نقطية، وعنصري تحكم زر على التوالي، لتحديد وشاشة يخلي الرقمية.

(2) المراجع TensorFlow

جمعت لأول مرة TensorFlow حاجة لاستدعاء حزمة جرة وحتى الملفات. ثانيا، نموذج تدريب (.pb) في مشروع الروبوت.

(3) واجهة

تعريف واجهة والتهيئة:

inferenceInterface.initializeTensorFlow (getAssets، MODEL_FILE)؛

اجهة المكالمة:

inferenceInterface.fillNodeFloat (INPUT_NODE، كثافة العمليات الجديد {1، الطول، العرض، CHANNEL}، والمدخلات)؛

الحصول على التنبؤات

inferenceInterface.readNodeFloat (OUTPUT_NODE والمخرجات)؛

من خلال الخطوات السابقة لإكمال منصة أندرويد، وبناء على البيئة، أولا تعمل باللمس وظيفة التقاط الشاشة والروبوت سجل بخط المسار، ويتم الانتهاء من التعرف على الكتابة اليدوية، انقر فوق زر، ونظام استدعاء تحديد نموذج، وإخراج نتيجة الاعتراف للمستخدم واجهة. بعد الانتهاء من تحديد الهوية، انقر فوق مسح الإجراء أعلاه دوري يمكن التعرف من جديد الأرقام المكتوبة بخط اليد، وأثر من أرقام التعريف جزء بخط اليد كما هو مبين في الشكل.

6 من، على عمق TensorFlow الرقمية القائمة على الاعتراف منصة أندرويد الكتابة اليدوية التعلم الكامل، واستخدام نموذج التدريب CNN لديه نتائج التعرف على أفضل، لتحقيق نموذج التدريب عبر منصة تطبيقات TensorFlow.

5. الخاتمة

وبناء TensorFlow تعلم عمق الإطار، وعودة Softmax وCNN الخوارزميات التدريب الرقمي مكتوبة بخط اليد ونموذج استدار إلى تطبيقات منصة أندرويد، عبر منصة. وتشير البيانات التجريبية التي، على أساس سعر الاعتراف 91.57 Softmax نموذج الانحدار، استنادا إلى معدل الاعتراف تصل إلى 99.17 نموذج CNN. عرض استنادا إلى دراسة متعمقة الاعتراف الأرقام مكتوبة بخط اليد لديها بعض القيمة المرجعية في الاعتراف الذكاء الاصطناعي.

مراجع

 HUBEL D H، T يزل N.Receptive الحقول والهندسة المعمارية الوظيفية للقرد مخططة cortex.Journal علم وظائف الأعضاء، 1968،195 (1): 215-243.

 تطبيق التعلم LECUN Y، BOTTOU L، BENGIO Y، وآخرون استنادا al.Gradient لrecognition.Proceedings ثيقة من وثائق IEEE، 1998،86 (11): 2278-2324.

 زيلر M D، FERGUS R.Visualizing والتفاهم networks.arXiv تلفيفي: 1311،2901.

 HE كانغ جيان، الجمعياتي الذاكرة، Nieren يمكن، مثل طريقة الكشف عن الهدف على أساس صورة ملونة من الالكترونيات السيطرة المحلية على التكنولوجيا النووية، 2016،42 (12): 89-92.

 LI H، LI Y، PORIKLI F.DeepTrack: تعلم التمثيل ميزة التمييزية على الانترنت لقوة المعاملات tracking.IEEE البصرية على معالجة الصور، 2015،25 (4): 1834-1848.

 غودفلوو I J، بولاتوف Y، يبارز J، وآخرون al.Multi أرقام عدد اعتراف من رأي الشارع الصور باستخدام عمق تلفيفي العصبية networks.arXiv: 1312،6082.

 KRIZHEVSKY A، SUTSKEVER I، HINTON G E.ImageNet classifycation مع المؤتمر العصبي التلافيف العميق networks.International الإعلام العصبية معالجة Systems.Curran شركاه المحدودة، 2012: 1097-1105.

 SZEGEDY C، LIU W، Y جيا، وآخرون al.Going أعمق مع المؤتمر convoluteons.IEEE على رؤية الحاسوب ونمط Recognition.IEEE، 2015: 1-9.

 HE K، زانغ X، REN S، وآخرون al.Deep التعلم المتبقية لصورة recognition.arXiv: +1512.03385.

 عيادي M، AGARWAL A برهم P، وآخرون al.TensorFlow: تعلم الآلة على نطاق واسع على غير متجانسة توزيع systems.arXiv: +1603.04467.

الكاتب المعلومات:

هوانغ روي، شو مينغ لو يي لين وو

(قسم علوم الحاسب الآلي، معهد قوانغدونغ التربية والتعليم، وقوانغتشو 510303)

أربعة نماذج MPV من حيث التكلفة عشرة آلاف مقعد

بطاقات زوال

العالمي الحصري "لعبة شجاعة"، دواين جونسون والسدم أول قبلة، لرؤية غرزة ابتسامة!

المبيعات الشهرية لأكثر من 10000، 80000 SUV أن العديد لا ينبغي تفويتها في غير موسمها

الهاتف مساء: MWC جديد + 5G أبل APP الكمال أدوات الترحيل يمكن التنبؤ بها

"النقاط الساخنة صناعة" نمو صناعة معدل النمو 2018 تصميم IC المحلي لأكثر من 30

رجل يبلغ من العمر 30 عاما ماذا تختار SUV لن تخسر أي نقطة؟ قادر على الطرق الوعرة؟ يمكنك مسافات طويلة؟ يمكنك النوم؟

وهو 2018 معظم الشرير المتوقع

TSMC 100000 رقائق ألغت بسبب تأثير الالكترونيات العالمية سلسلة التوريد

قوييانغ مقاطعة حدود القرية: عيد تشينغ مينغ نصب تذكاري مذكرا العدو الحضارة الصف الحضارة

"أعجوبة الرجل العنكبوت" مجانا PS4 موضوع جديد: حسن الجوار الشرير

الرئيس يعين على السيارات الفاخرة في السوق المحلي للمرة الأولى ما إذا كان الناس سيشترون ذلك؟