بايدو مفتوح المصدر المحمول محطة لمعرفة عمق الإطار المتحرك التعلم العميق (MDL)

الكاتب | لي جناح الإرادة

تحرير | ناتالي

25 سبتمبر 2017، بايدو مفتوح المصدر المحمول على جيثب نهاية عمق إطار التعلم (MDL) المحمول التعلم العميق لكافة التعليمات البرمجية والكتابة، على أمل مشروع لتطوير أفضل، مدفوعا من قبل المجتمع.

التحرير

تكنولوجيا التعلم عميقة له تأثير في اتجاهات عديدة لشبكة الإنترنت، أكثر وأكثر كل يوم العلوم والتكنولوجيا الأخبار في عمق النقاش حول التعلم والشبكات العصبية. تكنولوجيا التعلم عميقة يتطور بسرعة في العامين الماضيين، ومجموعة متنوعة من منتجات الإنترنت تحاول استخدام تكنولوجيا التعلم العميق والمنتجات في عمق التعلم سوف تزيد تؤثر على حياة الناس. مع انتشار استخدام الأجهزة النقالة، ومنتجات الإنترنت عبر الهاتف النقال والتطبيقات عمق أصبحت تعلم تقنية الشبكات العصبية اتجاها حتميا.

التعلم معا بشكل وثيق مع التكنولوجيا عمق التصوير كما انها تستخدم على نطاق واسع في الصناعة. الجمع بين التقليدية الدراسة رؤية الكمبيوتر وعمق الصورة من التكنولوجيا تتطور بسرعة.

جيثب العنوان:

https://github.com/baidu/mobile-deep-learning

التطبيقات النقالة في نهاية دراسة متعمقة

بايدو التطبيقات

تطبيق تكنولوجيا التعلم عميقة في محطة متنقلة غير نموذجية CNN (التلافيف الشبكات العصبية) والتكنولوجيا، وهذا هو، الناس غالبا ما يذكر التفاف الشبكة العصبية. المحمول التعلم العميق (MDL) هو التلافيف تنفيذ القائم على الشبكة العصبية إطار نهاية المحمول.

MDL نهاية المحمول ما هي السيناريو الرئيسي ذلك؟ ما هو أكثر شيوعا للتمييز الأشياء مثل الصورة التي هي تصنيف ، أو تحديد الكائنات في صورة أين وكيف، أي تحديد موضوع .

دعا التطبيق التالية البيك اب المرحلة، يمكن العثور عليها في تطبيق كنز منصة أندرويد. ما في وسعها تلقائيا للمستخدم لصورة سرية، للمستخدمين مع الكثير من الصور للعرض، هذه الميزة هي جذابة جدا.

وعلاوة على ذلك، فإن الجانب الأيمن من بايدو الهاتف بحث صورة مربع البحث مفتوحة، والآثار واجهة مفتوحة والبحث عن الصور في الشكل التالي. عندما يتحول المستخدم على التبديل التلقائي للفوز (الرمز أدناه في الشكل) عمودي على الفئات العامة، وسوف تجد تلقائيا ناحية متوقفة الأجسام اللامعة، وضرورة عدم الشروع في البحث عن الصور تصويرها مباشرة. العملية برمتها يمكن أن تجلب تجربة أكثر سلاسة بالنسبة للمستخدم، دون أن يضطر المستخدم لالتقاط الصور يدويا. هو نموذجية عميقة إطار التعلم تطبيقات تكنولوجيا التعرف على الجسم في صورة، ويستخدم في (MDL) إطار المحمول التعلم العميق. MDL حاليا في عملية مستقرة للبايدو الهاتف في عدد من الإصدارات، وبعد عدة تكرارات تحسنت بشكل ملحوظ الموثوقية.

أخرى حالة الصناعة

وكانت حالة من صناعة الإنترنت في تطبيق الشبكات العصبية نهاية متزايد النقالة.

في الوقت الحاضر هناك اثنين من الأنواع الرئيسية، الشبكة العصبية واحدة هي تعمل بشكل كامل على العميل، ومزايا هذا النهج واضحة، وهذا هو، دون المرور عبر الشبكة، واذا كان بامكانهم ضمان سرعة وخبرة المستخدم سيتم على نحو سلس جدا. إذا كانت الشبكة العصبية لضمان كفاءة تشغيل محطة المحمول، يمكن للمستخدم يشعر عملية التحميل. التطبيق بالكامل باستخدام شبكة الإنترنت في محطة متنقلة للشبكة العصبية التشغيلية وقد تجسدت كصورة المرحلة البيك اب والبحث من بايدو الهاتف.

والثاني هو آخر، فإن عملية حساب الشبكة العصبية تعتمد على شبكة الإنترنت، والعميل هو المسؤول الوحيد عن عرض UI. قبل أن تهبط في الشبكة العصبية العميل، وتستخدم الغالبية العظمى من التطبيقات في هذه العملية على الخادم، العميل تظهر الطريق. وميزة هذا النهج هو سهلة نسبيا لتحقيق خفض تكاليف التطوير.

من أجل فهم أفضل للطريقة التي تنفذها الشبكة العصبية اثنين، تظهر المثالان تحديد النباتات والزهور، وتستخدم الأزهار في شكل ولون اثنين تحديد التطبيقات. يستخدم كل من التطبيقات أساليب تصنيف نموذجية، يمكن العثور عليها في النظام الأساسي المتجر دائرة الرقابة الداخلية. فيما يلي صورة لوتس، هذه الصورة باستخدام المعرفة من حيث الشكل، اللون من الزهور واثنين من تصنيف التطبيقات يمكن الحصول على نتائج تصنيف أفضل. يمكنك محاولة تثبيت كل تأثير التطبيقات وفقا للاستخدام والتي تستخدم لتحديد أي من الأساليب المذكورة أعلاه.

زهرة المعرفة

خلال العام الماضي ظهور الكثير من الزهور تحديد التطبيقات. مايكروسوفت "زهرة المعرفة" مايكروسوفت للبحوث آسيا شنت المعلومات ذات الصلة المستخدمة لتحديد الزهور التطبيقات، يمكن للمستخدمين اختيار الزهور بعد اطلاق النار، والتطبيقات إعطاء هذا النوع من الزهور. تصنيف دقيق من الزهور هو واحد من أبرز الدعاية الخارجية.

Xingse

و"شكل ولون" التطبيقات، يحتاج فقط إلى الانحياز النباتات (الزهور والحشائش والاشجار) لالتقاط الصور، يمكنك يعطي بسرعة اسم النبات، وهناك الكثير من المعرفة مثيرة للاهتمام من النباتات، مثل ما الاسم المستعار النبات، النباتات مزهر، المرتبطة الشعر القديم والثقافة النبات، قصص مثيرة للاهتمام وأساليب الحفظ، وقرأت الكثير من الحصاد.

إنهاء صعوبات التعلم عمق تطبيقات الهاتف المتحرك

وكانت العتبة بسبب القيود التقنية وشروط دراسة متعمقة الأجهزة، وتطبيق قصص النجاح في نهاية النقالة من ذلك بكثير. التقليدي مهندس UI نهاية المحمول في إعداد مدونة الشبكة العصبية، يمكنك الوصول إلى عمق نهاية المحمول تعلم المواد قليلة. من ناحية أخرى، والمنافسة على شبكة الإنترنت في الوقت الحاضر هم مكثفة جدا، أول شخص شيانيانغ الملك، يمكن أن يؤدي إلى تكنولوجيا التعلم العميق لنقل ما يصل في النهاية، يمكننا فهم عهد سابق من الفرص.

قدرات نهاية جهاز الحوسبة النقالة مقابل PC ضعيف جدا. منذ نهاية CPU المتنقلة لمؤشرات القوة تبقى عند مستويات منخفضة جدا، مما يحد من مؤشرات الأداء أفضل. هل الشبكة العصبية الحاسوبية والارتفاع الكبير في كمية من عملية CPU التطبيقات. كيفية تنسيق مؤشرات استهلاك الطاقة المستخدم ومؤشرات الأداء أمر حيوي.

بايدو فريق العميل البحث عن الصور في نهاية عام 2015 بدأت في استخدام تكنولوجيا الهاتف النقال لعمق نهاية تعلم لمعالجة المشاكل. في نهاية المطاف، فإن التحدي لحل المشاكل واحدة تلو الأخرى، والآن رمز ذات الصلة تعمل بالفعل على العديد من التطبيقات، التطبيقات في هذه الأيام هناك مائة مليون من المنتجات PV، ولكن أيضا المغامرة من المنتجات.

تطبيق تكنولوجيا التعلم عميقة في محطة متنقلة الصعب بالفعل، بينما على التطبيقات بايدو الهاتف المنتج بهذا الحجم، هو أن تواجه مجموعة متنوعة من النماذج والأجهزة، والهاتف المحمول بايدو مؤشر ل. كيفية جعل مستقرة والتشغيل الفعال للتكنولوجيا الشبكة العصبية هي أكبر اختبار. تخريد هي القضية الأكثر أهمية التي تواجه نهاية تتحرك الفريق. نحن باختصار تلخيص تجد محطة متنقلة والمقارنة من جانب الخادم أكثر عرضة لإظهار المشاكل والصعوبات، ثم الجانب الخادم وحقق العميل المقارنة التالية من عمق تعلم تطبيقات التكنولوجيا.

صعوبات مع المقارنة الخادم الذاكرة الذاكرة: ضعف الحد الخادم - محطة متنقلة مع محدودية استهلاك الذاكرة استهلاك الطاقة: الملقم لا حد - يقتصر تبعيات نهاية حركة تبعيات حجم المجلد: لا حد خادم - يحد بشدة نموذج نهاية الحركة حجم نموذج حجم: 200M حجم الملقم من النموذج التقليدي - محطة المحمول لا يزيد على الأداء أداء 10M: قوية الخادم GPU BOX - تتحرك وحدة المعالجة المركزية نهاية وGPU

في عملية التنمية، فإن الخطوة فريق خطوة للتخلص من الصعوبات المذكورة أعلاه، تشكيل إطار التعلم العميق MDL الحالي. لتمكين المهندسين أكثر قدرة على الحركة بسرعة إنهاء عجلات، والتركيز على الأعمال التجارية، بايدو مفتوح المصدر كافة التعليمات البرمجية ذات الصلة، أي شخص هو موضع ترحيب للانضمام إلى المجتمع ولكن أيضا لخلق عجلة التنمية في الماضي.

MDL تصميم الإطار

أفكار التصميم

كنهاية النقالة تعلم عمق الإطار، ونحن نأخذ في الاعتبار الكامل خصائص التطبيقات النقالة والبيئة التي تعمل فيها، طرح متطلبات صارمة من حيث السرعة والحجم واستخدام الموارد، وما إلى ذلك، لأن أي واحد من هذه المؤشرات مهمة لتجربة المستخدم تأثير.

وفي الوقت نفسه، والتدرجية، متانة، والتوافق هو ما قمنا بتصميم منذ البداية أن تأخذ في الاعتبار. من أجل ضمان قابلية الإطار، فإننا طبقة تجريد لطبقة، حسب الضرورة لتسهيل إطار النموذج المستخدم، لتحقيق نوع معين من طبقة مخصصة، MDL نتوقع تحقيق الدعم لمزيد من نموذج الشبكة بإضافة أنواع مختلفة من طبقات دون الحاجة لرمز يتغير في أي مكان آخر، وذلك لضمان متانة الإطار، وMDL عن طريق التأمل، استثناء C ++ طرح الكامنة وراء طبقة التطبيقات، وطبقة التطبيقات المقابلة معالجة التشوهات التي كتبها شذوذ في محاصرة، لأن المعلومات شذوذ جمعتها السجل، ضمان برامج التحسين المستدام؛ حاليا في أعماق مختلفة في صناعة مجموعة واسعة من التعلم والتدريب الإطار، لكن لا يعتمد على القدرات التدريبية نموذج MDL، من أجل ضمان إطار التوافق، ونحن نقدم كافيه النصوص أداة نموذج نقل MDL، سطر الأوامر من قبل المستخدم يمكنك استكمال التحول ونموذج عملية تكميم، وسوف نستمر في دعم PaddlePaddle المتابعة، TensorFlow ونماذج أخرى تحويل MDL، متوافق مع مجموعة متنوعة من النماذج.

الهيكل العام

MDL إطار تصميم العمارة العام هو كما يلي:

MDL حدة تحويل الإطار الرئيسي وتشمل نموذج (MDL تحويل)، وحدة نموذج تحميل (لودر)، وحدة إدارة الشبكة (نت)، وحدة تشغيل المصفوفة (Gemmers) وطبقة واجهة لJNI تدعو الروبوت نهاية (JNI واجهات). حيث النموذج هي المسؤولة أساسا عن وحدة تحويل نموذج MDL كافيه في النموذج، ودعم 32BIT وعائمة المعلمة أشر إلى المعلمة 8bit تكميم، وبالتالي ضغط بشكل كبير على حجم النموذج، نموذج معكوس حدة تكميم إلى تحميل كامل وتحميل نموذج المعايرة، شبكة تسجيل وغيرها من العمليات، وحدة إدارة الشبكة هي المسؤولة أساسا عن التهيئة طبقات الشبكة طبقة والإدارة، وتوفر MDL JNI المكالمات الجانب طبقة واجهة لالروبوت، يمكن للمطورين القيام به بسهولة عن طريق استدعاء واجهة وتحميل عملية التنبؤ JNI.

MDL المواقع بسيطة متاح

MDL في بداية تنفيذ المشاريع مفتوحة المصدر لديها بالفعل تحديد المواقع واضح. في المعدات المعقدة والبحث والتطوير عملية تكنولوجيا منصة متنقلة انخفاض أداء نهاية، فمن الممكن للعثور على المشهد المناسب للتكنولوجيا جديدة من التعلم العميق وتطبيقه على منتجاتها جذابة جدا. ولكن إذا كان لدى كل المهندسين محطة المحمول إعادة كتابة مرة واحدة لتحقيق التطبيق الكامل للشبكات العصبية في عمق العملية التعليمية، ويزيد من تكاليف أكبر. موقف MDL هو بسيط لاستخدام ونشر الشبكات العصبية، لا تحتاج إلى تكوين وتعديل إذا كان غير مطلوب الاستخدام المفرط للمهام الأساسية، وآلة حتى تعلم عملية تجميع المكتبة، تحتاج فقط إلى التركيز على الأعمال التجارية محددة لتحقيق وكيف يمكنك استخدامها.

في نفس الوقت MDL بسيطة وبنية رمز واضح ويمكن استخدام المواد التعليمية، وتوفير مرجعية للاتصال عادل دراسة متعمقة من المهندسين R & D. لأننا نؤيد المحمول منصة عبر مترجم، ولكن يدعم أيضا لينكس وماك إلى x86 منصة مترجم يمكن ترجمة وتشغيل مباشرة على عمل الكمبيوتر في نفس الوقت ضبط عمق والتعلم متاحة، دون الحاجة إلى نشر لتسليح النظام الأساسي. تحتاج فقط بضعة أسطر بسيطة من التعليمات البرمجية، وتحديدا الوصول إلى جيثب التمهيدي MDL.

 # # Https://github.com/baidu/mobile-deep-learning ماك أو لينكس: ./build.sh ماك مؤتمر نزع السلاح بناء / الافراج عن / إلى x86 / بناء ./mdlTest

عملية الإنشاء معقدة غالبا ما تكون أطول من الوقت لتطوير، في MDL سوف تكون قادرة على ذلك، واختبار اختبار كل مجموعة طالما أن خط ./build.sh الروبوت، من السهل جدا لنشر.

./build.sh الروبوت

أداء MDL والتوافق

  • حجم مع ARMv7300K +

  • IOS GPU سرعة mobilenet يمكن أن تصل إلى 40ms، squeezenet تصل إلى 30ms

MDL من مشروع مفتوح المصدر، وكرر أكثر من عام. إن تعددية تتحرك مؤشرات نهاية تهم أداء جيدا، مثل الحجم، واستهلاك الطاقة والسرعة. بايدو خط الانتاج الداخلي قبل كما قامت بتطبيق عدة المقارن، ولها مشاريع مفتوحة المصدر النقيض ذات الصلة، ويمكن MDL دعم مجموعة متنوعة من النماذج في دراسة متعمقة لضمان السرعة واستهلاك الطاقة في نفس الوقت، مثل mobilenet، googlenet V1، squeezenet وغيرها، ولها دائرة الرقابة الداخلية GPU نسخة، squeezenet يمكن أن يحقق أسرع 3-40ms وقت التشغيل.

إطار مقارن مماثل

الإطار Caffe2TensorFlowncnnMDL (CPU) MDL (GPU) الأجهزة CPUCPUCPUCPUGPU السرعة بسرعة ببطء حجم صغير أحجام متوافقة الروبوت وiOSAndroid وiOSAndroid وiOSAndroid وiOSiOS

مقارنة مع نهاية تتحرك من CNN دعم الإطار، وMDL بسرعة، والأداء مستقرة، وحسن التوافق، تجريبي كاملة.

التوافق

MDL يمكن أن يكون عملية مستقرة في منصات دائرة الرقابة الداخلية والروبوت، وفوق منصة iOS10 أساس GPU الحوسبة API، والأداء الجيد جدا، ومنصة أندرويد هو وحدة المعالجة المركزية نقية. نماذج للهاتف المحمول الراقية منخفضة تشغيل الدولة وبايدو وتغطية أخرى على التطبيق لديه ميزة مطلقة.

MDL كما يدعم التحويل المباشر لنموذج نموذج كافيه MDL.

يتميز MDL في لمحة

في بداية AI ذات الصلة البحث والتطوير بداية لتحرك فريق البحث بايدو صورة مقارنة فإن الإطار CNN الأكثر مماثلة مفتوحة المصدر، في حين المتنازعة كشف أيضا مشاكل في هذا الاتجاه. بعض إطار تجريبي البيانات المعلقة، وأداء المنتج الفعلي أو سوء الأداء وغير مستقرة للغاية، أو النماذج لا يمكن أن تغطي كل شيء، أو أقل من حجم المعايير على الخط. لتجنب هذه المشاكل، وأضاف MDL الميزات التالية:

  • بنقرة واحدة نشر والمعلمات النصي يمكنك التبديل دائرة الرقابة الداخلية أو الروبوت

  • كافيه نموذج يدعم التحويل التلقائي إلى نموذج MDL

  • يدعم GPU التوالي

  • وقد تم اختباره وسوف تعمل MobileNet، GoogLeNet V1، squeezenet نموذج

  • حجم صغير جدا، لا الاعتماد طرف ثالث، المصنوعة يدويا

  • النصي تكميم المقدمة لدعم مباشرة 32-بت التبديل UINT تعويم 8، حجم أسفل نموذج كمي في 4M

  • وفي كثير من الأحيان للتواصل مع الفريق في ARM خوارزمية ارتباط الانترنت وغير متصل، وسوف تستمر الأمثل لمنصة ARM

  • NEON يغطي باستخدام التفاف، تطبيع، ومثل تجميع عملية حساب

  • الفتح حلقة الفتح، لتعزيز أداء وحدة المعالجة المركزية للحد من الاستهلاك غير الضروري للعملية يتم تحديد مدد

  • وهناك الكثير من مهام الحوسبة الثقيلة في عملية ما قبل العامة

التخطيط للخلافة

  • من أجل مزيد من خفض حجم MDL، MDL protobuf لم تستخدم كمخزن التكوين نموذج، ولكن شكل JSON الاستخدام. حاليا MDL MDL لدعم كافيه نموذج نموذج التحول، فإن مستقبل دعم كل النموذج السائد في نموذج MDL.

  • مع رفع مستوى أداء الحوسبة النقالة من الأجهزة النهاية، سوف GPU محطة متنقلة للمناطق العمليات في المستقبل تتحمل دورا هاما للغاية، MDL لتحقيق GPU ذات قيمة عالية. حاليا MDL يحظى بدعم لدائرة الرقابة الداخلية GPU إلى المدى، iOS10 فوق نماذج يمكن استخدامها. ووفقا للإحصاءات المتاحة حاليا المعرض، iOS10 غطت بالفعل أكثر من نظام iOS، يمكنك استخدام عملية CPU التالية في iOS10. وبالإضافة إلى ذلك، على الرغم من أن منصة أندرويد، مقارنة مع GPU ضعف القدرة الحاسوبية الحالية الشاملة وحدة المعالجة المركزية، ولكن على نحو متزايد GPU الناشئة نماذج جديدة أصبحت قوية على نحو متزايد. انضم MDL في وقت لاحق GPU ميزة تحقيق، استنادا إلى منصة أندرويد الحوسبة أداء الحوسبة OpenCL GPU يجعل النماذج الراقية ومن ثم الترقية إلى مستوى أعلى.

أهلا وسهلا بك إلى المطورين للمساهمة كود

الانتقال مستقرة نهاية وكفاءة تشغيل الشبكة العصبية، العديد من المطورين لا يتجزأ الترميز. في MDL المدى الطويل أغراض الجمال وهمية موثوقة وعملية وليس، على أمل أن تساهم في تكنولوجيا التعلم المتنقل نهاية عميق. بقوة الناس موضع ترحيب للانضمام إلى تجمع كبير، وعمق التكنولوجيا المستخدمة على نطاق واسع في نهاية النقالة، انتشار التعلم في المنزل.

آخر عرض الدليل MDL جيثب مرة أخرى:

https://github.com/baidu/mobile-deep-learning

نص اليوم الموصى بها

انقر أدناه لقراءة الصورة

بايدو فتح رسميا brpc إطار RPC لها

7010000000000 يوان! الارتقاء المطرد للتجارة الخارجية، حيث ديناميكية في الجديد؟

الآباء تشن يو لين تلين: ابنة تعترف حقا ذنبنا، وقال عاملون في عائلتها غنية في الأسواق المحلية؟

نوصي التشويق الدراما "خاطىء" صبي يبلغ من العمر 11 عاما قد قتل والديه

بسعر 3498 يوان، فيفو X23 بيع بدأت رسميا

رحلة خمسة عشر عامًا من النور: السجل السري لأغنية "هالو" (الجزء الأول)

أبريل Fangfei في كل مكان الفاوانيا الساطع احتضان الأسلحة الربيع جديدة

سيلينا تضحك على نفسك يمكن القيام به "، خادمة"، وفاز جاو لين بياو ثلاثة أضعاف تيا راي البضائع ممتاز

بعد ثلاث سنوات، "Quiddy" سلسلة تحفة الثانية "Quiddy: أبطال الساقطة" عودة صدمة

خطير جدا لتقليد! الغاق الجشع نظموا ابتلع لسوء الحظ بطاقة

"عظيم المخبر هوثورن،" سيتم الافراج عنهم للاشتباه في "بلدي الحبيب 2" سحب الملفات المتعلقة بما يلي: تذهب، I هيا

أمريكا TV شاهد الكثير من الخريف والشتاء والعتاد، وكان يعتبر "صديقتي عبقرية" كأفضل طوال العام

"مصير / EXTELLA" التقييم: اختبار قيمة الإيمان