بايدو الدماغ "من جديد"!

منذ وقت ليس ببعيد، أطلقت بايدو تحسين وتطوير من الدماغ، بما في ذلك تكنولوجيا الصوت والتكنولوجيا البصرية، ومعالجة اللغة الطبيعية، وخرائط المعرفة، بما في ذلك قدرات AI العامة، فضلا عن عمق الأطر التعليمية المفتوحة المصدر. في نفس الوقت، والذكاء الاصطناعي له لمدة ثلاث سنوات متتالية في تقرير الحكومة "الذكية +" ليصبح الاقتراح صناعة جديدة في 2019.

شبكة لى فنغ المستفادة بايدو الدماغ منذ بداية 2016 الانفتاح، والآن هو أكبر خدمة AI منصة مفتوحة. افتتح AI بطاقة إجمالية قدرها 158، والتكامل السريع على مدار 24 ساعة، وعدد من المطورين أكثر من 1 مليون دولار. لمجموعة واسعة من الشركات والمطورين لتوفير قدرات الأكثر تقدما وشاملة من منظمة العفو الدولية، تستمر طلبات AI إلى خفض عتبة الهبوط.

علم الأصوات

في يناير من هذا العام لاستكشاف بايدو نسخة طريقة إدخال المؤتمر، لأول مرة إطلاق سراح الشركة الرائدة في مجال تقنيات الصوت الدولية: متعدد المستويات نموذج الانتباه تدفق قطع الأولى في العالم صوت على الانترنت SMLT الميدان "الجري trancated الانتباه متعدد الطبقات". ومن الجدير بالذكر أن هذا هو النموذج الأول الانتباه وقت (انتباه) في صناعة التعرف على الكلام واسعة النطاق.

لتعزيز معدل الاعتراف في حين الأمثل كبير فك السرعة. "التعرف على الكلام الطبعة النهائية" لديه سرعة استجابة أسرع، ودقة التعرف النسبية بنسبة 15. هذه القدرات الصوتية بطريقة المكالمات API، ومعدل الوقت الحقيقي أقل من 0.1، وهذا يعني أن الصوت هو أقل من 500MS 5S لاستكمال عملية تحديد الهوية، والحد من التعرف على الصوت المطلوبة لتعزيز تجربة الاستجابة الصوتية التفاعلية تستغرق وقتا طويلا.

في مجموعة مقربة بيئة هادئة، يمكن أن معدل دقة التعرف تصل إلى 98 في المئة، في حين دعم بلكنة طفيفة، صبيانية، تهمس الاعتراف، والتعرف على الصوت أكثر على نطاق واسع. متعدد منصة SDK هو أيضا على وشك إطلاق APP، المزيد من الوقت الحقيقي تحديد من جانب الخادم، وتطبيق هذه التكنولوجيا المتطورة. في الوقت الراهن، وستقدم كل حساب مطور 5W أضعاف كمية مكالمات مجانية للمستخدمين قدرات جديدة، ستطلق قريبا سلسلة من الهدايا والعروض الترويجية.

وفي الوقت نفسه، التعرف على الكلام القريب من ميدان ترقية مسبقا محلل الدلالي. SMS مسبقا المشاهد والقصص، وتأثير تحليل الدلالي الأمثل تماما من قبل 35 ترقيتها إلى 51، بما في ذلك الطقس، والطيران، والهواتف، وتشغيل الفيلم، شاشة الصفحة السيطرة، والتلفزيون، والغذاء، وإعدادات الهاتف، سجلت جنرال موتورز تذكرة، و 80 أفضل من النتائج التحليلية الأصلية.

دعا وسيتم عرض المنتجات الجديدة بايدو الدماغ، مثل: صوت التدريب الاعتراف من منصة لدعم تقييم الآلي من خط الأساس اختيار أفضل سيناريوهات نموذج الأعمال تحميل الإحضار النص الوحيد لتدريب نموذج اللغة، رمز الصفر تدريب الذات الملكية خطاب نموذج الاعتراف، يسهل إلى حد كبير للمطورين لتعزيز دقة التعرف على الكلام حيث سيناريوهات الأعمال، لتلبية احتياجات رجال الأعمال التعرف على الكلام.

وبالإضافة إلى ذلك، مجموعة تطوير خطاب بعيدة الميدان التي يمكن التعرف بسرعة على تطوير تقييم بعيدة الميدان، والأجهزة المستخدمة في هذه المجموعة الروبوت، قصص آلات الأطفال والأجهزة المنزلية والمعدات والسيارات. سيتم أيضا مفتوحة حاليا التوليف، وتقديم المزيد من بنك الصوت.

الجوانب البصرية

أولا وقبل كل شيء، من حيث التعرف الضوئي على الحروف:

  • وأضاف بطاقة OCR 4 قدرات جديدة: حسابات OCR، دليل طبي الميلاد OCR، تسمح OCR، تايوان يمر OCR، ما مجموعه تسعة أنواع؛

  • مشاريع قوانين جديدة OCR 4 قدرات جديدة: خط سير الرحلة OCR، سياسة الاعتراف OCR وعالمية الفواتير آلة المطبوعة OCR، الثابتة فاتورة OCR، ما مجموعه تسعة أنواع؛

  • مشهد السيارات الثلاث قدرات جديدة: سيارة VIN OCR، مبيعات السيارات فاتورة OCR، وإصدار الشهادات مركبة OCR، ما مجموعه ستة أنواع. قدرات OCR جديدة في مجالات رئيسية من سعر الدقيق لأكثر من 90، وعدد من أول منصة في هذه الصناعة المفتوحة. وحتى الآن، OCR مجموعة كاملة من المنتجات ما مجموعه 34 النماذج، لتحقيق الشهادات بطاقة، ومذكرات، وثائق، وغطت سيارة المشهد بأكمله.

وOCR القائمة أيضا القدرة على تطوير وظائف هي: الاعتراف الجدول: دعم دمج خطوط الخلايا، يشكل أي نمط معقد، IOCR التعرف على الحروف قالب مخصص: عمود دعم العرض ليست ثابتة، وهناك نمط جدول الاعتراف خلية مدمجة مخصصة ، وتحديد رخصة القيادة: رخصة القيادة يدعم تحديد الصفحات الفرعية.

ثانيا، في التحليل من السيارة، والكشف عن مركبة الإطلاق والإحصاءات المرورية وتحليلها ومظهر السيارة سمات بما في ذلك تحديد الضرر.

  • الكشف عن المركبة، يتم التعرف على صورة من جميع السيارات (بما في ذلك السيارات والشاحنات والحافلات والدراجات النارية والدراجة ذات العجلات الثلاث)، نوع الإرجاع، وموقف كل مركبة تنسيق، وكانت تحسب لكل نوع من المركبات، يمكن تطبيقها على رصد مخالفة وقوف وموقف للسيارات ذكاء.

  • إحصاءات حركة المرور، وفقا لالتقاط الفيديو سلسلة من الصور، ودينامية إحصاءات حركة المرور الكشف عن السيارة وتتبع، وتحديد أنواع مختلفة من المركبات (بما في ذلك السيارات والشاحنات والحافلات والدراجات النارية والدراجة ذات العجلات الثلاث) في مناطق معينة في تشغيل / إيقاف منحدر، وإعمال يمكن تطبيقها على الوقت الحقيقي رصد حركة المرور على الطرق، وحجم حركة المرور جبل تلقائيا حساب عدد فترات الدخول والخروج من أنواع مختلفة من المركبات، وتحليل تقاطع حركة المرور، أقسام، وتوفير مرجعية دقيقة لمراقبة حركة المرور، وتحسين حركة المرور.

  • تحليل السمة مظهر السيارة وتحديد الضرر خدمتين، هو أيضا على وشك مفتوحة.

وأخيرا، وذلك تقديرا من الوجوه البشرية، الإصدار الجديد من الاعتراف العاطفة، يمكن أن تحدد بدقة سبعة أنواع من العواطف: الغضب والخوف والاشمئزاز والسعادة والحزن والدهشة، لا العاطفة.

هذه التقنية يمكن تطبيقها على الأمن مراقبة المشهد رياض الأطفال، من خلال مراقبة الطفل النفسي الدولة والمدرسين والأطفال لتحديد ما إذا كان هناك وضع غير طبيعي، من أجل الأطفال في حماية آمنة، محذرا في الوقت المناسب والمشاركة في تقديم المشورة.

وفي الوقت نفسه، سيتم إطلاق التكامل من الوجه واليدين والنقطة الأساسية في مارس اذار. وبالإضافة إلى ذلك هناك نوعان من وظيفة الترقية الجديدة، وتشمل: كشف الوجه والوجه عودة بسرعة للكشف عن إطار موقف وجه، وتحديد المواقع وعدد من الميزات مفتاح كفاف، وزيادة 72-150، 2 الجديدة لفتة اليد، أي ما مجموعه 24 أنواع من لفتة المشتركة، ومعدل الاعتراف العام من 90 أو أكثر، بحيث الاعتراف فتة أكثر ثراء، وأكثر دقة، حول على الخط وفي أعلى صورة الانقسام الدقة، صورة ينطبق ميتو، فيديو آخر مثل المشهد.

التعرف على الصور، وتحديد الخمر والاعتراف التاريخي أن اثنين من قدرات جديدة. من الخمر، ويحتاج المستخدمون فقط إلى النبيذ التسمية أمام الكاميرا، سيقوم النظام تلقائيا بتحديد واسم النبيذ العلامة التجارية، وحاليا يمكن التعرف على مئات الآلاف من الخمور المحلية والدولية، ومعدل دقة التعرف على أكثر من 98، من بوردو الى الصينية تشانغ يو والسلع المعلومات يمكن أن يكون بدقة الجمعيات.

لا تكون قادرة على التعرف على تحديد دقيق لحوالي 50،000 الصينية والمعالم الأجنبية المعروفة، والجذب السياحي، ومعدل دقة أكثر من 94. تشمل يحتاج المستخدمون فقط إلى اتخاذ السياحية الشهيرة، معالم الصورة، ونظام يمكن أن تولد تلقائيا مثيرة للاهتمام البصمة المحتوى التفاعلي، بلوق الرسم وهلم جرا.

أعلن بايدو أيضا الدماغ القادم على خط المدعوة إلى الاعتراف اختبار عملة واحدة. هذه الميزة يمكن أن تحدد بدقة العملات الأجنبية، ودعم العملة مئات الطبقات، وأكثر من الآلاف من الطوائف، ومعدل دقة التعرف من 98، وليس فقط لتعزيز كفاءة المؤسسات المالية والنقدية تبادل، كما يسمح "احتيال العملات الأجنبية" لا مكان للاختباء. حاليا، لها أنواع الاعتراف بايدو صورة الدماغ تصل إلى 11 نوعا.

اللغة والمعرفة

شبكة لى فنغ المستفادة بايدو لغة الدماغ والقدرة على تحديد اتجاه المعرفة، ويشمل معالجة اللغة منصة التطبيق، اللغة تطبيق تكنولوجيا معالجة والتكنولوجيا الأساسية معالجة اللغة، والمعرفة، وفهم وخريطة المعرفة.

اللغة تطبيق تكنولوجيا المعالجة، وإدخال قدرات جديدة:

  • تصحيح النص، خطأ في جزء النص الذي تم التعرف على الخطأ واعطاء توصية محتوى النص الصحيح.

  • أنباء موجزة، المحتوى الإخباري فهم شامل والتحليل الدلالي، واستخراج المعلومات تلقائيا الرئيسية في الأخبار نص توليد ملخص وبطول معين، يمكن تطبيقها البلمرة إلى الأخبار الساخنة، أوصى الأخبار، والبث الصوتي، مشهد مثل رسالة دفع APP.

  • ذكية كتابة الشعر، يحتاج المستخدمون فقط إلى إدخال أي الكلمات الرئيسية (مثل اسم الشركة، حيث الشمسية الاسم)، الجهاز سوف تولد تلقائيا مزيج من كلمات الشعر.

  • مقاطع الذكية، مستخدمين إدخال أي الكلمات الرئيسية (مثل أسمائهم)، وآلة يمكن أن تولد مقاطع تنصهر الكلمات الرئيسية تلقائيا، ويمكن استخدامه في شركة التسويق التفاعلي، مهرجان الربيع APP الأنشطة التفاعلية.

  • عاطفة الاعتراف الحوار، محادثة يمكن أن يكون للنص، وتحديد تلقائيا عرضت جلسات الطبقة المشاعر الحالية.

من حيث فهم المعرفة، وإدخال قدرات جديدة:

  • كتابة البحث، وهناك عشرات الآلاف من المقالات مقال، بدعم من نمط، والكلمات، الصف، الخ الاستعلام موضوع مشترك من، فإنه يمكن استخدامها في منتجات الأطفال التعليم (مثل آلة التعلم) ومكتبة ومشاهد أخرى.

  • مسابقة، سؤال والقدرة على الإجابة يمكن أن توفر وسائل الترفيه، والحرف، والتعليم، والسينما والتلفزيون، متنوعة، والرسوم المتحركة، والخيال، والأعمال الأدبية مثل نوع العمودي، وتقويم التاريخ، وفارق السن، وتقول، عندما تكون المنطقة الزمنية وضعف المنطق القدرة الحاسوبية يمكن استخدامها في اللغة ذكي أطفال آلة القصة، منتجات عموم الترفيه ومشاهد أخرى.

وبعد وقت قصير، وسوف تكون ذكية منصة الكتابة أيضا على الخط، فإنه سيتم توفير أدوات للمبدعين على المواد، للمساعدة في العثور إلهام لتحسين كفاءة وجودة الانتاج الكتابة المبدعين، وخفض تكلفة من الكتابة.

دراسة معمقة

علمت شبكة لى فنغ أنه في عام 2016، بايدو مفتوحة عمق مصدر التعلم إطار PaddlePaddle. مؤخرا، بايدو PaddlePaddle الدماغ تحديث:

  • مكتبة الفيديو نموذج تصنيف: الإطار الأساسي مضرب v1.3 للالموائع نموذج جديد الفيديو العروض مكتبة خمسة الكلاسيكية نموذج تصنيف الفيديو ورمز هيكل عظمي عام للمهام تصنيف الفيديو، يمكن للمستخدم بنقرة واحدة نموذج التكوين استكمال كفاءة التدريب والتقييم. سلطة المنافسة الفيديو فهم ActivityNet - حركية الحركة الفيديو نسخة أسلوب بطل مهمة الاعتراف stNet تنفيذ مفتوحة المصدر resnet50.

  • استنادا بيرت بطاقة آلة متعددة وخلط PaddlePaddle التدريب الدقة، ودعم جديد بيرت NLP الدلالي نموذج التمثيل، ودعم التدريب بطاقة آلة متعددة، ودعم التدريب الدقة المختلطة، وتدريب سرعة المقارنة السائدة تحقيق ما يصل إلى 50 +، وتقديم أمثلة نشر كامل.

  • وزعت تدريبية لتعزيز الأداء: على نطاق واسع متفرق الخادم المعلمة الافراج عن المعيار، وحدة المعالجة المركزية متعددة المعالجات نشر غير المتزامن تدريب تحسن بشكل ملحوظ من خلال النقر المعدل المقدر مهمة IO الإنتاجية من المدمج في قارئ بطاقة متعددة آلة متعددة الأوجه تدريب لتحسين الأداء.

إطلاق عمق تعزيز إطار التعلم PARL1.0، ويدعم تخصيص توسع مواز، وتغطي DQN، DDPG، PPO، A3C وغيرها من التيار تعزيز خوارزمية التعلم. ما يقرب من 20،000 سحب عملية عقدة من وحدة المعالجة المركزية 8 GPU، ما يقرب من خمس ساعات تسارع خوارزمية تكرارية من PPO إلى أقل من 1 دقيقة.

كلا سوف تعمل نجوم الغناء، والذي يمكن ان يخطر لك؟ فكرتي الأولى هو جي وليو تاو

تشاي تيان لين منغ شي مي ذكر الحكومة جيانغسو تطبيق مكتوبة على القضايا المستخدمين الكبير: Tucao ديس مسؤول الأكثر فتكا

AJ1 فإنه سيتم اطلاق النار من حذاء؟ إذا يمكنك التحكم في التفاصيل أن هذا الزوج من الظل تنتمي لك!

شو تشنغ كان بسبب ملياري المال الأسود "خطف" طلب وانغ ليكون الاستبداد شقيقة الملكي الكامل مروحة!

وقفت على قمة شاهقة 21 طابقا، وشهدت 2017 في الشمس من خلال الضباب

اللعب الدخن تقييم الهاتف، وكيفية القيام به "جعل حركة المرور الخاصة بك" غير محدود؟

فوائد | CCF-GAIR 2018 الروبوت الكترونية أجندة خاصة وقائمة الضيوف تم خبز طازج!

"هل جيدة جدا" سودا جيانغ مينغ يو وبخ اهن، والحق أيضا؟ المستخدمين يشعرون قاسية جدا مينغ يو

LOGO تلعب كبير حسن المظهر منتج واحد يضيف دينغ الجديد؟ ! بابي 2017AW BIG القرد سلسلة بما فيه الكفاية وسيم؟

العائد على الاستثمار تصل إلى 241 في المئة، "رومانسية" في دو جيانغ هو الأكثر الممثل فعالة من حيث التكلفة؟

مسرحية يأتي مع الدخن المرور رسميا، شراء الهاتف المحمول لإرسال حركة المرور لمعرفة؟

من الحديث "العالم الغربي"، الروبوت الكترونية اثني عشر طلب | CCF-GAIR 2018