وفقا لصوت المخطط القيام به! دقة التعرف على التعرف على الكلام لخلق مستويات قياسية جديدة الصينية

[استعراض فاز جي الجديدة وفقا للخطط لدخول صوت قوي الذكية، أصدرت مشتركة صوت مايكروسوفت منصة سحابة مفتوحة، هواوي نتكاتف نشر البرامج والأجهزة تكامل حلول مشتركة صوت ذكي. خطاب الشكل خوارزمية الاعتراف وفقا لأكبر AISHELL 2 على أساس المصدر المفتوح الكلمة الصينية معدل خطأ في قاعدة البيانات فقط 3.71، حوالي 20 أعلى من الأصلي ترقية رائدة في هذه الصناعة، وتحديث بشكل كبير سجل موجود في العالم. وبمقارنة مختلف خوارزميات التعرف على الصوت، ذكي المعركة صوت اليوم، البطل الوحيد الذي يطير مع الأخبار وفقا لجولات؟

وبحلول نهاية عام 2018، بلغ السوق الصوت الذكية بشكل غير متوقع حصان الظلام.

كانت دائما تنظر إليه على أنه "التعرف على الوجه يونيكورن" - أو بشكل أعم وضع، "جهاز الرؤية يونيكورن" في التكنولوجيا خريطة فقا أعلنت وأحدث طفرة في الصينية تقنية التعرف على الكلام، والتخطيط الصناعي ملحوظا .

من الناحية الفنية، أكبر الصينية قاعدة بيانات مفتوحة المصدر في العالم AISHELL-2، بلغ الإملاء وفقا للخطط قصيرة كلمة خطاب نسبة الخطأ (CER) 3.71 ، مقارنة رائدة في هذه الصناعة الأصلي في رفع حوالي 20، وتحديث كبير سجل موجود.

هذه الصناعة، وفقا لرأي مشترك من منصة مفتوحة تستند إلى الخدمات الصوتية أزور سحابة مايكروسوفت، ودمج الأجهزة والبرمجيات العمل معا سراح هواوي "حل مشترك الذكي صوت"، سوف تكون متاحة لمطوري التطبيقات طرف ثالث وفقا لشكل تقنية التعرف على الكلام.

وفقا لخريطة الرئيس التنفيذي للابتكار الدكتور الوقف هاو

"لقد كان صوت دائما موضع اهتمام وفقا للخطط كما الذكاء الاصطناعي لديه فهم عميق وتطبيق الشركة، ونحن بطبيعة الحال دخول في مجال التعرف على الكلام". ووفقا لرئيس قسم الابتكار الشكل الدكتور الوقف هاو قال، وفقا للخريطة هو "الذكاء والاصطناعي شركة ".

"وبما أن صوت هذه الصناعة حديثي الولادة، لا يزال لدينا الكثير من الأماكن للتعلم" الطلاب الأكبر سنا، لكننا عازمون على تعزيز الابتكار الصناعة والتنمية، أن تفعل أفضل لغة الماندرين الصينية تكنولوجيا التعرف على الصوت في العالم. "

لم تبدأ المنافسة صوت ذكي حتى الآن، وأفضل التعرف على الكلام الصيني في العالم وفقا لخطط للقيام

كل شيء الإنترنت والصوت أولا.

التعرف على الكلام هو AI فهم معظم العناصر الهامة في العالم، ولكن أيضا أن تكون قادرة على الاستماع إلى منظمة العفو الدولية أن أقول شرط ضروري لفهم جيد.

في السنوات الأخيرة، واندلاع عمق التعلم الدافع وراء التطور السريع للتكنولوجيا التعرف على الصوت، ولدت عددا كبيرا من صوت ذكي الشركات المبتدئة، وكثير منهم قوة المنافسين قوية.

بالإضافة إلى الصين ذكي صوت "الأخ الأكبر" IFLYTEK، بايدو، أدخلت علي بابا، تينسنت، Jingdong شركات أخرى منتجات الصوت الذكية، إلى جانب السيطرة نقطة عالية الاستراتيجية الدولية للمجموعة الذكية الأمازون، وجوجل، ومايكروسوفت ...... من قبل نهاية 2017 رئيس "حرب مائة مربع" الدخان لم تلاشى، لماذا اختيار هذه النقطة في وقت وفقا لشكل واردة؟

"لا أعتقد ذلك وبدأت المنافسة بعد، ليس هناك شك في القبول." يقول المؤسس المشارك للعلوم والتكنولوجيا وفقا الشكل قبول مقابلة الجديد تشى يوان لين CHENXI في يناير كانون الثاني عام 2018.

تعتبر ذكية عمالقة السوق الصوت على ما يبدو في كل مكان، ولكن لين CHENXI اعدة الشركات المبتدئة، وفقا للجدول لا تعبير فقط ومعالجة اللغة الطبيعية، ولكن أيضا لتفعل اعترافا أنه علاوة على المستوى الإنساني.

وقال الشكل وفقا لالمدير الفني أنه بالرغم من أن بعض المنظمات تعزيز الاعتراف صوتهم قد وصل حتى إلى ما بعد المستوى الإنساني، ولكن في معظم الحالات، وهذه النتائج هي من الهدوء، الميدان القريب وغيرها من سيناريوهات محدودة.

"في بيئة آلة الصوت الوضع المثالي يمكن التعرف على بعض الكلمات غير المألوف، أو قوية من حيث تحديد الأسماء المناسبة وغيرها من الناس، ولكن الناس لا يزالون متانة قوية إلى الجهاز، وصوت الشعب مألوفا على التعارف الحقل كان الاعتراف خوارزمية واضحة يمكن القيام به ".

في الوقت الحاضر لا تزال هناك العديد من التعرف على الكلام الاختناقات، على سبيل المثال في حالة النطق غير واضح، وكيفية الجمع بين أقوى المعلومات الدلالات السياقية تعطى دقة التعرف على الكلام، وكيف الرابط كله على التعرف على الكلام، والاعتراف بعيدة مجال تحسين الأداء؛ خاصة تعامل مع الوضع، مثل الضمائر الشخصية، والجسيمات الوسائط، وهناك مشكلة المولوتوف (في نفس الوقت الناس يتحدثون، والتي يمكن التعرف بدقة صوت الشخص)، والاعتراف المشهد الهاتف (التعرف على الكلام في معدل أخذ العينات منخفض).

المخطط وفقا لالاكتشافات العلمية والتكنولوجية في مجال تكنولوجيا التعرف على الكلام، يعني ليس فقط وفقا للرسم البياني لأول مجموعة القدم الساعة في مجال التعرف على الكلام بالفعل بين المعسكر الأول من التعرف على الكلام الصيني، يظهر التعرف على الكلام أيضا تطور المستوى الفني وجود مساحة كافية في أقصى لم تصل "إلى ما بعد الإنسان".

وفقا للخطط المتوقع في 6 أشهر المقبلة إلى 12 شهرا، وخوارزمية أداء تقنية التعرف على الكلام تزيد أضعافا مضاعفة، وأكثر من المشهد سوف تكون مقفلة، لتحقيق قيمة أكبر للتطبيقات الصناعية.

IFLYTEK وفقا للجدول ينتمي إلى الصف الأول، BAT حتى قريبة

باعتباره الخطوة الأولى في الصوت الذكية، الأرقام الصادرة وفقا ل "مؤتمر الإملاء" مايكرو حرف صغير ، وسوف يكون هناك لفترة أطول من 60 ثانية الكلام إلى نص مكتوب في دعم بوتونغهوا، ومتوافق مع مجموعة متنوعة من لهجات.

"المؤتمر الإملاء" مايكرو حرف صغير: الصناعة الأولى مفتوحة وشفافة تنتمي إلى الاختلافات في مستوى المواءمة بين مختلف الخوارزميات

ومع ذلك، "نأمل أن لا تركز فقط على API نفسها،" وفقا للمخطط يمثل الرئيس أنبوب الابتكار لو هاو :. "نحن نأمل أنه من خلال هذا API، بحيث يمكن لأي شخص تولي اهتماما لفي تطوير التعرف على الكلام في جميع أنحاء الصناعة."

وقال لو هاو، كانت صناعة التعرف على الصوت ليست مفتوحة وشفافة من التعرف على الكلام، من خلال "مؤتمر الإملاء" رسائل الصغير الصغير، يمكن للمستخدم يشعر حدسي الأداء الحقيقي لمختلف تقنية التعرف على الكلام، تنتمي هذه الصناعة أيضا إلى الاختلافات مستوى في أنواع مختلفة مفتوحة وشفافة من المرة الأولى الخوارزميات .

IFLYTEK وفقا لخوارزميات مختلفة الشكل BAT فرق كبير، في المرتبة IFLYTEK المعسكر الأول وفقا للخطط

"في الوقت الحاضر، هناك نوعان من الأخطاء المعرفية الصناعة التعرف على الكلام"، وقال لو هاو: "واحد هو جيد للغاية، وهذا هو، كل جيدة وليس هناك فرق، واحد هو الفرق المتطرفة التي لا يمكن أن تحل المشكلة."

والحقيقة هي أن " الرائدة قدرات التعرف على الكلام IFLYTEK لمن كثير من BAT . في السيناريو الاختبار، إلا وفقا للخطط وIFLYTEK بالإضافة إلى ذلك، معظم الشركات المصنعة للنسبة الخطأ خوارزميات غضب كلمة كبيرة ووسائل براعة أن المشهد ضعيف. "

وفقا لالصينية خوارزميات التعرف على الكلام الخريطة الاطلاق، مقارنة مع زعيم الأصلي في هذه الصناعة، ليس فقط بشكل ملحوظ تحسين دقة التعرف، ولكن أيضا على نموذج خوارزمية واحد، هناك جيد جدا متعدد المشهد أداء التطبيق.

يعتقد عموما أن التعرف على الكلام معدل خطأ كلمة الصيني أقل من 3 دون التأثير على القراءة، في حين أن أكثر من 15 ليست القراءة. هذا هو التعرف على الكلام اثنين من الخطوط الحمراء، وفقا لسيناريوهات مختلفة، وأداء خوارزميات مختلفة قد تختلف بشكل كبير.

فرعية ثلاثة اختبار قاعدة البيانات المفتوحة المصدر في أكبر 2 AISHELL ، فضلا عن قرب الميدان مجموعة اختبار لهجة من طرف ثالث (لهجة)، القريب من ميدان دردشة مجموعة اختبار الهدوء (الدردشة)، ومجموعات برنامج اختبار الصوت، اختبار الهاتف الصينية في العالم مجموعة، بعيدة الميدان مجموعة الاختبار وسيناريوهات اختبارات أخرى، اعتمادا على خريطة هم في مستوى الرائدة في القطاع، وكلها تقريبا من نسبة الخطأ كلمة أقل من 15.

حيث، -2018A-EVAL AISHELL2 مركزية البيانات، دقة التعرف كما كان يصل الى 96،29 من نسبة الخطأ FIG كلمة 3.71، مما أدى إلى الثانية حوالي 20.

يعني ذلك أنه وفقا للخطط فعل الصف الأول (حتى الرائدة) المستوى في مجال الصوت، في تطبيق متعددة المشهد، ولكن أيضا تعكس ميزة كبيرة.

قامت Microsoft اليسار واليمين هواوي، والاستفادة من سوق تكنولوجيا الصوت مع الخيال

"وفقا لمنتجات API صوت ومنصة مفتوحة للخريطة صوت فقط على الخط، ونحن نرحب المزيد والمزيد من المطورين والعملاء من خلال المنتج الشكل معا تحسين أداء المنتج، واستكشاف أكثر فتحا سيناريوهات التطبيق." وقال لو هاو، .

حول يتوقع أن إطلاق منتج صوت ومعالمه في المستقبل، وقال لو هاو، "في الواقع، ونحن نعتقد أن التكنولوجيا والمشهد هو أكثر أهمية من ميزات المنتج وعناصر تعزيز التطور التكنولوجي والتقدم، يمكننا أن نقدر أكثر الاحتمالات لم يسبق لها مثيل، من أجل حل العديد من المشاكل متصورا في السابق. اليوم، مع القدرة التعرف على الصوت من البشر هناك فجوة ضخمة، وفقا للخطط نأمل أن تكون قادرة على التكاتف والعمل معا على تعزيز التقدم في هذه الصناعة في هذه الصناعة. "

مؤتمر حول وفقا للخطط وأعلن الخدمات السحابية أزور ومايكروسوفت أصدر بالاشتراك منصة مفتوحة للصوت ، والرائدة في صناعة تكنولوجيا التعرف على الصوت قدرة مفتوحة لمطوري التطبيقات من طرف ثالث. وبالإضافة إلى ذلك، كما سيتم توسيع نطاق مايكروسوفت وفقا للخطط وفي مجال صوت ذكي أعمق التعاون وبناء AI البيئة.

أبريل 2018، هاري شوم، نائب الرئيس التنفيذي لشركة مايكروسوفت العالمية (اليمين) إلى الحصول وفقا للخطط. وفقا لالمؤسس المشارك للعلوم والتكنولوجيا، وقد وضعت الرئيس التنفيذي تشو لونغ (اليسار) خوارزمية التعرف على الوجوه في مايكروسوفت للبحوث آسيا (MSRA)، معلمه هو هاري شوم. وفقا لالمؤسس المشارك للعلوم والتكنولوجيا لين CHENXI وو مين، نائب الرئيس للتكنولوجيا الأعمال التجارية، ومدير الأبحاث تشو جيان، وأيضا من MSRA. المصدر: وفقا لخريطة تكنولوجيا

وفي الوقت نفسه، وفقا للخطط أيضا للانضمام هواوي أصدر بالاشتراك في "حل مشترك الذكي صوت" وتستند الخطة على منصة مفتوحة وفقا للخطط الصوت، والمشهد كله كومة الكامل هواوي التصاعدي (ارتفاع) أطلس 300 بطاقات مسرع منظمة العفو الدولية ورقائق لجانب مركز البيانات، وجهان قوية قدرات R & D وقدرات الخدمات البيئية العمق، تشكيل الأجهزة والبرامج تكامل حلول مشتركة، مما يساعد على تعزيز كفاءة التنمية.

منذ 2016 شريك، وشكلت وفقا للخطط وهواوي الربط الشامل. في مارس، وعلى الجانبين أصدر بالاشتراك مع "هواوي - البيانات سحابة كبيرة وفقا للمخطط من شريط فيديو صورة" الحل، وتخطيط الأمن العام العالمي على مستوى المدينة. في أكتوبر، خلال اقتران لهواوي 2018 كاملة من الجمعية العامة، وفقا لخريطة بمثابة الجمعية العامة، شريك الأمن فريدة من نوعها منظمة العفو الدولية، وهواوي أصدر بالاشتراك فرع سحابة الفيديو حلول مشتركة للشرطة الحكمة الحلول السحابية والحلول الحكمة الحرم الجامعي في مدينة آمنة، والحكمة من الشرطة جوانب الأعمال التجارية، ما زالت تطبيقات البيانات الكبيرة لتعميق التعاون.

9 أكتوبر، شو تشى جيون، رئيس الدورية هواوي (الثاني من اليسار)، رئيس هواوي آنبينغ أنظمة يو-كون، هواوي المؤسسة BG صناعة التسويق

وقبل ذلك، وهناك شائعات بأن خدمات أزور سحابة مايكروسوفت في مركز البيانات الصين سوف تستخدم رقاقة ارتفاع هواوي، لم يتم تأكيد هذه الانباء. ولكن هذه السلسلة من وضع وفقا لمايكروسوفت، هواوي سلسلة التعاون، لا يسعه إلا أن الخيال.

2018 الصين تحالف صناعة خطاب المؤتمر السنوي الأسبوع الماضي صدر "2017-2018 الصين ذكي صناعة صوت الكتاب الأبيض"، وذكية صوت نطاق عالمي واصلت الصناعات لتنمو وفقا 2014-2018، نما الصيني على نطاق صناعي صوت ذكي 30000000000-15970000000 $ يوان.

وقد ترك مايكروسوفت واليمين هواوي، جنبا إلى جنب مع التكنولوجيا الخاصة بها، وفقا للمخطط في صوت ذكي والبدء في وضع معا يد جيدة.

وأخيرا وفقا لرئيس قسم الابتكار لو هاو للعلوم والتكنولوجيا. وأضاف لو هاو وفقا للخطط في فبراير من هذا العام، قبل كانت جوجل عالم أبحاث. وفقا لمقدمة الرسمية في التكنولوجيا خريطة فقا، كان لو هاو مسؤولة خلال جوجل الروبوت APP بدء الفقس نظام التوصية، وهو أول المحمول محطة يبدأ APP نظام توصية في العالم، هو أيضا أول آلة الروبوت القائم في العالم منتجات التعلم. وسيقود هذا النوع من صوت ذكي تحاك حل مشترك وفقا للخطط وهواوي؟

وقال لين CHENXI أن أهل الخير يحتاج إلى المستقبل مع الخيال، كما شهد طويل تشو المقال، الكتابة، لأنه يعتقد - هذه الكلمات أصبحت الآن الرسم الأساسي وفقا للشعار.

"خوارزمية الخوارزميات ومعدل الاعتراف 99.99 من 99، والفرق هو أن التطبيق يمكن فتح موقع الحادث، حيث الخيال من القيمة التجارية للمشهد تكنولوجيا ردا على منظمة العفو الدولية ومتعددة يأتي ل".

"نحن نعتقد أن التعرف على الصوت الحالي لا يزال في المراحل الأولية للتنمية، وفقا لخريطة دائما الحفاظ على مستوى الاستثمار في التكنولوجيا، لفتح أكثر بفضل التقدم التكنولوجي، ورحب أيضا الشراكة معنا لاستكشاف تطبيق صناعة التكنولوجيا الكلام. وقال لو هاو ".

مذكرة

في التعرف على الكلام الإنجليزية أشار عموما "معدل خطأ كلمة" (WER)، لأن وحدة الحد الأدنى هو الكلمة، التعرف على الكلام الصيني عموما استخدام "معدل خطأ كلمة" (CER)، لأن وحدة الحد الأدنى هي كلمة.

AISHELL-2 هي قاعدة بيانات مفتوحة المصدر مؤسسة AISHELL وقذائف هيل خلق، فإنه يحتوي على 1000 ساعة البيانات الصوتية الصينية من 1991 متحدثين من الصين المناطق لهجة مختلفة تشارك في التسجيل، من خلال المراجعين صوت المهنية النسخ تميزت صارمة فحص الجودة، دقة قاعدة البيانات النص من أكثر من 96، تدوين تنطوي كلمة بعد، التحكم الصوتي كلمة، المنزل الذكي، من دون طيار الإنتاج، الصناعي وغيرها من 12 مجالا.

"ملك الحذاء" حسناء: ارتفاع أسعار أحذيتنا من الصعب لكننا لن تقوم الخصم!

[تذكير] 50000 زوجا من الأسباب الأزواج الطلاق من التعرض! خروج القطار عن مساره الأول ليس القاتل، ولكن ...

التعرف على الكلام واسعة منصة المنافسة لأول مرة، والاستماع الطيران وفقا للخطط مختلفة الخوارزميات BAT فرق كبير

ريال مدريد بطل السوبر، والموت "مارفل" الأب ستان لي

تجول الأرض لا تبتعد! أنها شينجيانغ Tiejing "ابنه الرضيع"!

عملت ما له الغناء! فاز "ثلاثة خيول" وراء أعمال منخفضة رئيسيا من هم؟

الدوري الممتاز الجولة 10 معاينة: نهاية التحوطية للحرب أو اضطراب، وإرسال لونينغ الحق في قمة الصحة؟

2018 نماذج الحصين S5 التسوق دليل دليل: السلطة خارج قوية، ما البيض؟

اقتحم الرجال داخل محطة وقود، ولكن فحص القيادة في حالة سكر

وجهة نظر وسائل الاعلام الاجنبية: 2018 في أمريكا الشمالية للسيارات الأكثر إثارة للاهتمام 5 سيارة

هاكا 1-1 Liaozu غاب عن القمة، وكسر وانغ لونغ راسل المخلص، تاتشر الرصاص مؤقت في A

[تذكير] 80 من الناس تفتقر إلى الفيتامينات، وتعليم الصورة التي تكونها