يجعل التفاعل الكمبيوتر عاطفة أكثر طبيعية، توني مستوى TTS تكنولوجيا أدخلت نظام التقييم

[شبكة الصيد سحابة (قناة الصغرى: ilieyun ) بكين 3] 5 مايو تقرير (النص / وانغ فاي )

AI التفاعل الصوتي في العملية برمتها في مواجهة التعرف على الكلام، التحليل الدلالي، والكلام تركيب الجبال الثلاثة، ونحن لا تزال بحاجة إلى لا ننسى القلب في وقت مبكر، نخفف إلى الأمام، من أجل الحصول على تجربة تفاعلية أكثر طبيعية، والكامل من العاطفة.

تحت سياق الصيني، هناك IFLYTEK، SinoVoice الخ مواصلة زراعة، التعرف على الكلام، مجال التحليل الدلالي، والتنمية السريعة. ولكن عندما والتفاعل مع الأجهزة الذكية، والعودة إلى الأذنين، لا يزال كامل من "الحس الميكانيكية من" عدم وجود صوت العاطفي. لحل هذه المشكلة، والبنية التحتية للمفتاح.

الصيد مستوى الشبكة السحابية اتصلت بوى تقنية مؤخرا هو التركيز على شركة خدمات البيانات الذكاء الاصطناعي، حقل وصوت عميق تجميع المحتوى التكنولوجي الرفيع، تحليل الارتباط والبحث المضني. في هذا المجال، توني التكنولوجيا القياسية لمساعدة العملاء لاستكمال المتحدثين الرئيسيين اختيار، الإحضار تصميم وحيازة خطاب ومعالجة البيانات ومعالجة الكلام وغيرها من عمق العمل، البيانات النص الإخراج، البيانات الصوتية وأنواع البيانات الأخرى.

وبالإضافة إلى ذلك، كما عرض قياسي بوى تقنية نظم التقييم TTS والحلول الأخرى ذات الصلة، لتزويد العملاء مع مجموعة كاملة من الخدمات المخصصة كلمة التوليف. ومن المعروف وفقا الشبكة السحابية الصيد لنظام التقييم TTS التي انطلقت رسميا اليوم.

القياسية قذيفة (بكين) والتكنولوجيا المحدودة بوى مستوى التكنولوجيا لفترة قصيرة، وقد تم تأسيسها في فبراير 2016، وقد نالت شركات التكنولوجيا الفائقة الوطنية في تشونغ قوان تسون شركات التكنولوجيا الفائقة. يقع المقر الرئيسي لمستوى بوى تكنولوجيا في بكين، وأيضا التخطيط في مدينة تشانغتشون، وتيانجين وغيرها من الأماكن، والفريق الحالي من 50 شخصا.

التركيز على الواجهة الأمامية التكنولوجيا تركيب الكلام لتوفير خدمات الصوت والبيانات المخصصة

خطاب التوليف المعروفة باسم TTS (النص إلى كلام)، ويشار إلى TTS، التي تنتجها وسائل التكنولوجيا الصوتية والالكترونية ميكانيكيا. ومن المعلوم أن التكنولوجيا خطاب التوليف بطريقتين، الأولى تسمى الربط. شظايا الكلام التي هي أساس كل سجل جيدة للجسم، ومن ثم إذا لزم الأمر، واستخدام الوسائل التقنية لتحديد واسترجاع وحدة الصوت، وتقسم إلى كلمات محددة، وهذا الأسلوب يتطلب كمية كبيرة من التسجيل الصوتي. ويطلق على الثانية طريقة المعلمة. على أساس محدود المعلمة البيانات الإحضار تدريبية نموذجية، تركيب الخطاب الجديد، ومزايا أسلوب حدودي يتطلب أقل عدد من التسجيلات، وآلاف الكلمات يمكن أن تؤثر على التوليف.

وقال مؤسس مستوى بوى التكنولوجيا وشبكة الرئيس التنفيذي لشركة ليو بو سحابة لمطاردة، "إما عملاء مع التكنولوجيا التوليف، ونحن لا يمكن فصلها عن خدمات الصوت والبيانات المهنية، في حين أن S & بوى التكنولوجيا هي بالتحديد المهمة الأساسية هي توفير البيانات الصوتية عالية الجودة بحيث يمكن للعملاء التركيز على تطوير التكنولوجيا التوليف، وإعمال السريع للنظام الاصطناعية عالية الجودة ".

وأوضح الشريك التقني القياسية التكنولوجيا قذيفة مياو Guanqiong أيضا أن "توفير البيانات الصوتية عالية الجودة ليست سوى نتيجة لذلك، العملية بما في ذلك تصميم جسم، التقاط الصوت، علامة الصوت والكلمة والإيقاع ملحوظ، صوت حرف العلة خفض الدرجات وحدة. والشرح اليدوية التقليدية يمكن أن يقال عمل كثيفة العمالة، وتوسيع نطاق ويصعب نسخ. ومع ذلك، نظام المعالجة على أساس عمق التعلم، وليس فقط يمكن أن تحسن بشكل كبير من دقة المعالجة التلقائية من خلال استخدام، كما يمكن تحسين كفاءة أكثر من 10 مرات، وبالتالي الحد بشكل كبير من البيانات تجهيز دورة ".

العلوم والتكنولوجيا توني يكون المهنية العمليات التجارية القياسية، وتنقسم الى تصميم جسم، واقتناء الصوت والبيانات تجهيز ثلاث وصلات. ويرجع ذلك إلى عملية معقدة، وبالتالي في جميع جوانب مراقبة الجودة، وأصبحت نوعية التكنولوجيا والخدمات قذيفة القياسية لضمان شريان الحياة. لإعطاء الممارسين فهم أفضل للعمليات التشغيلية والعلوم والتكنولوجيا وقذيفة مخصصة الصوت وخدمات البيانات القياسية، وخاصة تحليل المنتجة ذات الصلة، ويظهر جين على النحو التالي:

تصميم كوربوس: التنمية في وقت مبكر من جسم مختلف التصاميم لتلبية احتياجات العملاء، وذلك باستخدام متطلباتهم الإحضار الخاص في مختلف المجالات.

صوت اقتناء: صوت الاستحواذ في العملية برمتها من بين أكثر دقيق اختبار، والخبرة، والصبر، وجوهرها هو السيطرة على جودة التسجيل. لأنه عندما مكبرات الصوت في الاستوديو، وتسجيل لفترة طويلة، حتى مقطع من فهم الخطأ، سوف يؤدي إلى جودة الصوت النهائية من الصعب تلبية احتياجات العملاء. ثم تحتاج إلى أن يكون شخص ما، أشرف على العملية برمتها لضمان مصدر عالية الجودة من مقطع صوتي.

بعد الاستحواذ خطاب كاملة، سوف ندخل في سلسلة معالجة البيانات: تم سابقة التجهيز القياسي تقنية بوى بواسطة برنامج كمبيوتر، ومن ثم عن طريق عملية مثالية اليدوي. لأن العمل معالجة البيانات معقد للغاية، تعتمد اعتمادا كليا على الشرح اليدوي، فإنه سيكون غير فعال وغير واقعي. ومع ذلك، بعد الإجراءات القياسية السابقة، وكانت النتائج أكثر دقة، فإنه يمكن أن تحسن كثيرا من كفاءة، وكذلك الحد تدخل يدوي.

وفقا لمتطلبات العملاء الخاصة، كما يوفر معيار بوى تقنية توبي الملعب والخدمات وصفها.

صناعة بدءا نظام التقييم TTS، ولكن أيضا تساعد على تحسين النتائج التوليف

وبالإضافة إلى توفير الذكاء الاصطناعي المتطور الذي يتجاوز خدمات البيانات الأساسية، بدءا ملحوظ نظم التقييم بوى تقنية تحويل النص إلى كلام، ونظم لتركيب الكلام، وطرح TTS قدما مجموعة من الحلول الأمامية.

نظام القياسية قذيفة تقنية التعليقات عيوب تقييم الاصطناعية التقييم الطبيعية والاصطناعية من جزأين. حيث، مما تتألف من علم العروض من عيب الاصطناعية، polyphone والرموز والأرقام الأربعة خطاب حدة تجزئة، وإجراء تقييم للوحدات المذكورة أعلاه، أي defectivity TTS التقييم. استعراض تشمل طبيعية من توليفها MOS ABX والتقييم.

تقييم إيقاع: إذا حدث أننا علم العروض مستوى خطأ التنبؤ، سوف تؤثر بشكل مباشر على طبيعية وضوح الأحكام. هذه الوحدة 10 لتغطية مناطق مجموعة الاختبار، والواجهة الأمامية للTTS علم العروض نظام معالجة للتقييم، ومن ثم تحليل نتيجة المعالجة مقارنة، ويعرض المشاكل في نهاية المطاف TTS القاصي وجدت معالجة علم العروض للمستخدم، لتعكس معدل الصحيح المشكلة.

تقييم Polyphone: أكثر من النطق واحد هو عامل مهم آخر يؤثر على وضوح الأحكام. هذه الوحدة هي لتغطية أكثر من 100 polyphone مشترك اختبار مجموعة من TTS الأمامية كلمة نظام نهاية multitone تعليقات، وتمت مقارنة النتائج معالجة محاذاة لاحقة، يسمح في نهاية المطاف للمستخدمين بشكل حدسي فهم واكتشاف حيث TTS القاصي polyphone القضايا.

تقييم أرقام الرمز: عدد رمز من أنواع مختلفة، وغالبا ما تظهر في النص بطريقة متباينة في مختلف المجالات. التنبؤ رقم الخطأ علامة، سيكون له تأثير كبير على فهم الجملة والتعبير معاني. هذه الوحدة تغطي أنواع مختلفة من الأرقام والرموز والجمع بين مجموعة الاختبار، ورمز رقمي تحويل النص إلى كلام نظام الأمامية وحدة للتقييم، وعرض النتائج النهائية، مما يسمح للمستخدمين بطريقة هادفة إلى القضايا الرئيسية العنوان.

كلمة تقييم الكلام: وأجزاء كلمة التعبير بشكل صحيح أم لا، تؤثر على دقة الإيقاع والنغمة متعددة كلمة. التنبؤ كلمة الخطأ جزءا من الخطاب هو أحد العوامل الرئيسية التي أدت إلى إيقاع الخطأ، مما يؤثر على وضوح طبيعية والأحكام. اختبار هذه الوحدة، يمكن أن تساعد العملاء على فهم أداء هذه الوحدة، مما أدى إلى مزيد من التحسين.

ABX وMOS تعليقات: ABX MOS والتقييم، والتقييم، وطبيعية من TTS توليفها. ممثل من مختلف مجموعات المستخدمين المراجعين TTS الأفقية والرأسية على التوالي بطريقتين مختلفتين، الطلاقة وطبيعية من نظام TTS توليف للتقييم. والغرض منه هو للسماح للمستخدمين لفهم وتحسين القدرة التنافسية في السوق الفضاء من نظام TTS بهم.

اختبار شامل ومنخفض TTS صوت بوى تقنية للمستخدم، من الواجهة الأمامية للتجهيزها النص TTS، نص التحليل علم العروض التنبؤ التسلسل الهرمي لعوامل تحويل النص إلى كلام الملعب صوت والمدة وغيرها من المعايير الصوتية، ومثل التي تم إنشاؤها بواسطة تحليل مشفر صوتي العثور على مصدر المشكلة، وتوفير حلول لاقتراحات معقولة والأسئلة، وذلك لتعزيز تأثير التوليف.

تكنولوجيا شركاء التكنولوجيا مياو Guanqiong قذيفة القياسية، في وقت مبكر من عام 2002، بدأت أبحاثا حول صوت عملوا SinoVoice، بايدو، تلقت بايدو أعلى تركيب الكلام جائزة TTS. مع أكثر من 15 عاما من الخبرة في تحليل والميدان خطاب التوليف، تميز التكنولوجيا قذيفة على المنتجات صوت لتقييم نظام، وتحليل أسباب الكلام المركب غير طبيعي: قد يكون من سوء البنك جودة الصوت، ومشكلة تجهيز البيانات، الأمامية وحدة مشكلة أو أواخر الخوارزمية، من خلال نظام تقييم مهني يسمح للمستخدمين لفهم بسرعة مشكلة المفتاح نفسه ويمكن أن يكون مجالا للتحسين.

بالإضافة إلى تركيب الكلام، تقنية التعرف على، توني فريق المشروع القياسية، المزود الرئيسي لالتقاط الصوت، النسخ الصوتي، حاشية الصوت والتقاط الصور، الصورة علامات العمليات. من بينها، صوت جمع كل من اللهجات المحلية والفصحى، لغات الأقليات (التبت في Valemount)، الذين تتراوح أعمارهم مخصصة التقاط الصوت (مثل الأطفال)، وجمع العاطفي، فضلا عن لغات أجنبية (أكثر من 50 بلدا). عشرات حاليا، والتكنولوجيا قذيفة القياسية اكتمال مكتبة التعرف على الكلام، وجه الأطفال (زاوية وجه إيجابية من 90 درجة تتحول النار من اتجاه الجانب)، طريق (سيارة، الشارع)، وغيرها من التقاط صورة قاعدة بيانات مكتوبة بخط اليد.

وبالإضافة إلى توفير خدمات البيانات الذكاء الاصطناعي لأكثر من شركات معروفة، لديه بوى تقنية القياسية أيضا قاعدة البيانات الخاصة الكلام الطويل

نموذج الربح المذكورة، وليو بو الصيد الشبكة السحابية لمصادر، فإن الحالي القياسية بوى تقنية يوفر أساسا للأغراض العامة والبنك الصوت مخصصة soundbank نوعين من الخدمات المدفوعة، والسابق هو لتوفير صوت القياسية مكتبة بوى تقنية نفسه مباشرة إلى المشتري، بعد الذي يتميز يوفر بوى تكنولوجيا الأعمال التجارية مع المكتبات العادات السليمة وحلول الصوت بشكل عام.

حاليا، وتطويعه حيث مكتبة الصوت، S & بوى تقنية قد حققت نجاحا لتزويد المستخدمين مع 150 ساعة الصينية مكتبة الصوت مشاعر أنثى، 80 ساعة في مكتبة صوت الكانتونية، 50 ساعة اللغة الإنجليزية الأميركية مكتبة الصوت الإناث، قاعدة بيانات خطاب توبي لمدة 40 ساعة، 40 ساعة تقليد الأطفال صوت مكتبة، قاعدة بيانات خطاب الأطفال 30 ساعة، 20 ساعة البرازيلية قاعدة بيانات خطاب البرتغالية، 20 ساعة تايوان الماندرين مكتبة، 20 ساعة مكتبات نجوم صوت.

وبالإضافة إلى ذلك، والجوانب TTS الأمامية من مجموعة التدريب، ومجموعات التدريب 150،000 الإيقاع، 150،000 كلمة مجموعة التدريب على الكلام، وأكثر من 150،000 الصوت وتدريب مجموعة أحرف، 100000 مجموعات التدريب TN.

كما يوفر تقنية قياسية توني يانغ يانغ هان تشياو، ليو يان والنجوم الأخرى لجعل بايدو مكتبة الصوت خريطة، بما في ذلك التسجيل الصوتي وبعد معالجة البيانات. وبالإضافة إلى ذلك، تينسنت، قطرات، Jingdong والتكنولوجيا القلقاس Rokid، العاصفة المجموعة، اذهب واسأل، Sogou، Roobo الروبوت الهيمالايا FM والفهود وغيرها الكثير من زبائن خدمة الهاتف النقال، وإقامة علاقات تعاون مستقرة طويلة الأجل.

ومن الجدير بالذكر أن بوى تقنية القياسية الانتهاء من عشرة ملايين يوان قبل جولة من التمويل في سبتمبر 2017. عندما نكون قادرين على تزج نفسك في دردشة صوتية ذكية سلس للتفاعل مع المنتجات الطبيعية، وراء الكواليس العمل هذا هو بالضبط بمناسبة بوى تقنية كصوت ممثل التوليف مزودي الحلول.

المنتج: عادي بوى تقنية

الشركة: شركة شل القياسية (بكين) المحدودة للتكنولوجيا

URL: www.data-baker.com

أتى هذا المقال من شبكة الصيد سحابة، ينبغي للطبع، يرجى الإشارة إلى المصدر: HTTP: //www.lieyunwang.com/archives/407573

تشنغدو في مهدها منتجع لكمة تبين أن حولت الولايات المتحدة بناء المستقبل

كل صباح لتتمكن من إرسال واحد يترك سيد القط، من فضلك أعطني للفوز!

متوسط سعر 10000، في وسط المدينة أي نوع من المنزل لشراء؟

تشخص خطأ مستشفى فرنسي رجل أدين إزالة القسري في الخصيتين احتسب شكوى 200،000 يورو لمدة سبع سنوات

فقط! المدينة الخضراء، شرق الأصلي، Luhu ثلاثة مشاريع في نفس الأدلة، 19500 يوان / متر مربع من بينها!

الزيوت العطرية المطهر اليد، وغسل والمزيد من المزيد من الأرباح

وينبغي بذل هذه الأخطاء، لذلك كيفية الحصول على مقابلة؟

الرائد طرق جديدة؟ سامسونج غالاكسي S8 يشتبه تسرب هيكل سطح المكتب

تشنغدو البالغ من العمر 25 عاما سائق شاحنة فقدت شبكة الاتصال قبل نحو 4 أيام عن الناس ارتكاب منزل انتحاري

وانغ في المباراة الاولى هل سواريه عودة قوية! وانغ! وانغ! وانغ!

انخفضت 90! عملاق آخر، انخفض!

عندما التقت مئات الاعتداء الجنسي من الناس تجسد الشيطان العدل، ونتيجة لارتياح كبير!