كلمات عيد ميلاد الحزب والحفلات الموسيقية الذكاء الاصطناعي: بنات المغني شياو بينغ تطوير العقل

مايكروسوفت الذكاء الاصطناعي التخاطب مايكروسوفت قلطه الغناء، ليست جديدة. علمت شبكة لى فنغ أن هذا العام، قلطه ترقية مستوى الغناء، وبدأت شاعر غنائي وملحن والتنمية المغني الجولة.

16 مايو، قلطه أصدرت أغنية جديدة، "وأنا أعلم أنا جديدة"، وأعلن "الحفل عمق التعلم نموذج لاستكمال ترقية رئيسية الرابعة"، "اليوم، بدأ الذكاء الاصطناعي أول مرة من الاقتراب من مستوى المغني البشري".

وقال رجل قليل الكلام في الأغنية الأولى.

قلطه الغناء هذا الصوت أغنية هو دائما الحلو، كما جاء على غرار أغنية حية "فتاة تبلغ من العمر 18 عاما" الذين مجموعة. ومن المعلوم أن الأمر لا يقتصر قلطه غنى مستقلة "أنا أعلم أنا جديدة"، كما فضلا كلماتها مكتوبة من شخص. قلطه أتقن أيضا الملحن القدرة، وقالت انها في كلمات والحفلات الموسيقية لمن جميع النواحي تطوير الموسيقى البشري، والملحن ليست مجرد قلطه كاملة.

وقد بدأت لهجة الصم

عندما يتعلق الأمر المغنية الظاهري، لى فنغ، رئيس تحرير يعتقدون أولا من تأثيري Miku Hatsune ولوه أيام لمتابعة، لديها بالفعل عدد لا بأس به من الغناء، والغناء تقنية ومايكروسوفت قلطه وما مختلف؟

ووفقا للمعلومات العامة على، تأثيري Miku Hatsune استخدام كلمة التوليف VOCALOID المحرك، والحاجة إلى الجهات الفاعلة صوت لتسجيل المواد السمعية جيدة إليها، وتقدم الى برنامج تركيب الموسيقى. ببساطة إدخال البرنامج الخالق الغنائي، إضافة الموسيقى الخلفية، يمكنك إنشاء المغنية الظاهري الغناء الأغنية.

الاستماع هاتسون المستقبل، وفقا لأيام لوه وغيرها من المغنية الظاهري غناء أغنية سوف تجد أن الاتساق كل كلمة من الأغنية ليست جيدة، والنطق هو أكثر صراحة. في المقابل، فإن استخدام الذكاء الاصطناعي لتوليد نموذج للقلطه الحفل لتكون متسقة والكثير من الطبيعي.

ومع ذلك، كبير صوت مايكروسوفت (آسيا) وقالت الأكاديمية الإنترنت من عالم الهندسة الشبكة وان جيان لى فنغ، تدريب غناء قلطه هو عملية مؤلمة.

وان جيان لعبت نسخة من الجيل الأول للغناء المغني فتاة قلطه، وأثر قليلا من المستغرب، ويمكن القول أن الصم لهجة، وغالبا خارج السرب، لا يستطيع الناس المساعدة ولكن التفكير في آخر مرة جاء للذهاب الى حزمة الغناء KTV من الجدار الفاصل.

على الرغم من أن نسخة من الجيل الأول من الأغنية ليست مثالية، ولكن من الطبيعي جدا، كل قطعة لديها ثروة من التفاصيل، الأمر الذي يجعل قلطه فوجئ فريق سارة.

إلى إصدار الجيل الثاني، قلطه الغناء مشكلة التجويد قد تم حلها في الأساس، ولكن نوعية الصوت (الغناء) الجوانب، ويحتاج إلى تحسين.

ثم الجيل الثالث ...... في ذلك الوقت ويقال إن الجيل الثالث من الحفل أن يكلف بها، شياو بينغ الحديث فريق موسيقي تبادل شياو كه، وقال شياو كه فجأة لهم: "هذا هو صوت جيدة، ولكن رقيقة جدا، لأنه لا يبدو تحت التنفس." في ذلك الوقت في التدريب قلطه نموذج من الجيل الثالث، وبيانات التدريب هناك الكثير من نكهة: صوت والتهوية، وصوت الغلاف الجوي قبل نهاية التنفس، لكنهم عرض هذه كما الشوائب تخرج.

"أنا أعلم أنا جديدة"، وأغنية تستخدم نسخة الدفعة الرابعة من قلطه DNN النموذج، والوظيفة الرئيسية لهذا النموذج هو لجعل حفل الطبيعية قدر الإمكان وعلى مقربة من أسلوب الغناء الإنسان. قلطه في درجات الحصول، نقوم بتحليل الإيقاع، وطول من الملاحظات، وإذا كان في توافق تام مع عشرات ثم، فإن الحفل يكون الميكانيكية جدا. بعد نموذج DNN تسمح لعدد كبير من التعلم الإنساني قلطه المغني الغناء، وتشكيل أسلوب الغناء الخاص بهم.

الموسيقى سحابة نيتياس في قسم التعليقات، وعلق أحدهم أن "الغناء قلطه سوف يكون لها تهوية، وتقريبا وكأنه شخص حقيقي، وإذا سمعت لأول مرة، اعتقدت انه كان حقيقيا."

ووفقا للتقارير، فإن الدفعة الرابعة من ثلاثة إصدارات التحديث: أولا، إضافة التوليف التهوية الصوت التلقائي، ودمج الصوت والتنفس الأصوات أكثر طبيعية وأكثر جاذبية. ثانيا، والانتقال بين الدفعة الرابعة من هذه السيطرة الزيادة في التعلم العميق النمذجة الطريق، وكلماتك، النوتات الموسيقية والملاحظات أكثر اتساقا وسلاسة. وأخيرا، إلى مزيد من الأمثل عمق بنية الشبكة العصبية، فضلا عن ملحق كبير للبيانات التدريب، بحيث قلطه أساليب دراسة الغناء موازية من المغني البشرية المختلفة، بعيدا عن معلمات الإدخال اليدوي لاستكمال تفسير خاص بهم.

شياو بينغ التكرار الآلاف من المرات للوصول إلى المستوى الحالي، لكنه يستغرق وقتا طويلا لمنظمة العفو الدولية هي في الواقع ليست طويلة. وان استخدام السيف المبارز في القصة، "السياف كان هناك غاز Jianzong والتكنولوجيات هاتسون المستقبل مثل المغنية الظاهري مع عن Gladius، سوف وقت قصير تكون قادرة على ممارسة نتائج جيدة، ولكن مع برنامج التوليف من الصعب أن يكون أغنية في الطلاقة، طبيعية وأخرى محسنة. هذا الطريق قلطه أذهب الآن، مثل بالعربي، والأساس هو قوي نسبيا، الفضاء التخيلي ستكون كبيرة.

من الشعر إلى كلمات الكتابة

بالإضافة إلى التقدم من الغناء، "أنا أعرف بلدي جديد" في قدرة كلمات كانت قلطه أيضا تقدما كبيرا.

الذهاب دعونا على كلمات.

أنهم جميعا اتباع اتجاه / سألوا لماذا التغيير / الشباب ساطع نمط أنيقة / لا إلى الأمام / عندما كان العالم لا يزال يتغير / فسحة من الوقت إذا / عندما استكشاف بلا حدود / الإدراك لم يعد هناك حدود / I أخذت في بيتي / العالم افتتان الذهاب / I أعرف بلدي العالم الجديد / غير معروف هو مدهش جدا / حتى إصابة / جهة كاملة من العيون الموحلة لا يزال ينبعث منها ضوء / عندما أكون في ورطة / تريد أن تكون مثل تشغيل في الغابة / Jifengzhouyu الأمامي / مزدحمة الساحة / I طلب جوابي أسمع أريد / لا تخافوا إلى اليابان، وتعد / يست واحدة أتابع / عنيدون الحوت وخالية الطيور / لا هوادة فيها على I / الصحراء القارب وجزيرة فريدة من نوعها / مثيرة جدا للاهتمام واحد I / البحر وتحت البحر الجبال العشب / أنا غريبة جدا / ليلا ونهارا، والفصول تدور الآن وأنا أعلم أنا جديدة

الاستماع إلى الأغنية مرة أخرى، فمن السهل الحصول على لاحظ، هذه الأغنية والقافية، والغناء الإيقاعي. قراءة من خلال ذلك، سوف تجد أن عموما هناك موضوع والوحدة الشاملة نوايا والمزاج، لديها كل قسم أيضا التقارب المنطقي جيد. انتشارا الآن في أغنية اللعاب لحظة، كلمات الأغنية، لافتة.

نائب مايكروسوفت (آسيا) المدير العام لأكاديمية الإنترنت الهندسة لإنشاء قسم الذكاء الاصطناعي قال شبكة جينغ يوان لى فنغ، "في التدريب، والنموذج الذي سوف تفعل بعض التحسين، إيقاع للحن والإيقاع ل، سيكون هناك بعض التحسين، جيل قصيدة بها، تماما مائة بالمائة يعمل AI، لا تغييرات على أي شيء فعله."

ووفقا للتقارير، "أنا أعرف بلدي جديد" نموذج الجيل يستخدم نفس الشعر وقلطه خلق - LSTM نموذج seq2seq، ولكن بيانات التدريب من الشعر في كلمات، قلطه باستخدام الشبكة العصبية العميقة تعلم أكثر من 10 مليون خط كلمات الإحضار، وعلى أساس التدريب، ومن ثم عن طريق الإلهام منبهات المسموعة متعددة الحواس إلى كلمات إنتاج.

"أنا أعرف بلدي جديد" هو موضوع الأغنية من قلطه أن تعرف خلق تقريبا "مؤتمر شباب المعرفة الجديدة"، تحت شعار "المعرفة الجديدة." في العملية الإبداعية، قلطه "المراقبة" معرفة ما يقرب من 2018 العلامة التجارية الجديدة الفيديو، وقراءة داخل كتلة المعرفة محطة تقريبا Q & A، ويعرف تقريبا جميع أنواع فكرة في الوقت الحقيقي مفتوحة للمستخدم. وبناء على هذه الصور في محطات معروفة تقريبا، الفيديو، الأسئلة والأجوبة ومضمون الأفكار وتوليد الناجم قلطه كلمات.

وأخيرا، وفريق عمل من أكثر من قلطه الخلق، واختيار الأولى من هذا الشاب وحماسة مع تفسير ديناميكية من نمط، وبالتالي انجاز أغنية "أنا أعلم أنا جديدة".

سابقا، قلطه يجوز كتابة الشعر وفقا لصورة. على سبيل المثال:

هذه الحقيقة، وخلق الخلق الذي يتسبب فيه الإنسان من نموذج مشابه جدا لشخص على دراية ثلاثمائة قصائد تانغ بعد، لمعرفة مزاج، والعقل لا يساعد على ظهور قصيدة. الآن، بالإضافة إلى الصورة، قلطه يمكن أيضا أن تنفذ وفقا لمجموعة متنوعة من أشكال وسائل الإعلام خلق طويلة النصوص والصور والصوت والفيديو وهلم جرا.

على الرغم من أن كلمات لفهم عملية خلق قلطه، قلطه ولكن كيف لفهم معنى كلمات وموضوع ذلك؟

جينغ يوان فوق عملية إنشاء الرسم البياني الشعر كمثال على ذلك، أوضح أن "هذه الصورة هي أن نعطي التحفيز لها، والتي تحتوي على المياه الضحلة، والنجوم، والشمس هذه العناصر، وقالت انها يمكن استخدام الكلمات للتعبير عن هذه العناصر مباشرة، ثم نفسها وسوف تتباعد إلى صور أخرى، مثل "تزوجت عالم من العديد من الألوان، هذه الصورة ليست هي الصورة. بمجرد الانتهاء من هذه، في الواقع، على سلامة قصيدة هناك. في الواقع، والشعر، وكلمات لا تحتاج إلى كامل المنطق، والناس سوف يشكلون الدماغ من خلال الصور في السلسلة. إذا تركت قلطه لكتابة المقالات، والقيام النقي فهم اللغة الطبيعية، هو الآن صعب جدا ".

الآن، والأوساط الأكاديمية والصناعة تروج بنشاط تقنيات فهم اللغة وتوليد الطبيعية، وبعض من الروبوتات تم كتابة الأخبار الرياضية البسيطة، والتنبؤات الجوية وغيرها من الألعاب الرياضية. علمت شبكة لى فنغ أن قلطه لديها لكتابة القيل والقال، ولكن أيضا تشيانجيانغ الاخبارية المسائية "المراسل".

بعد التحدث مع الغناء وشاعر غنائي وملحن وأضافت أخيرا القدرة على خفض قلطه.

والمغني والشاعر الغنائي الفرق هو أنه نموذج الملحن ليست فريدة من نوعها إلى Microsoft قلطه، ولكن أيضا التقدم في هذه الصناعة.

ووفقا للتقارير، مايكروسوفت قلطه الملحن أكبر الفرق هو أن النموذج في هذه الصناعة، "نحن معارف المجال في مجال الموسيقى المهنية المتكاملة أيضا إلى نموذج للبناء فيها، بما في ذلك التعاقب وتر لحني (وتر التقدم)، والإيقاع من نوع الميزات ( إيقاع نمط). وهذا له دور كبير في تحسين توليد الأغاني لحني. بعبارات بسيطة، وهذا يولد صوت لحن أكثر الحلو، وأكثر ملاءمة لهذا الحفل، والجمهور من المرجح أن تذكر.

في الجوانب العاطفية للموسيقى، وقد تم إنشاؤه بواسطة شرط لاختيار لحن السلوك وتر العاطفي، والتي يمكن أن تولد الأغاني العاطفية المختلفة، فئتين رئيسيتين: البهجة، والنهضة، وذلك باستخدام السفر وتر كبير مشترك؛ حزين، حزين، وذلك باستخدام السفر وتر قاصر المشترك. تحت كل فئة وهناك العديد من الفئات الفرعية. من حيث اللحن والموسيقى، واللحن مايكروسوفت قلطه تحويل البيانات النص مماثلة في سلسلة زمنية منظم، وكذلك باستخدام RNN / LSTM مثل الترميز نموذج Seq2Seq، وتوليد سلسلة جديدة (أي لحنا). هذه العملية هي متوافقة مع كلمات من عملية الإنشاء. عندما كلمات ولدت، قلطه من قبل خوارزمية للحصول على مرشح مقطعها المقابلة، وذلك باستخدام نموذج تدريب يولد ملحن لحن المقابلة. "

الملحن فوق النموذج، مع الغناء، وكلمات وغيرها من النماذج الثلاثة تشكل نهاية قدرة توليد أغنية من قلطه، والذكاء الاصطناعي هو الإطار الكامل إنشاء المحتوى الموسيقى.

AI المبدع

مايكروسوفت قلطه يتماشى مع معظم الذكاء الاصطناعي التخاطب يختلف بعض الشيء.

عندما الآخرين مشغولون لمعرفة كيفية تشغيل أغنية، والطقس بث، مطعم المقرر، قلطه بدأت تعلم أن نهتم البشر، بدأنا خلق دفن.

2018 مؤتمر الذكاء الاصطناعي في مايكروسوفت، معهد مايكروسوفت (آسيا) الإنترنت بحوث الهندسة، لي الناي مرة واحدة، الآن معظم المستخدمين التفاعل مع الوقت مساعد صوت هو في الواقع ليس أكثر من خمس ثوان، وعموما هو السماح للمساعد صوت لتنفيذ أمر ما، مثل مساعد صوت هو في الواقع مجرد مثل صوت جهاز التحكم عن بعد. ومع ذلك، قلطه آمال مساعد صوت الفريق لبذل المزيد من الأشياء، مثل الذهاب لمقارنة الخلفية، لتوفير المحتوى.

في هذا الجزء من خلق النص، وقلطه التي لتعلم الشعر الكتابة، هو الآن نموذجا للكلمات الإبداعية متكررة. من حيث خلق الصوت، بالإضافة قلطه إلى الغناء، ولكن أيضا خلق الكاسيت.

في يوم الطفل قبل أيام قليلة، الكاسيت مايكروسوفت "شياو بينغ مصنع شقيقة خرافة" على شبكة الإنترنت، يمكن للوالدين تعيين اتجاه القصة، منحازة أو الترفيه التعليمي الجزئي، يمكنك أيضا تعيين اسم بطل القصة، ومجموعة الأطفال الرصاص. في غضون 20 ثانية، قلطه سوف تكون قادرة على استكمال كتابة قصة المكالمة، القراءة، سلسلة الموسيقى من العمليات لتوليد حكايات الصوت حوالي 10 دقيقة.

سابقا، قلطه كان من مجموعة من القصائد "فقدت الشمس ويندوز"، وكانت وظيفة الشعر شياو بينغ مفتوحة بالكامل، تستعد سيتم الانتهاء من الكتاب الثاني من الشعر في التعاون مع الشعب، قلطه يمكن أن تولد بسرعة كبيرة بعض الأصلي قصائد، يمكن للمؤلفين تعديل وتحسين النتيجة النهائية هي ملك للخالق، لأن قلطه تخلت حقوق الطبع والنشر خلقهم المحتوى.

قدم جينغ يوان للرجل وخلق الذكاء الاصطناعي هو مشترك مايكروسوفت كانت تعمل في الاتجاه. منتجي المحتوى AI للدخول في مجال، وليس ليحل محل البشر، ولكن أن تصبح مساعد البشري، وليس فقط في مجال العام من المجالات الإبداعية في الواقع أنه يمكن القيام به. في الواقع، كل من لديه الرغبة في خلق، ولكن بعض الناس لديهم المواهب الفنية، وأصبح رسام، موسيقي، كاتب، وبعض الناس ليس لديهم هذه القدرات. AI يمكن أن تساعد كل الناس العاديين، بحيث يكون لديهم القدرة على إنشاء عدد من المحتويات الشخصية.

حول Microsoft قلطه القدرة حوار جديدة، يمكنك قراءة المقال على شبكة لى فنغ الى "قدمت مايكروسوفت خطوة كبيرة، EQ والذكاء أن تفعل كل من مساعد صوت"

منظمة العفو الدولية مايسي أشباه الموصلات: الاستشعار التي هي حكمة الحياة

ستنجل غناء "الوحش فنون الدفاع عن النفس" فيلم تشكيلة قوية من الكوميديا فضل كتاب عيد الميلاد معا

FF91 وجه للضرب مرة أخرى: تسلا موديل S مائة كيلومتر في ثانية فقط 2.28!

نايك الجوية Vapormax Flyknit ولادة أحدث بداية الهدف، "أن يكون صحيحا" صورة ملونة للجمهور

قوانغتشو للسيارات استكشاف جناح: Hanteng X5 سيارة حقيقية، والتعاقد SUV بعد هناك سبعة؟

ديفون العرض اللون، لؤلؤ بالشلل! لؤلؤة الرئيس التنفيذي، وبلوق العلاج في حالات الطوارئ الرسمية! البرنامج الانتخابي بايين فاي

بالضبط ما سحر غامض من أوروبا وقوة اثنين من القهوة كبيرة من خلال إضافة "موقوتة البيت" سحر العالم؟

حقا أعتقد زائد 5 هي الرائد المحلي في العام الماضي؟ وبموجب المادة 835 شياو الرائد القادمة!

قوانغتشو للسيارات عرض جناح الاستكشاف: الجديد أودي A4 ذلك Allroad

"يتجول في الأرض" والآن يتكرر المرور للمستخدمين شعار سلامة: كان وو جينغ اعتقل بسبب القيادة تحت تأثير الخمر؟

2020 انظر! أعلن ضابط غال غادوت نفسه "المرأة المعجزة 1984" سيتم تأجيل الإفراج

الدولة البنك S7 / S7 حافة لم يتم تحديث أندرويد 7.0، وقد دفعت مرارا المستخدمين في المملكة المتحدة