ICLR19 الورق: صفارات يصبح سيمفونية، مفتاح الشبكة العصبية لتغيير النمط من الموسيقى | المصدر المفتوح

تونغلينغ غير معبد من الجزء السفلي من العطلة

إنتاج و qubit | عدد ملفه QbitAI

المصدر المفتوح مشروع بارد AI جديد الفيسبوك، وإعطاء مذكرة "خلع الملابس".

تحويل خيط رباعيات أنه هايدن في الأنشودة باخ، بيتهوفن على البيانو. دع الغيتار الكلاسيكي، الذي تحول إلى سيمفونية موزارت أنيقة.

حتى أنت همهمة عرضا صافرة، بعد تجهيز AI والتحول، يمكن أن تصبح سيمفونية موزارت.

هذا هو سيد P الصوت صناعة الموسيقى منه.

حاليا، تم استلام الرسالة من هذا المشروع ICLR19، حصل أيضا على جائزة تورينج، ما يقرب من 600 دراسة معمقة حول دانيال تشان يان إعادة تغريد، تويت LeCun من.

هذه المرة، والذي يستطيع أن يقول لم يكن لديك موهبة موسيقية؟

سر الصافرة تغيير الموسيقى

في ورقة والعالمي شبكة الترجمة الموسيقى، تفاصيل أربعة باحثين فيسبوك معهد AI المبادئ الكامنة وراء ذلك.

دع تغيير نمط الموسيقى، وحتى تصبح سيمفونية سرية من الصافرات، كانت مخبأة في تحويل الموسيقى عام في الشبكة.

هذا هو وسيلة لتحويل الموسيقى تمتد آلة موسيقية، والنوع والأسلوب، على أساس التحول متعددة المجال من Wavenet من التشفير. هذا هو النموذج الأصلي الموجي الصوت مولد وضعت من قبل جوجل، وتوليد الموجي السرعة، وتأثير واقعي.

وبالإضافة إلى هيكل عن طريق Wavenet، لديه شبكة التبديل أيضا المشتركة بين التشفير الموجي ونهاية إلى نهاية القطار إزالة التغليف الفضاء الكامنة (فصلها الفضاء الكامنة).

 العمارة نموذج فيسبوك يونيفرسال ميوزيك تحويل

هذا هو عبارة عن شبكة التشفير التفاف كامل، والذي يتألف من ثلاث كتل، يمكن تطبيق كل كتلة تحتوي على طبقة المتبقية 10، إلى أي طول التسلسل.

بعد ذلك، كل طبقة تحتوي المتبقية لزيادة حجم الأساسية مع زيادة التوسع في الإلتواء، وRELU عنصر غير الخطية، هناك التفاف من 1 1، وعرض ثابت من 128 قناة.

عن طريق نشر مجموعات متعددة من بيانات التدريب وقدرة كبيرة للشبكة، مستقلة التشفير مجال الموسيقى دعم تحويل إلى نطاق الموسيقية لم أر خلال التدريب. لا تعتمد هذه الطريقة تعلم غير مراقب على أمور المجال أو النسخ الرقابة الموسيقى مطابقة على العينات.

واستخدم الباحثون تنطبق DeepMind صوت المزج NSynth ومنهجيات لتقييم هذه البيانات على الموسيقيين المحترفين الإنسان من مجموعة البيانات.

وقد سجل الباحثون فاكتويدس MOS عشرات الصوت (متوسط الرأي النتيجة)، فقد بينت النتائج، يظهر نموذج جودة الصوت أقل قليلا من جودة الصوت للاعب البشري.

الباحثون ثم تقييم علاقة طبيعية بين الموسيقى والبشري الجيل نموذج عزف الموسيقى في ظل ظروف مختلفة.

وأظهرت النتائج، أعلى AI من تسجيل الموسيقى ولدت البشرية.

بوابة

ورقة:

https://arxiv.org/abs/1805.07848

المصدر المفتوح العنوان:

https://github.com/facebookresearch/music-translation

بلوق الرسمية الفيسبوك:

https://research.fb.com/publications/a-universal-music-translation-network/

- انتهى -

التوظيف الصادق

المكدسة تقوم بتجنيد محرر / مراسل، ومقرها في تشونغ قوان تسون في بكين. نتوقع الموهوبين والطلاب المتحمسين للانضمام إلينا! مزيد من التفاصيل، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "تجنيد" كلمة.

و qubit QbitAI عناوين على التوقيع

' " تتبع تقنيات AI دينامية جديدة والمنتجات

هاردن يريد أن يمسك الاردن براينت؟ عليك أن تتجاوز هذا الرجل، لا خارقة البيانات الهوى

إذا كان طومسون المنزل هذا الصيف، وقال انه من هو على الأرجح المنزل في المرة القادمة؟ لوس انجليس ليكرز 20 المرتبة الاحتمال الثالث

أوسكار الأرصاد حفل أزياء مبالغا فيه اللعب: تطور عرض للأزياء في LADYGAGA، لي ليو ون بارد شفط العين

زي يوان خلفية عانت أنبوب آخر من أسفل، من سن مبكرة والعشاء نجم؟ أكثر بكثير من قوة الصقيع صديقها السابق

الدوائر المتكاملة عملية التصنيع من الدخول إلى الرئيسي

ما هي العبقرية الحقيقية! أخي 10 سنة ممارسة خطابات الكرة في مستوى MVP، فإنه كان يلعب سنتين على المنتخب الوطني

MLXG إلى الألعاب ثم تعيين الرجل؟ شقيقة عقيمة السيطرة مطاردة من قبل صديقته، لتجد لاعب محترف عندما صديقها؟

AI المنطقة البحرية تعليق، لقد كان من الصعب جدا اكتشاف | تجريبي للعب

جيانغ جين شيه ألف سنة "لوتس" أسطورة المشهد الشاهد الإنسان

الثلاثي المنطق هو أقرب إلى التفكير في الدماغ البشري، لماذا لا؟ أسود سر تقنية ذات مرة: الكمبيوتر الثلاثي

خمسة NBA الرجال اللباس المد: هاردن هو الأكثر صاروخ جميلة أبردين، واد هو مجرد المد دعوى

PDD الحديث سباق الحملة، YM مع خارجي لعبت عشر مرات! اللاعبين Fanzao استجواب، ولا عجب حتى طاغية المحلية؟