"دعونا الشبكة العصبية يمكن أن" حس مرافق "" MIT وجوجل بحث النص على اتصال والصوت والفيديو

الشبكة العصبية تعلم شيء ما، هو عن طريق تعزيز الاتصالات بين الخلايا العصبية، أن أوزان تعديل لإكمال. وهذا يعني أيضا أنه بمجرد علمت الشبكة العصبية أن تفعل شيئا، وصلات بين الخلايا العصبية ثابتة أيضا، لذلك دعونا هذه الشبكة العصبية تعلم أن تفعل شيئا آخر، فمن الضروري تغيير اتصال / الوزن القائم، تماما أن يكون "المنسية" لقد تعلمت المعرفة.

وتعرف هذه الظاهرة باسم المشاكل "النسيان كارثي" (النسيان كارثي) الباحثين الذكاء الاصطناعي. في مارس من هذا العام، الذكرى الأولى لانتصار في الوقت AlphaGo، نشرت DeepMind في نتائج البحوث PNAS، واستخدام التعلم تحت إشراف وتعزيز التعلم، والشبكات العصبية بحيث النجاح حين تعلم مهام جديدة، وينسى بعثة القديمة، نحو التعلم التكيفي اتخذت المهم خطوة، كما ثبت كارثية المنسية ليست مشاكل مستعصية على الحل.

على وجه التحديد، عندما يتعلم الباحثون DeepMind من مبادئ علم الأعصاب، نستلهم من أدمغة الثدييات والبشر علاج المعرفة النظرية السابقة، واقترح "مرونة الوزن علاج" (مطاطا الوزن توطيد، EWC) طريقة، والسماح للنظام تعلم اللعب بعد لعبة، مع عدم إغفال محتويات تعلمت سابقا والاستمرار في تعلم العزف على لعبة جديدة.

في وقت نشر هذا الإنجاز، ويقول الباحثون DeepMind عملهم أثبتت أن الشبكة العصبية يمكن أن يحقق التعلم متتابعة، ولكن كفاءة التعلم ليست واضحة ما إذا كان هناك المصعد.

في الآونة الأخيرة، دراستين MIT وجوجل هي من، مزيد على هذا الأساس، بحيث نظام الذكاء الاصطناعي لمهام متعددة كاملة في نفس الوقت. من بينها، كما كشفت أبحاث جوجل المهام الفردية كاملة المقابلة لوحدات التعلم منها وصلات فعالة. فهي نظام الذكاء الاصطناعي نحو "العالمي" "عز وجل" وضعت أساسا هاما.

معهد ماساتشوستس للتكنولوجيا دراسة: لندع الشبكة العصبية لديه القدرة "محاسة"

وكان نيو جي وون جوجل كانت التقارير ذات الصلة، لذلك، فإننا ننظر أولا إلى دراسة معهد ماساتشوستس للتكنولوجيا.

وقال يوسف ما بعد الدكتوراه Aytar في مقابلة مع مقابلة QZ المؤلف الأول للدراسة MIT مفتاح أبحاثهم هو "ثابت" (محاذاة).

في هذا العمل، لم الباحثين MIT لا نعلمهم شيئا خوارزميات جديدة، ولكن لخلق وسيلة لكسب خوارزمية يمكن أن تشكل مفاهيم مختلفة - الأصوات والصور والنص - مرتبط. على سبيل المثال، أدخل نظام الصوت كرة القدم إخراج الصوت المرتبطة قسم آخر من كرة القدم، وكرة القدم أيضا الصور المخرجات ووصف النص.

لتدريب النظام، وقد أثبتت الباحثين MIT أول فيديو والصوت المرتبطة بالشبكة العصبية. أولا، سوف الكائن الشبكة في شريط الفيديو والصوت من الصوت المرتبطة به، ومن ثم محاولة للتنبؤ التي ترتبط الأشياء التي الأصوات. على سبيل المثال، في وقت ما الأمواج والصوت.

بعد ذلك، فإن الباحثين وضعا مماثلا مع مخطط الصورة التي يتم إدخالها في الشبكة، بحيث يمكن وصفها الخوارزمية في الكلمات والأفعال المرتبطة الكائن. أولا، تعترف الشبكة كافة الكائنات في الصورة والصوت في جميع الكلمات، ثم إلى كلمات المنتسبين والكائنات.

بالإضافة إلى الإخراج إدخال الصوت والصورة والنص، قام الباحثون أيضا تجارب أخرى، مثل دخول صورة تشيهواهوا، الخوارزمية يمكن أن يكون الناتج مع فترة من (أنواع أخرى من) الكلاب ينبح الصوت والصور وأوصاف كلب الكلاب الأخرى النص.

وهذا يعني أن الدراسة MIT، بعد استخدام الصوت والصور، وكذلك الصور التدريب والنص، ونظام الصوت والنص غير قادرة على متابعة المباراة، ولكن لم يتم الاتصال به من قبل النظام . وقال الباحثون إن هذا يدل على أن نظام يولد مفهوم أكثر موضوعية، سوف تكون قادرة على رؤية وسماع أو قراءة المعلومات إلى معلومات الاتصال المنتسبين إلى الوقت لا يتوقف فقط على التدريب.

في مقابلة مع مقابلة QZ، قال Aytar :. "النظام يعرف هو حيوان، فإنه يعلم أن الحمار الوحشي سوف تنتج الصوت، ولكن أيضا معرفة طبيعة هذه المعلومات هو نقل عبر الوسائط (عبر طرائق)" على افتراض أن الخوارزمية يمكن تأسيس اتصالات جديدة بين المفاهيم المختلفة، لتعزيز فهم العالم.

جوجل أبحاث الدماغ: نموذج العميق التعلم والصوت والصورة والنص "يأخذ كل"

ربما كنت تعرف مسبقا، وذكر البحث جوجل قبل جي وون الجديد، و "مع نموذج لمعرفة جميع المشاكل" (واحد نموذج للتعلم منهم جميعا).

وقد اقترح الباحثون جوجل متعددة نموذج العمارة مناسبة المتعدد الوسائط، مع نموذج واحد من التعلم العميق، وتعلم مجموعة متنوعة من المهام المختلفة في مختلف المجالات.

على وجه التحديد، وجوجل زميل المتعدد الوسائط في حين أن التدريب على المهام الثمانية التالية:

(1) WSJ الإحضار

مجموعة البيانات (2) ImageNet

وقال (3) COCO مجموعة البيانات التي تم إنشاؤها في FIG.

(4) WSJ الدلالية تحليل مجموعة بيانات

(5) WMT الإنجليزية - الترجمة الألمانية كوربوس

(6) و (5) عكس ذلك: الألمانية - الإنجليزية الترجمة كوربوس

(7) WMT الإنجليزية - الترجمة الفرنسية كوربوس

(8) و (7) عكس ذلك: الألمانية - الترجمة الفرنسية كوربوس

FIG 1: MulitModel قادرة على أداء مهام مختلفة في مناطق مختلفة. من بينها، يمثل الأحمر المهام المتعلقة باللغة والأزرق للمهام المتعلقة التصنيف.

شيدت المتعدد الوسائط من أجزاء متعددة، مثل طبقات مختلفة من الالتواء، وآليات اهتمام الخبراء وطبقة هجينة. لم يتدرب كل جزء على مهام أخرى. على سبيل المثال، قد طبقة التفاف لم يتم التعامل مع النص أو الصوت المهمة؛ مزيج من طبقة الخبراء ولا صور معالجتها أو المهام المتعلقة باللغة.

ووجد الباحثون أن كل وحدة فردية للقيام بهذه المهمة المقابلة من حيث هي مهمة جدا، مثل آليات الإنتباه في حل المهام المتعلقة بالترجمة من المهام في معالجة الصور الهامة.

الرسم البياني العمارة المتعدد الوسائط

النتائج التجريبية، هذا النموذج من قبل الباحثين جوجل المقترحة في جميع المهام المذكورة أعلاه يتم تحقيق نتائج جيدة - على الرغم محددة لهذه المهمة، وليس نتيجة أفضل الحالية.

وبالمثل، نظام MIT أيضا لم تحصل على أفضل النتائج على جميع المهام الفردية.

ومع ذلك، Aytar أن هذه ليست مشكلة. وقال "عندما كنت تستخدم المزيد من أجهزة الاستشعار، ودقة تتحسن."

طريق الحرير

"دعونا الشبكة العصبية يمكن أن" حس مرافق "" MIT وجوجل بحث النص على اتصال والصوت والفيديو

رئيس مجلس الدولة تشو الحمية (ب)

جوجل أول صندوق استثماري AI: Algorithmia، وتعلم آلة الخوارزمية "البازار"

حلم! "مدينة جنوب الصين الجنكة" عرض أفضل من الموسم المقبل، بدأت الآن فقط حق ~

السنة الصينية الجديدة فتح هذا العديد من سيارات الدفع الرباعي في العودة إلى ديارهم، وقرية أعطى الناس لك ممتاز!

وجود قبل الخام الإيراني من الصين، واستبدالها بعد رسميا الدولار مع يوان، تتغير الأمور من جديد

في هذا الإعداد هي موطن لموسم عيد الربيع، وقال انه جاء من عائلة فقيرة من اللاعبين مطاردة حلم!

وبلغ 15 عاما، طويل القامة والدته كان يحمل الهاتف الخليوي فقط "المسرح"

قرأت "القادمة" مليون كلمة "ثورة سلسلة كتلة": 7 الكبيرة الكتلة الاقتصادية مبادئ تصميم سلسلة

"13 محاضرات عن الطبقة العامة بجامعة بكين ، رابط كامل +أقوى مخزون للسلع الجافة" الصين AI +، عندما تتشرف النجوم

أريد أن اتهام ثمانية الجريمة في أيسلندا! كل هذا اللوم ذلك أيضا ......

فريق الإمارات والمشجعين المدخلات تفقد! كان المشجعين قطر رمى الهدف زجاجات المياه Zadao، رائع!

"سلامة الغذاء" هو من البالغين والأطفال يحبون أن تأكل وجبات خفيفة، ولكن تم العثور ......

2018 USD تريد أن ترى اثنين من الأمور، وسائل الاعلام الاجنبية: تحدى هيمنة الولايات المتحدة 2019

الذين تتراوح أعمارهم بين 50، وعاد لا تزال في سن المراهقة - نانجينغ جسر نهر اليانغتسى، مرحبا!

بداية فصل الشتاء، هوكايدو تحت أول تساقط للثلوج

شين وي مساحة الحب: التغييرات في المشاكل وتحسين المساكن، وطرح أي مشاعر، فقط أسأل تقنية

هناك الشعر، ناهيك مذهل بداية

هوانغ: تم الانتهاء كرة القدم اليابانية من آسيا لأوروبا، وسيتم طرح اورانج أبعد!

تأكيد رسمي! أعلنت تايلاند رسوم التأشيرة مجانا لمدة 2 أشهر! الدولة التي سوف تذهب؟

الحق في الصحة من عديدها استطلاع العامة يرجى أصدقاء الوقوف، والنتيجة هي على وجهها!

78800 فصاعدا، هؤلاء الخمسة دماء جديدة "الشبكة الحمراء" SUV، ورأى وضع الشاب عليه!

109800 السيارات العائلية من صحيح 7؟ رجل جيد الأسرة والأصلي حتى اختيار!

الأحكام ذات الصلة