تمثل الضحكة واي؟ AI معهد ماساتشوستس للتكنولوجيا، وانت تعرف أفضل من | ورقة + تجريبي

يون الانتهاء من جمعها

إنتاج و qubit | عدد ملفه QbitAI

وبعد بعبارة أخرى، وهي مجهزة أيضا مع "واي ابتسامة" نظرة.

Q: هذه لتقف على "أنت رائع"، أو من ينوب عنه "أنت ميت"؟ نيابة عن "رفض مهذب" أو تمثل "ضبط النفس ودية"؟ هل أنت أيضا لا يمكن أن تساعد ولكن تنهد: هذا TM في النهاية ماذا يعني ذلك ......

هل لديك نفس السؤال، وهناك عدد قليل من "المثقفين" من معهد ماساتشوستس للتكنولوجيا.

من أجل فهم المعنى العاطفي وراء الكلمات، والباحثين وضعت مجموعة من خوارزميات الذكاء الاصطناعي لتحليل: ما قالته في نهاية المطاف هو أليس من السخرية؟ الكلام صحيح، وهذا النظام هو أكثر قوة من معظم شخص حقيقي.

كيفية القيام بذلك؟

التعلم العميق. وبنى الباحثون الشبكة العصبية العميقة، ومن ثم استخدام كمية كبيرة من البيانات على محادثة (المدونات الصغيرة US) تويتر من التدريب. السبب في هذه الطريقة هو ممكن، وذلك بفضل ليكون هدية من الرموز: للناس التعبير عن عاطفة معينة في بو الصغيرة، وغالبا ما يرافقه عدد من الرموز، مثل رمز تعبيري.

هذه الرموز التعبيرية التعبير، وهو ما يعادل هذه الجملة، ولعب التسمية. لذا من هذه النقطة من اختراق هذا النظام التعلم العميق، حتى إذا كان البشر لا يفهمون السخرية مهارات متقدمة، ولكن أيضا من خلال الرموز التي تم العثور عليها شيئا ما كان خطأ ~

هذا النظام الذكاء الاصطناعي على أساس عمق التعلم، ودعا DeepMoji.

لتدريب DeepMoji، جمع الباحثون 55 مليار تويت (المدونات الصغيرة)، وبعد ذلك لاختيار تويت 1200000000 مع 64 أنواع من الرموز التعبيرية المشتركة.

أولا، قاموا بتدريب نظام للتنبؤ التي سيتم استخدامها الرموز للحصول على معلومات محددة، مثل سعيدة، حزينة، سعيدة تتوافق مع ما التعبيرية. ثم، يتم تدريب النظام على التعرف على السخرية.

سيتم تصنيف هذا النموذج وفقا لتعبير مختلفة من المشاعر السلبية، والإيجابية، والحب، وما إلى ذلك، وتعلم الفرق بين المشاعر المختلفة. يظهر الشكل التالي DeepMoji المجموعات الهرمية من الرموز.

جزء من بيان كتسمية صاخبة (التسمية صاخبة) للتنبؤ مهمة قبل التدريب ليست فكرة جديدة، ولكنه قد لا يكون قد استخدمت من قبل مجموعة من 64 علامات صاخبة. وتجدر الإشارة إلى أن المراسلات بين تصنيف العلامة صاخبة وعاطفية لم يكتمل هذا المشروع من قبل التشغيل اليدوي، أو أنه قد يسبب سوء الفهم.

في النهاية جيدا كيف؟

قدم الباحثون تظهر عدة معايير، DeepMoji في كل حالة من أفضل أداء الخوارزمية المتاح هو أفضل من ذلك بكثير. وهذا هو: خوارزمية استخدام الرموز التعبيرية المشاعر ما قبل التدريب، والقدرة على التعرف على ما إذا كانت عقوبة من السخرية قد تحسنت بشكل كبير.

وبالإضافة إلى ذلك، قام الباحثون أيضا اختبارا البشري من خلال الترك الميكانيكية. تظهر نتائج الفحص أن DeepMoji المفارقة كلمة عاطفية معدل الاعتراف من 82، في حين أن متوسط درجة الإنسان هي 76.

MIT ببناء العودة الموقع الرسمي DeepMoji، يمكن للطلاب المهتمين الذهاب إلى المتفرجين، عنوان: deepmoji.mit.edu. هناك صفحة تجريبي.

وبطبيعة الحال، وهذا النموذج لا يخلو من عيوبها، مثل "هذا هو القرف" التعرف على مجموعة واسعة من المشاعر الايجابية والتطبيقية، و "الحب" كلمة، واسمحوا DeepMoji شيء من معضلة.

كما هو موضح أدناه، لكلمات سبعة معين، DeepMoji نظرا الخمسة الاوائل التعبير الرموز التعبيرية على الأرجح تقديرات احتمال المقابلة. أنا لا أعرف ما كنت أفكر نفس الشيء؟

البحث في النظام، وليس من أجل الحب أفضل.

وراء هذا هو دراسة جادة، وهذا هو نص تحليل المشاعر المعقدة. معظم الأبحاث في هذا المجال، وتتركز في الجملة الحكم هو المشاعر الايجابية أو السلبية. ولكن هذا هو واضح ليس بما فيه الكفاية، من الناحيتين العملية والنظرية تبين أن لغة الإنسان تتحمل أكثر تعقيدا ودهاء التعبير العاطفي.

ومع تطور تكنولوجيا المعالجة الطبيعية للغة (NLP)، سيري، اليكسا وغيرها من الروبوت دردشة أو مساعد المنتج الظاهري، ولكن أيضا لتعزيز القدرة على فهم اللغة البشرية.

العمارة نموذج

في هذا القسم، والحديث عن التفاصيل التقنية. وأحد التحديات التي تواجه الباحثين هي كيفية صقل نماذج التصميم وأساليب لتكون قادرة على جعل المشاعر قبل تدريب نموذج ينطبق على مجموعة متنوعة من المهام الجديدة.

في البداية، كانوا الذاكرة الكلاسيكية عندما يكون طول الشبكة (LSTM) 2 طبقة، ولكن سرعان ما وجدت أن لديها مشكلتين:

طبقة الماضي LSTM علمت الهجرة ميزة لمهام التعلم، فإنه قد يكون معقدا للغاية. الاتصال المباشر مع طبقة الشبكة قد تكون أكثر ملاءمة للهجرة.

ويمكن استخدام هذا النموذج في مناطق جديدة، عن طريق دمج مساحة محددة كلمة ناقلات بالنظر إلى "فهم" في حاجة إلى تحديث. ومع ذلك، قد تكون مجالات جديدة لجمع البيانات صغيرة جدا، لذلك، ببساطة استخدامه لتدريب نموذج كامل لديها 22.4 مليون المعلمات سوف تؤدي بسرعة إلى الإفراط في تركيب.

لحل المشكلة الأولى، وتحتاج فقط إلى إضافة آلية الانتباه نموذج LSTM بسيطة، وسوف تكون قبل كل من طبقات كمدخل، وبالتالي يمكن بسهولة الوصول Softmax طبقة في الهندسة المعمارية من أي طبقة، أي خطوة زمنية سابقة.

لحل المشكلة الثانية، اقترح الباحثون "عبودية - ذوبان الجليد" صقل البرنامج، مرارا وتكرارا "ذوبان الجليد" جزء من الشبكة، والتدريب. تبدأ عملية تدريب أي طبقة جديدة، ثم طبقة من طبقة صقل طبقة من الطبقة الأولى إلى الأخيرة، ثم نموذج التدريب بأكمله، كما هو مبين أدناه:

هذا الحساب التعديل ليس كبيرا كما يبدو، لأن كل طبقة يحتاج فقط قليلا صقل.

ثم نعلق يظهر الورقة حقا أكثر مناسبة هذا النموذج إلى بنية دراسة الهجرة، ولكن يدل أيضا على استخدام الرموز التعبيرية مثل هذه الثروة من مجموعات البيانات، وأفضل من الفرق الكلاسيكية المشاعر "إيجابية / سلبية"، حتى لو كان الهدف ببساطة أن نميز تحليل الإيجابية والمشاعر السلبية، كذلك.

من أجل قياس النموذج، وجد الباحثون ثماني مجموعات البيانات القياسي في ثلاث مهام NLP خمسة حقول.

على جميع عمليات جمع البيانات الأساسية والأداء نموذج DeepMoji هو أفضل من أعلى مستوى القائمة، بما في ذلك استخدام "عبودية - ذوبان الجليد" طريقة حافظت دائما على أعلى مستوى من الأداء للدراسة الهجرة.

لكن المشكلة التي تواجهنا في هذه الدراسة، هو عدم وجود تحليل المشاعر جمع بيانات خط الأساس السليم، وهي أكبر فئة البيانات المشاعر تحديد سبعة فقط تصنيف الشعور. لمعالجة هذه المشكلة، والباحثين يحاولون إنشاء مجموعة بيانات خط الأساس العاطفي الجديد والأمل تساعد على تعزيز التحليل النفسي.

تطبيق نموذج

DeepMoji رمز preprocessed، وسهلة الاستخدام، ويستخدم نموذج ما قبل التدريب إطار Keras. الجميع يتقاسمون المصدر المفتوح على جيثب في وقت لاحق. الأصدقاء المهتمين يمكن أن نتذكر هذا العنوان:

https://github.com/bfelbo/deepmoji

السبب هو سهل الاستخدام، لأنه على أساس هذا النموذج، فقط بضعة أسطر من التعليمات البرمجية، فإنه قد يكون سابقة التجهيز لمجموعة بيانات الاختبار، وصقل النموذج.

من استيراد deepmoji SentenceTokenizer، finetune_chainthaw، define_deepmoji

إذا كنت ترغب في توسيع المفردات بحيث نماذج يمكن دراستها في إطار أوسع، يمكنك كذلك ضبط معدل التسرب أو وسائل أخرى. سيتم اطلاق سراح رمز في وقت لاحق في الوصف التفصيلي.

هناك مقارنة DeepMoji مع الحاضر أكثر الأساليب المتقدمة، وهذا الأسلوب يجمع بين المصنف LSTM + التدرج تعزيز شجرة نموذج (GBT). DeepMoji الحصول على معدل دقة 82.1، في حين كانت سيطرة الجماعة أفضل نتيجة 75.6. ومن المثير للاهتمام، و "القيود - ذوبان الجليد" النهج يساعد على تحسين دقة.

مقالات ذات صلة

إذا كنت ترغب في مزيد من DeepMoji الدراسة، يمكنك ان ترى أوراقهم. يحق للصحيفة: "عن طريق الملايين من الحوادث رمز تعبيري لتعلم التمثيل أي المجال للكشف عن المشاعر والعاطفة والسخرية".

الكاتب: Bjarke Felbo، آلان Mislove، أندرس Sgaard إياد رهوان، سونيه ليمان

خلاصة القول:

المهام NLP غالبا ما تكون محدودة من ندرة البيانات الشرح اليدوي. ولذلك، أصبحت تحليل وسائل الاعلام الاجتماعية المشاعر والمهام ذات الصلة، والمشاعر ازدواج وتسمية محددة موضوع الإشراف عن بعد يستخدم (إشراف البعيد) الباحثين نموذج. يظهر بحثنا أن، من خلال الإشراف عن بعد تمديدها إلى تسميات صاخبة أكثر تنوعا، يمكن للنموذج تعلم التمثيل أكثر ثراء. من خلال تويتر من 1246000000 يحتوي على 64 تحليل الرموز التعبيرية المشترك، والتنبؤ رمز تعبيري يناظرها، ونحن نستخدم نموذج ما قبل التدريب واحد، حقق أعلى مستوى من الأداء في المزاج والعاطفة والمفارقة الكشف عن مجموعات البيانات ثمانية المعيار. يؤكد التحليل أن استخدمنا علامات الانفعال التنوع، مقارنة مع المنهجية التقليدية المراقبة عن بعد، وبذلك تحسين الأداء.

الحصول على أوراق، يرجى و qubit رقم القناة الصغرى العامة (QbitAI) واجهة الحوار، رد " الماجستير التعبير "الكلمات، يمكنك الحصول على عنوان تنزيل.

- كامل  -

التسجيل الحدث

8 يو 9 ري (Zhousan) ليلة، المكدسة دعوة مثلث رئيس الوحش عالم انغ Baoxun، وتوليد الحوار سهم التعلم نموذج يقوم على المواجهة، مرحبا بكم في تطبيق

المكدسة تقوم بتجنيد محرر / مراسل، ومقرها في تشونغ قوان تسون في بكين. نتوقع الموهوبين والطلاب المتحمسين للانضمام إلينا! مزيد من التفاصيل، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "تجنيد" كلمة.

و qubit QbitAI

' " تتبع تقنيات AI دينامية جديدة والمنتجات

مهاجم Hengda قبل أن تنفجر مع شعبية! النادي التحرك لمكافحة قه السابق، وقفت الجماهير وصفق لأشيد له

كل فصل مهنة، المتوسط 20+ أكثر صعوبة؟ تاريخ 4 أشخاص، 2 شخص نشط، 4TH ارتفاع الجميع

ربيع من الجولة الأولى، وموسم الصيف الثاني الجلوس العرش ضيق! ومن المعروف العشيرة الوحيدة كما LPL الملك الجديد!

"هرمون المشي" MG مفهوم SUV التعرض تصميم السيارات العلامة التجارية الجديدة

شد الحبل؟ الحق في الصحة قبل المساعدات الخارجية للشباب العاطلين عن العمل! اعترف الفيفا لديه الحق في دفع الطلب: كولونيا

اختبار الله عودة قوية، مهنة أفضل البيانات 4، وليس ضد، فإن ووريورز يجبر النهاية!

العالم من علب واحدة من أكثر وحوش قوية! يمكنك التغلب على التنين خمسة، كان صديقا المعروفة باسم السلاح المثالي لتدمير

نهر مدينة ماراثون على وشك أن تبدأ تشغيل السيارة أصبح سباق السيارات الرسمي

جين بينجكسيانج الظهر حتى لعبت مباراة واحدة فقط، لعب يخسر فيها لي: العودة؟ الحاجة إلى مناقشة الجهاز الفني

9-12،5-12،2-12،11-12 الصواريخ محارب تفقد، يفقد هذا المجلس قصيرة 4

أكبر اختبار التحمل لاعب لعبة! وخرج بفضل شقة! مرة واحدة تحصل على 10 غيرت مجرد لعبة

إعادة لمس في وقت متأخر يمكن أيضا ضبط عمق الميدان وزاوية الرؤية؟ NVIDIA وUCSB حساب التكبير لمساعدتك في تحقيق