ولدت أول نظام الجيل الفكاهة غير خاضعة للرقابة في العالم، القادم ساحة معركة كبيرة العميق التعلم: قطعة تتحدث!

الأنفس جي تجميع جديد

ملخص

الجيل النكتة هي قضية معقدة للغاية. من الصعب القول بالضبط ما يجعل تصبح نكتة مضحكة. لحل هذه المشكلة ويعتقد عموما أن فهم الدلالات العميقة، فضلا عن القرائن السياقية الثقافية وغيرها. الأعمال السابقة في هذا المجال هو محاولة لاستخدام الأمثلة قاعدة البيانات والتدريب المسمى مصطنع خصيصا لخدمة هذه النماذج المعرفة. نحن لم نفعل ذلك، ولكن اقتراح نموذج لتوليد مثل هذه أنا وكأنني كأنني مثل بلدي X-Y مثل استخدام كميات كبيرة من البيانات غير المسماة، Z النكات (I مثل بلدي X كأنني مثل بلدي Y، Z النكات ) واسطة، حيث X، Y و Z هي المتغيرات التي سيتم شغلها. وهذا هو، على حد علمنا، ونظام توليد النكتة الأولى غير خاضعة للرقابة تماما. كان النموذج الأساس لدينا أفضل بكثير من المنافسة، وإنشاء نكتة مضحكة في 16 من الوقت، البشر هم 33 من الوقت لتوليد نكتة.

الخطوط العريضة

تعتبر النكات ولدت عادة ما يكون من الصعب جدا مسألة اللغة الطبيعية، لأنه يعني فهم الدلالات العميقة للنص، وكثيرا ما يكون مصحوبا التفاهم الثقافي. ولدت لنا نوع معين من نكتة --- أنا وكأنني كأنني مثل بلدي X-Y من نفسه، Z (I مثل بلدي X كأنني مثل بلدي Y، Z) - حيث X و Y هي الأسماء، وعادة ما يتم وصف Z خصائص X و Y. مثال على هذا النوع من المزاح هو "أنا مثل لاعبي فريقي وأنا مثل الشاي بلدي، والساخنة، وعلى غرار بريطانيا) - هذه النكات شعبية على شبكة الإنترنت.

على الرغم من أن مجرد توليد منظور (تم إصلاح النظام النحوي)، وهذه النكات ليست مضحك جدا، ولكن اختيار محتواه لا تزال صعبة جدا. في الواقع، بالنسبة لمعظم النكات في X، Y و Z، لا تعتبر سخيفة. ولذلك، فإن التحدي الرئيسي من هذا العمل هو لملء قالب فارغ في هذه النكتة، والجملة كلها سخيفة.

ولدت الفكاهة العمل المختلفة القيام به من قبل، نحن لا تعتمد على بيانات التدريب المشروحة أو قواعد الترميز يدويا، ولكن يعتمد على كميات كبيرة من البيانات غير المشروحة. نقترح نموذجا للتعلم آلة للتعبير عن ما نحن على وشك جعل هذه النكات تصبح افتراض سخيف. نحن أيضا ثبت ذلك، باستخدام هذا النموذج البسيط جدا والكثير من البيانات، لدينا 16 من الوقت، ولدت في القاضي البشري الذي يبدو نكتة سخيفة.

المساهمة الرئيسية لهذه الورقة هي، على حد علمنا هذا هو أول نظام كامل الجيل نكتة غير خاضعة للرقابة. مجرد بيانات غير المسماة استخدمنا، مشيرا إلى تشكيل نكتة ليست كما يعتقد عموما، تحتاج دائما لفهم دلالات العمق.

نقترح نظام توليد نكتة كاملة غير خاضعة للرقابة، لتوليد هذا النوع النكتة التالية

أحب بلدي العلاقات الشخصية وكأنني مثل بلدي الموارد، ومنفتح جدا.

أنا مثل myrelationships وكأنني مثل مصدر بلدي

أحب بلدي القهوة وكأنني مثل الحرب بصفتي البرد.

أنا مثل mycoffee وكأنني مثل بلدي الحرب الباردة

"أنا مثل بلدي X كما أحب، مثل بلدي Y، Z" (I مثل بلدي X كأنني مثل بلدي Y، Z) هو الحاجة إلى ملء القالب. على حد علمنا، هذا هو أول التي لا تتطلب أي وضع العلامات أو البيانات يدويا ترميز قواعد النكات نظام توليد. ونحن نعتقد أننا ما يجعل نكتة مضحكة فرضية يصبح كنسبة نموذج التعلم الآلي، وأثبت من قبل عدد كبير من البيانات الخالي من الملصقات على معايير التقييم، ونحن يمكن أن تولد يشعر الإنسان نكت مضحكة. وعلى الرغم من تجاربنا تبين أن أفضل ولدت الإنسان أن يضحك على النكات المزيد من الوقت، ونحن ما زلنا نعتقد نظامنا يمكن ان تنتج يشعر الإنسان نكت مضحكة في 16 من الوقت، وهذا في حد ذاته أمر مشجع.

نموذج رياضي من النكات

في "أنا مثل بلدي X كما أحب، مثل بلدي Y، Z" (I مثل بلدي X كأنني مثل بلدي Y، Z،) قالب، فإننا نفترض أن X و Y هي الأسماء، Z هو صفة.

على هذه النكتة، لدينا نموذج ترميز الافتراضات الرئيسية الأربعة:

1. جميع الممتلكات أكثر غالبا ما تستخدم لوصف ولايتين، والنكات أكثر مضحك.

2. سمة مشتركة أقل، نكتة أكثر مسلية.

3. سمة التعبير أكثر غامضة، والنكات أكثر مضحك.

4. أكثر متباينة بين المصطلحين، والنكات أكثر إثارة للاهتمام.

FIG 1 هو تمثيل رسومي للنموذج عامل. وتتمثل العوامل المتغيرة التي كتبها دائرة يمثلها المتغيرات يعرف كتلة تشارك وترد على وظيفة محتملة.

1 يفترض الأكثر مباشرة، يمثله (X، Z) و (Y، Z) عامل. ويمكن التعبير عن هذا الافتراض رياضيا على النحو التالي:

حيث و (خ، ض) هي وظيفة من x و ض قياس احتمال وقوع المشترك.

حول الافتراض 2، إذا كان هناك بعض الخصائص هي شائعة جدا، ويمكن استخدامه لوصف أي شيء تقريبا (مثل جديد وحر وجيدة)، ثم تصديرها من المرجح أن تكون مزحة سيئة الجملة. Z السمة أكثر غرابة، والسبب مفاجأة على الأرجح، وهذا هو نكتة مصادر الفكاهة.

عبرنا عن هذا الافتراض في عامل 1 (Z) في ما يلي:

ويفترض 3 بناء على هذه الملاحظة، وهي الممتلكات التي هي، في وصف الدلالي للشروط X، Y يوصف من حيث الدلالي آخر.

وقال نستخدمها في 2 (Z):

فرضية 4 اعرب بين فترتين الاختلاف سيؤدي إلى المزيد من الفكاهة كخاصية من كلا في نفس الوقت يصف المستمع ستتجاوز التوقعات. نحن نستخدم (X، Y) لتشجيع الاختلاف بين المصطلحين:

والبيانات التجريبية على

لتقدير و (س، ص) وو (ض)، ونحن نستخدم بيانات Google ن غرام (ميشيل وآخرون، 2010)، خاصة جوجل البيانات 2 غرام. نحن نستخدم وردنت (Fellbaum، 1998) مع معظم كلمة شائعة المرتبطة جزءا من العلامة الكلام (POS) للاحتفال كل كلمة في غرام 2. بعد جوجل 2 غرام صفت البيانات POS لدينا، ونحن استخراج كافة (اسم، صفة) أزواج والعد باستخدام و المقدرة (خ، ض) و f (ص، ض).

ومن الجدير بالذكر، على الرغم من أن نستخدمها في ورقة وردنت طرقنا لا تعتمد على ذلك. نستخدمها فقط لجعل بعض المعلومات السطحية.

قمنا بتقييم المرحلتين نموذجنا. أولا، تقييم آلية لجمع النكات من التغريد، ثم تأخذ النكات ولدت البشرية والنكات مع الطريقة التي تولد المقارنة.

لمعرفة المزيد عن النماذج والبيانات التجريبية، الرجاء الضغط على الرابط لقراءة ورقة.

"المرشحون"

للصحفيين بدوام كامل، وقد تم تجميعها والأنشطة التشغيلية

ترحيب المتدرب

الترجمة و الاصطناعي متطوعين من المجتمع المحلي المخابرات

لمزيد من المعلومات، يرجى النقر على دخول عدد الجمهور "المرشحون"

أو البريد الإلكتروني jobs@aiera.com.cn

جي الأنفس وظائف جديدة اضغط على "قراءة النص"

حفر البرية الكشفية، أونتاريو لتعطيك أقصى ثلاثة المفتوحة

"القراءة الموصى بها" لا تفوت آلة كلاسيكية تعلم جيد مان أعلى 10

الثقيلة! وزارة الصناعة وأحدث التعرض تطبيق المخطط، التي تأتي بعدة سيارات الطاقة الجديدة في الوقت المناسب جدا!

الثقيلة! أماه أكره تشو شياو اتضح أن يكون حقيقيا، وليس قطعة؟

اليابان تقلص إلى حد كبير بعد ديون الولايات المتحدة، وارتفاع القصير، عمليات بيع أو بداية، ولا حتى عدة مدن يوان

مدينة جينغدتشن مركز الخدمات الإدارية على وشك أن تبدأ الخطأ، والتأخر، خدمات الحجز وساعات من غير العاملين من القيام بأعمال تجارية!

اليوم، وأنا لديهم ما يقولونه وأبي (عليه قطع لقلب، لمعرفة المحيط الربيع، تشيوان لينغ كيف أقول)

أتوسل إليكم، أعطني سببا لعدم نيوزيلندا!

ليو باي، تشو قه ليانغ العثور عليها، كوان يو وتشانغ الشراكة الأعمال فاي الجدة؟ والسبب هو

قبل 19 عاما اليوم، عودة ماكاو! يأخذك تخفيف تلك اللحظات المثيرة

قد يكون هذا أجمل يوم غزاة الأرض: بوليفيا "سكاي ميرور" الولايات المتحدة لجعل الناس Xinchan!

العديد من البلدان تم تعيين ودع العالم إلى تصاعد الدولار، وأبعاد متعددة المضافة، سوف يكون ضغط الدولار أو التسوية متعددة الجنسيات