"GAN X NLP" ضد الجيل اللغة الطبيعية: باحثون كنديون باستخدام الجيل GAN الشعر الصيني القديم

الأنفس جي تقرير جديد

ضد توليد شبكة (GAN) هي كلمة الساخنة في الوقت الراهن، واستخدام GAN القيام معالجة اللغة الطبيعية (NLP) فقد كان مصدر قلق لهذه الصناعة. وقال قبل بضعة أيام، بما في ذلك "ديب التعلم" مؤلف الكتاب، CIFAR زميل هارون كورفيل، بما في ذلك باحثون كنديون لتحميل ورقة "اللغة الطبيعية ضد تولد" "الخصومة الجيل اللغة الطبيعية" في أرخايف وهو يوفر وسيلة واضحة وفعالة لتوليد GAN التدريب على اللغة الطبيعية .

من يمثله، وأنه بسيط، من المولد إلى توفير التوزيع الاحتمالي للحرارة و1- تسلسل تسلسل ناقلات (سلسلة من نواقل 1-الساخنة) المقابلة لتوزيع البيانات الحقيقية إلى وسائل التصميم، المستمر الممي قوة يحسب القيم .

تقدم الورقة الإطار النموذجي.

وبالإضافة إلى ذلك، يوفر الورقة أيضا إلى تقييم الأساليب الكمية والنوعية، والتي تبين العقوبة المحتملة الميزات المتقدمة (مثل المزاج والقضايا) تولد الظروف النص.

شروط جيل نص سبيل المثال تعطى في ورقة : الصف العلوي هو استخدام الأمازون مع "ايجابية" وسمة "سلبية" تعليقات مجموعة البيانات كما ولدت بيانات التدريب عينة، السطر التالي هو هناك شروط نفس مجموعة البيانات مع ميزة "مشكلة" لتوليد العينات.

يقول المؤلفان، ثم أنها ترغب في استكشاف تطبيق NLP GAN في مجالات أخرى، مثل نظام حوار موجه نحو غير هدف.

أطروحة "ضد جيل من اللغة الطبيعية" وإدخال التجريبية

ملخص

توليد المواجهة شبكة (GAN) مؤخرا في صناعة رؤية الكمبيوتر تسبب في الكثير من الاهتمام، وحققت نتائج باهرة من حيث الصورة توليد. ومع ذلك، تقدم ضد الضوضاء الناتجة من اللغة الطبيعية مع التقدم المحرز في مجال توليد صورة لا يتناسب، لا يزال بعيدا وراء طريقة (على أساس أساليب احتمال) على أساس احتمال. في هذه الورقة، لدينا هدف واحد مع GAN، وتوليد اللغة الطبيعية. ورقة يقدم معيارا بسيطة لحل مشكلة الفضاء الناتج منفصلة، لا تعتمد على وظيفة تقدير الانحدار (مقدر التدرج)، ومجموعة من البيانات عن الشعر الصيني حقق أفضل النتائج للتيار. كما يوفر ورقة النتائج النوعية من عدم سياق والعشوائية قواعد خالية من السياق (احتمالي خالية من السياق النحوي) لتوليد الجملة النتائج الكمية، والنمذجة اللغة. يصف الورق أيضا نسخة من (الإصدار مشروط) تسلسل حالة يمكن أن تتولد وفقا للشروط الجملة مميزة.

إدخال المؤلفين يتم تقييم عموما نموذج اللغة التي من احتمال العينة مع توزيع البيانات الحقيقية في نموذج القياس. ومع ذلك، فإن استخدام GAN، نموذج القياس نفسه احتمال مستحيل، لذلك أخذوا وسائل أخرى، تم تقييم احتمالات نتائج نموذج عن طريق قياس العينات تحت توزيع البيانات الحقيقية.

تم تقسيم الكتاب إلى أربعة أقسام:

  • اللغات الجيل الذي تنتمي CFG مجموعة بيانات عينة (لعبة CFG)، والمستمدة من بن Treebank تأتي PCFG (ماركوس وآخرون، 1993) مجموعة البيانات

  • توليد الشعر الصيني، و(يو وآخرون، 2016) و (تشي وآخرون، 2017) مقارنة نتائج

  • يولد اللغة الإنجليزية جمل بسيطة، وهذه الجمل من مجموعة البيانات 1 مليار كلمة، وبن Treebank

  • استخدام شرطي GAN، لتوليد الجملة مع العواطف (المشاعر) وقضايا (السؤال) مثل خصائص.

  • النتائج التجريبية

    الجدول 1 (أعلاه) يظهر التجربة 1، ونتائج التحليل الكمي الجملة التي تم إنشاؤها. لجنة التنسيق الإدارية تمثل UNIQ ودقة (الدقة) ودرجة فريدة من نوعها (تفرد)، LSTM-P تمثل ثقب الباب الإخراج مع LSTM. يمثل WGAN-GP وGAN-GP ركلة جزاء باستخدام نموذج الانحدار (عقوبة التدرج، GP) في عملية التدريب.

    يتضح من الجدول 2 (انظر أعلاه)، والشعر وو يان وسبعة الرباعيات، والطريقة المقترحة من قبل عشرات الكتاب BLEU هي أعلى.

    ولدت النتائج في الكلمات والعبارات مستوى 1 مليار كلمة مجموعة البيانات.

    بن Treebank جامعة كارنيجي ميلون-SE ومجموعة البيانات لتوليد نتيجة لذلك إلى مستوى الكلمة (مستوى وورد) هو.

    عنوان ورقة: الشبكي: //arxiv.org/pdf/1705.10929.pdf

    بعد كندا الاوز تعرض لصفعة "صفعة على الوجه"، أو النفط الكندي والمزارعين تكبدوا خسائر فادحة

    الأكثر ملاءمة لوجهات السفر في فصل الشتاء 6، لم يكن الناس جميلة لا تريد أن تترك!

    فقط 70000 الحد الأدنى! هذه المبيعات SUV في عام، ولكن لشراء الناس الخير ويقول

    شين وي، مثل: الآخرين منصة يجب أن تسمح مانع النجاح الأول، وحصلت على وعاء النهائي من مشاعر الذهب

    بعد الاوز كندا، أظهرت خمسة أو ضعف الاقتصاد أن الاقتصاد الكندي ستعاني ضربة قوية مرة أخرى

    "تذكير" معسر عرق بارد! شيان الأطفال ماراثون تختمر التأمين التدافع!

    اسم السيارة في "الميتافيزيقيا"، وقال أصحاب BMW أودي بالجنون

    تانغ: التغييرات صغيرة غير مرئية في الفرد، لا أستطيع فهم التغيرات الكبيرة في الأعمال التجارية

    "اختراق" التعلم العميق حساب الاستهلاك بنسبة 95، KDD2017 البحوث التجزئة لتسريع تطور الشبكات العصبية

    قدم الصينية قطار فائق السرعة بنهاية "التفاف هدية"

    متجر 4S أن أذكر السيارة، والتحقق من هذه الأماكن الثلاثة، إلى سيارات تجنب شراء واختبار القيادة الأسهم سيارة

    وفاة البالغ من العمر 94 عاما السيد جين يونغ: هذا العالم، وأعلى فنون الدفاع عن النفس، هو الوقت ......