أصدرت جوجل سؤال وجواب ثقيلة مفتوحة مجموعات البيانات، 300000 المفسرين الإنسان الطبيعي الإجابة على الأسئلة +

[استعراض فاز جي الجديدة اليوم، أصدرت جوجل مجموعات البيانات مشكلة الطبيعية الرائجة (أسئلة الطبيعي)، ويحتوي على 300000 الأسئلة والأجوبة التي تحدث بشكل طبيعي المفسرين البشري، و 16،000 الأمثلة، وأنظمة إطلاق تحدي مسابقة على أساس مجموعة البيانات هذه. ومن المتوقع أن يصبح مجال فهم اللغة الطبيعية فرقة!

الأسئلة المجال مفتوح للإجابة (QA) هي مهمة القياسية من فهم اللغة الطبيعية (NLU) في، والغرض منه هو لمحاكاة كيفية العثور على البشر المعلومات، للعثور على إجابات لأسئلتك من خلال قراءة وفهم الوثيقة بأكملها.

على سبيل المثال، ونظرا ل باستخدام مشكلة اللغة الطبيعية "لماذا السماء زرقاء؟" ( "لماذا السماء زرقاء؟")، وينبغي أن يكون النظام قادرا على QA الصفحة مقروءة (مثل "الإشعاع السماء منتشر" صفحة ويكيبيديا) وترجع الإجابة الصحيحة حتى لو كان الجواب معقد إلى حد ما وطويلة.

ومع ذلك، لا يوجد التدريب والتقييم على نطاق واسع يمكن استخدامها لنموذج QA، جمهور قضايا (أي القضايا التي أثارها معلومات الشخص الذي يسعى) التي تحدث بشكل طبيعي والأجوبة البيانات.

وذلك لأن بناء مجموعة بيانات عالية الجودة لمهمة QA يتطلب الكثير من المصدر الحقيقي للمشكلة ويتطلب الكثير من القوى العاملة ل العثور على الأجوبة الصحيحة لهذه الأسئلة .

من أجل تعزيز تقدم البحوث في مجال QA، وجوجل صدر اليوم مجموعة البيانات مشكلة الطبيعية (أسئلة الطبيعية، NQ) هذا هو الجديد، الإحضار على نطاق واسع للتدريب ونظام تقييم الأسئلة والأجوبة الحقول المفتوحة، وأول للعثور على إجابات على أسئلة عملية نهاية جسم الإنسان من تكرارها.

أسئلة الطبيعية مجموعات البيانات

NQ حجم كبير جدا، تحتوي على 300000 الأسئلة التي تحدث بشكل طبيعي، وكذلك المفسرين البشري الإجابة من صفحة ويكيبيديا لتدريب نظام QA.

وبالإضافة إلى ذلك، يتضمن NQ الإحضار أيضا 16000 سبيل المثال كل سبيل المثال عن طريق توفر 5 مذكرات مختلفة إجابات وهذا مفيد (لنفس المشكلة) لأداء أنظمة ضمان الجودة لتقييم التعلم.

أسئلة الطبيعية مجموعة البيانات المثالي

نظرا لالإجابة على الأسئلة أكثر من الأجوبة في NQ أسئلة تافهة (هذه الأسئلة لأجهزة الكمبيوتر هي بالفعل من السهل جدا على حل) الحاجة إلى فهم أكثر عمقا، وأطلقت غوغل أيضا تحديا على أساس مجموعة البيانات هذه، للمساعدة في تحسين اللغة الطبيعية الكمبيوتر التفاهم.

NQ التحدي المتصدرين

يحتوي NQ مجموعة التدريب البيانات 307K سبيل المثال، 8K و8K أمثلة تطوير عينة الاختبار.

حاليا، تصنيفات فقط NQ التحدي جوجل بيرت ونموذج DecAtt-DocReader نتائج النموذج. في ورقة، وثبت جوجل أن أفضل الإنجاز البشري في مهمة الجواب طويل المحدد هو 87 F1، واختيار الإنسان على المهمة في الجواب القصير إلى أفضل درجة من 76.

فاز تينسنت علي بابا؟ ستاربكس تسوية الأجور مقبولة قناة الصغرى

أطلقت هواوي تكنولوجيز أول 5G المحطة الأساسية للرقائق في العالم، جنبا إلى جنب مع شاشة قابلة للطي الهاتف 5G

هناك جيل جديد رانجلر مسحوق دائرة مشغول، جيب 4X4 نظام التكنولوجيا الذكية هو المسؤول عن حل المركبات القلق

شوم أوصى للغاية، تشو مينغ، لى مو الكتابة: Q وذكية الترجمة الآلية يجب أن نرى كتاب

يانغ يي تنهد ديورانت الغرب أقوى لغة Suqun تكلفة الرهن العقاري صاروخ لي، جميع رؤساء نتحدث معا مثل صاروخ

اختيار العلامة التجارية الجمهور الإقليمية للمنتجات الزراعية في هوبى أعلى 20، ناهيك عن أنك لا تعرف ~

لإقناع "الطبقة الوسطى الجديدة المدينة الجديدة" و، أوشان COS1 درجة ما جرأة؟

انتظرت وقتا طويلا، حتى النهاية لك! فندق Days Inn جزيرة بحيرة فى هوبى 23 نوفمبر الافتتاح الكبير

لم الحصين لا تأخذ الملك المقلية، ولكن مع الجيل الثاني فاميليا S5 و F5 من المحتمل أن الفوز في المباراة

أبدا غاب عن نهائيات كأس العالم خمس مرات القمة، فاز الكتابة أسطورة بيليه ثلاثة، 3R الفوز مزيج الاجتياح

هانتشونان وفوجيان فهم الحب، هوى تظهر امرأة لأول مرة تسجيل الدخول أيام ماكو انتو بحيرة

مزدحمة بكين معرض السيارات، التي باعت خمسة نماذج عالية لهجة هو الفرق بين قلبي جيدة