2.6 مليار كمية المعلمة، ويقترب من مستوى الإنسان، وجوجل المفتوح chatbot المجال ما هو المغزى؟

جعل عمالقة التكنولوجيا من وقت لآخر على بيان انفراجة في مجال AI، الذي نراه بالفعل صدمت قذيفة.

بالتوقيت المحلي من يوم 28 يناير 2020، قدم جوجل بلوق في حقل مفتوح في الروبوت دردشة مينا، والمعروفة باسم "الأقوى في التاريخ"، ثم هذه انطلاقة جديدة سوف سطع ذلك؟

[المصدر: مدونة جوجل المالك: مدونة جوجل]

الحقول المفتوحة التنمية chatbot الصعبة

في الواقع، وتصميم الروبوت دردشة ذكي ردا على وجود معلومات الزائد عصر انفجار المعلومات. في البداية، والناس الدردشة الروبوت باعتباره الشكل النهائي للتصميم محرك البحث والتنمية. وخلافا لمحركات البحث الحالية، يمكن إعطاء الطبيعي ويجيد الروبوت دردشة للإجابة دقيقة المستخدم على السؤال، يوفر الكثير من الوقت، مما يؤدي إلى تجربة أفضل للمستخدم.

تقسيم المشهد الاستخدام وبوت (Chatbot) محلية مفتوحة أساسا (المفتوح المجال)، وموجهة نحو مهام (العمل المنحى) نوعين.

ومن بين هؤلاء، هناك مهام محددة النظام مسألة الرد، دردشة النظام الحوار الروبوت، والرجوع إلى إعطاء إجابة القائم على مشكلة المستخدم (تستخدم عادة في بحث ذكي، ذكي السيطرة الأجهزة المنزلية ومشاهد أخرى) وعدة جولات من الحوار مع مستخدمي الروبوت دردشة (مثل الروبوتات خدمة العملاء والمبيعات الروبوت، وما إلى ذلك).

بوت الحقول المفتوحة (المعروف أيضا باسم الروبوت دردشة) وكما يوحي اسمها مفتوح للمجال مشهد الحوار، الموضوع، محتوى غير محدود، قلطه مثل مايكروسوفت وأبل سيري. وقالت جوجل في بلوق أعلاه:

البحث عن بوت حقل مفتوح وليس فقط قيمة الأكاديمية، ولكن أيضا لتحفيز الكثير من التطبيقات المثيرة للاهتمام، مثل التفاعل بين الإنسان والحاسوب أعمق، من أجل تعزيز تأثير تعليم اللغات الأجنبية، وخلق فيلم لعبة الأحرف التفاعلية.

ومن الجدير بالذكر أن بوت مناطق مفتوحة أكثر انسجاما مع وضعية أذهان الناس، "الذكاء الاصطناعي" من الصعب تطوير وبطبيعة الحال، الكثير - الحقول المفتوحة تمثل مشكلة خطيرة تواجه بوت هو أن مضمون التعبير في كثير من الأحيان لا معنى له، وليس مشاكل متماسكة وسهلة، وبسبب عدم وجود الحس السليم الأساسية والمعرفة، ونحن لا يمكن أن تعطي ردود محددة.

وجوجل هو تطوير مفتوح المجال مينا دردشة الروبوت، الروبوت مقارنة دردشة القائمة، ما إذا كان أي اختراق؟

[مينا ومحادثة الإنسان المصدر: مدونة جوجل]

2.6 مليار الحوار معالم النموذج نهاية الأعصاب

وقالت جوجل في عرض تقديمي بلوق، مينا هو نهاية المعلمات تدريب 2600000000 العصبية نموذج محادثة، هو أكبر GPT-2 إصدار (1.5 مليار المعلمة) نموذج 1.7 مرة. ويزعم أن استخدام جوجل 40 مليار كلمات مجموعات البيانات، من خلال 2048 وحدة المعالجة موتر (أي وحدة المعالجة التنسور، تكرس Google رقاقة AI) التدريب لمدة 30 يوما، كان أفضل إصدار. تبين التجارب أن، بالمقارنة مع SOTA الروبوت دردشة، مينا أقدر على إكمال الحوار، والمحتوى هو أكثر تحديدا واضحا.

يقال، وتطورت محول مينا على فك التشفير والترميز 13 عنصرا تطورت محول: ترميز لمعالجة سياق الدورة، فإنه يساعد على فهم كل مينا الآخرين؛ واستخدام وحدة فك الترميز سيولد رسالة الرد. في هذه العملية، وقالت جوجل:

ووجد الباحثون أنه بعد تعديل فائقة المعلمة، والمفتاح لتحقيق الحوار ذات جودة عالية هو فك أكثر قوة.

[المصدر: مدونة جوجل المالك: مدونة جوجل]

علمت شبكة لى فنغ، وجوجل من مرشح المجال العام حوارات وسائل الاعلام الاجتماعية حصلت 341GB من النص والسياق في النص نظمت شجرة "جولات متعددة من الحوار" التدريب. الباحثون وكل جولة من الحوار كعينات التدريب، في حين أن الجولة 7 معلومات سياق الحوار السابقة، تشكل معا مجموعة من البيانات. يقال، حدد 7 كسياق للحوار، وذلك لضمان طويلة عملية التدريب معلومات سياقية كافية، ونموذج أيضا لا يمكن أن يتجاوز حدود الذاكرة. بعد كل شيء، والنص لفترة أطول، احتلت المزيد من الذاكرة.

تقييم الإنساني للSSA المقترح الجديد

وفقا لبلوق، وهذه هي الأداء المبنية على تقييم البشري المقترحة حديثا غوغل، "الإتزان وخصوصية متوسط (SSA)" مشتقة، وهذا يرجع إلى اقتراح مؤشرات جديدة، وتقييم بوت الإنسان الحالي معقد جدا، وأنه من الصعب لتشكيل تقييم موحدة. وقالت جوجل، SSA يمكن التقاط الأساسية، ولكن الحوار الإنسان هو سمة مهمة جدا.

لحساب هذا المؤشر، اختبر الباحثون مينا، Mitsuku، كليفربوت، DialoGPT قلطه وغيرها من شيوعا دردشة الروبوت. في الاختبار، كل لالروبوت دردشة، جمع الباحثون 1600-2400 في 100 الأحاديث، الاستجابة إلى كل بوت من يسجل المقيمون الإنسان (الأساس الرئيسي لطلاقة الحوار ودقة الأجوبة) ، كل أداء أدناه.

[المصدر: مدونة جوجل المالك: مدونة جوجل]

ليس من الصعب أن نرى، مقارنة مينا مع الروبوت SOTA دردشة القائمة، SSA لديها أعلى درجة، أو حتى بالقرب من الأداء البشري.

الحيرة يرتبط بقوة مع SSA

ليس هناك شك في أن تقييم الإنسان أكثر أو أقل هناك بعض المشاكل، لذلك كثير من الباحثين يأملون في العثور على التقييم يمكن أن تحسب تلقائيا، وهذا مؤشر لتكون قادرة على تقييم بدقة المراسلات والبشر.

لى فنغ شبكة المستفادة الحيرة (الحيرة، ويشير إلى أي مؤشر محدد من نموذج الحوسبة العصبية يمكن بسهولة الحصول على محادثة) هو نموذج seq2seq (لى فنغ شبكة ملاحظة: المتغيرات الشبكة العصبية الدورية، من بينهم اثنان جزء من التشفير وحدة فك الترميز، ونموذجا هاما لمعالجة اللغة الطبيعية، ويمكن استخدامها لالترجمة الآلية، ونظام الحوار مؤشر المشترك، التلخيص التلقائي) تستخدم لتقييم حالة عدم اليقين من طراز اللغة.

ومن الجدير بالذكر أن جوجل أثبتت أن الحيرة يرتبط ارتباطا وثيقا SSA.

في الواقع، وتدريب مينا على وجه التحديد من أجل تقليل درجة من الارتباك، وكذلك علامة على التنبؤ القادمة (لى فنغ شبكة ملاحظة: يشير إلى الكلمة التالية في المحادثة) عدم اليقين - وفقا لبلوق، قال ذلك لأن جوهر مينا الهندسة المعمارية تطورت محول seq2seq، وهذا هو، ومحول من خلال التطور العمارة البحث الهندسة المعمارية العصبية، قادرة على تحسين الحيرة.

وقالت جوجل في بلوق، وفقا لعوامل الباحثين طبقات، وعدد من الاهتمام، وتدريب على بعد خطوات قليلة، والترميز، وتدريب الأساليب، لقد اختبرت ثمانية نماذج مختلفة، وجدت أن خفض الارتباك، وكلما ارتفعت درجة SSA، في حين أن اثنين الصورة ارتفاع معامل الارتباط (R ^ 2 = 0.93).

[المصدر: مدونة جوجل المالك: مدونة جوجل]

في نفس الوقت قالت جوجل:

سيستمر الباحثون من خلال تحسين خوارزميات، أبنية والبيانات والحساب، وما إلى ذلك، والحد من الحيرة من هذا النموذج جلسة العصبية.

مينا معنى الحياة؟

وفقا للبيانات الواردة في بلوق، ونحن نعتقد مينا الأداء المتفوق في الواقع، ولكن مينا بالضبط متى الإطلاق، كيفية التصرف بعد إدخال الحقيقية، قد يكون للعب علامة استفهام. بلوق يذكر فريق البحث يقوم به حاليا للمزيد من تقييم مخاطر وفوائد هذه الدراسة، ويمكن أن تطلق مينا في الأشهر المقبلة، والتي تهدف إلى تعزيز تطوير الحقل.

وفي هذا الصدد، قال مراسل VentureBeat رونالد عشري في تقريرها:

أولا، يجب علينا أن ندرك أنه حتى لو كانت جميع جوجل كود مفتوح المصدر، يمكن أن قلة قليلة من الناس تدريب مينا نموذج مماثل. مينا لا يزال ينبغي المختبر، وهذه العملية معقدة جدا، فلا يمكن دمجها في أداة واحدة، ولكن جوجل لا يمكن سرعان ما كخدمة للمستخدمين. ولذلك، فإنني أخشى على المدى القصير من الصعب إطلاق مينا.

وبالإضافة إلى ذلك، من الناحية العملية، هو مينا صحيح كما دردشة الروبوت الحقول المفتوحة، ويمكن تحقيق عدة جولات من الحوار. ولكن مينا لا يساعد المستخدم لإكمال المهمة، وتعلم مهارات جديدة معين، أو للمستخدم لإعطاء الاضطراب العاطفي أو الدعم النفسي، والمستعمل دردشة أي هدف واضح. محادثات تستغرق وقتا طويلا وغير منتجة في إطار العصر الذي نعيش فيه لا يبدو مثاليا.

في نفس الوقت، كما أثار مراسل رونالد عشري مينا المزيد من الأسئلة. وكما ذكر أعلاه، وجوجل من مرشح المجال العام حوارات وسائل الاعلام الاجتماعية حصلت 341GB من النص، من أجل إجراء مزيد من التدريب. حسنا، فإن الملايين من المحادثات وسائل الاعلام الاجتماعية في المجال العام يكون ما يسمى "التاريخ من أقوى بوت" في البيانات الصحيحة مجموعات تفعل؟ سوف مينا معرفة ما إذا كان أو لم يكن مناسبا، قد يكون أيضا نقطة من قلقنا.

في السنوات الأخيرة، والمزيد والمزيد من AI حل دردشة في الحياة، ونحن بحاجة إلى التركيز على أثمن شيء - تعريف إنسان مثل الحوار، واستكشاف دور هذا الحوار في دردشة في مجال الروبوتات.

كما قال رونالد عشري:

مينا تقربنا من الهدف، ولكن لم تدع لنا تحقيق أهدافنا.

إشارة:

https://venturebeat.com/2020/02/01/just-how-big-a-deal-is-googles-new-meena-chatbot-model/

https://ai.googleblog.com/2020/01/towards-conversational-agent-that-can.html

تطور الأعصاب: كدراسة عدم العمق

ياوتشنغ المحطة التالية! الاستماع! 20 بطل على اعتراف الطريق إلى البيت لأهل المدينة

2019 صناعة السجائر الإلكترونية أعلى 10 العلامات التجارية - المحموم السجائر الإلكترونية المهجورة مطرقة عبر الحدود، والناي السحري، فاز أكبر تمويل من ركلة جزاء في هذه الصناعة

القدرة مزيج تعميم سيئة؟ في محاولة لمعرفة عمق التكامل جنبا إلى جنب حلالا

من جونغ إلى "المبيد"، استولت على انهيار الألعاب AI

السنوات اللاحقة إعادة صياغة المد والمفتشين مع وباء "بندقية": تأتي، ووضع رأسه على

تسريع تطور جديد المخدرات تاج الالتهاب الرئوي، BAT وقطع من المؤسسات البحثية AI حرة ومفتوحة لإجبار مشغلي

مقاطع مهرجان الربيع الذي AI قوية للحصول على جنون

ورقة اليوم | التعرف على الإيماءات الديناميكي، مجال التعلم غير خاضعة للرقابة مستقل، وتحليل المشاعر على الانترنت المالي القائم بيرت، الخ

أعلنت أمازون أرباح الربع الرابع، تجارية قوية سحابة الأداء

لماذا هو وظيفة الشبكة العصبية نشطة غير موجود؟

التعلم الخاضع للإشراف الذاتي ، كيفية حفظ التعلم العميق من معضلة البيانات؟