دردشة روبوت هبوط والقتال الفعلي المتقدم | مليون شخص يتعلمون الذكاء الاصطناعي

دينغ دونغ ~ أنت ضربت الرفاه! من الآن فصاعدًا ، سيتم تسليم 299 تذكرة لـ "2020 AI Developer Conference" مجانًا! أدخل صفحة التسجيل [2020 AI Developer Conference (التذكرة الحية عبر الإنترنت) -تدريب Live -CSDN College] ، انقر فوق "التسجيل على الفور"

في السنوات الأخيرة ، تطورت تقنية ومنتجات Robot Chat بسرعة. كتطبيق قاتل لتكنولوجيا الذكاء الاصطناعي ، تطورت روبوتات الدردشة على قدم وساق ، وظهرت العديد من الأجهزة الذكية إلى ما لا نهاية.

في هذه الطبقة العامة ، دعا معسكر قاعدة التكنولوجيا من الذكاء الاصطناعى ومثابرة الصحافة الإلكترونية المدير العام لشركة Shanghai Wudge Intelligent Technology Co. ، Ltd. اشرح الهبوط الروبوت والقتال المتقدم للجميع.

سوف تشرح هذه الدورة بشكل شامل الإطار الفني وتفاصيل التنفيذ الهندسي لروبوت الدردشة ، وتحليل نموذج الجيل التالي لروبوت الدردشة: الحياة الافتراضية. تنفيذ خريطة المعرفة.

هذه الدورة مناسبة لموظفي البحث والتطوير على خط الهندسة الأمامية. يمكنك تعلم تفاصيل روبوت الدردشة من خلال هذه الدورة. مناسبة لطلاب الجامعات ، يمكنك تعلم الإطار الفني والخوارزمية النموذجية لروبوتات الدردشة من خلال هذه الدورة.

ما يلي هو نشر كتاب السرعة من الطبقة العامة

شاو هاو: اليوم سأتحدث معك عن "أرض الروبوت والقتال المتقدم". أنا Shao Hao من شركة Shenzhen Dogto Smart Technology Co. ، Ltd. ، وهي الآن مسؤولة عن عمل معهد أبحاث الذكاء الاصطناعي للشركة ، وذلك أساسًا للقيام بالمنتجات المرتبطة بالدردشة.

ما أريد أن أتحدث عنه اليوم يتضمن هذه الجوانب ، بما في ذلك الأجزاء التالية:

  • في الجزء الأول ، سأتحدث عن الخلفية والهندسة المعمارية التقنية لروبوت الدردشة الشامل لروبوت الدردشة ؛
  • في الجزء الثاني ، سأتحدث معك عن جميع جوانب تنفيذ المشروع للروبوت في المشروع. هنا سأتعاون مع بعض التعليمات البرمجية لشرح لك كيف تتحقق كل وحدة وكل وظيفة. آمل أن يستمع الجميع إلى هذا الجزء. يمكنك أخذ روبوت الدردشة بنفسك ؛
  • في الجزء الثالث ، أود أن أتحدث إليكم عن التطبيق والمسار الفني لخريطة المعرفة في الحياة الافتراضية ، وإدخال الحياة الافتراضية لفترة وجيزة ، أي بعد أن نكتشف المشكلات المختلفة في chatbot ، فكر فيما إذا كان هناك طريقة أفضل للذهاب للذهاب لحل العديد من المشاكل التي تواجه روبوتات الدردشة ؛
  • في الجزء الأخير ، اقض من 5 إلى 10 دقائق للحديث عن القضايا الأخرى من المشروع التي تهبط في المشروع.

هذا كل شيء لمقدمة موجزة.

نظرة عامة على روبوتات الدردشة

أولا تقديم الخلفية. ما هو شعورك تجاه الذكاء الاصطناعي الآن؟ سواء أكان ذلك هو Alphago أو AlphaGo Zero ، أو هزيمة أفضل لاعبين من Human Go ؛ أو Debater Project ، وهو روبوت يشارك في النقاش البشري ، ويخلق نتائج جيدة في يناير من هذا العام ؛ الكلب ، إنه أيضًا تطبيق جيد للغاية للذكاء الاصطناعي ، ومثل Openai كان أيضًا قويًا جدًا في لعبة DOTA2 العام الماضي. شاركت DeepMind مؤخرًا في مسابقة "Starcraft 2". الذكاء الاصطناعي يخترق خيال البشر ، فما الذي لدينا انطباع بديهي للغاية عن الذكاء الاصطناعي الآن؟ الذكاء الاصطناعي هو كلي القدرة ، لذلك سوف نشعر أن ما إذا كان الروبوت يستيقظ الآن في وسائل الإعلام أو الدمار الإنساني أصبح أمرًا طبيعيًا للغاية.

إذا نظرنا إلى روبوت الدردشة مع هذا الشعور؟ أي نوع من الخبرة لدينا؟ قد يكون زملاء الدراسة الأعزاء مثلي. كل شخص مع منتج روبوت الدردشة هذا ، أخذنا حوالي يوم أو يومين. بعد مرور النضارة ، وجدنا أن هذا الشيء لن يتم فتحه أبدًا ، أو لن نتحدث معه أبدًا. ما الذي يسبب هذه الظاهرة؟ بالإضافة إلى سوء فهم الصوت والدقة ، ما زلنا متسامحين للغاية مع هذه القضايا. ولكن في المرة الأخيرة التي رأينا فيها تقريرًا عن وسائل الإعلام -ما الذي حدث عندما استخدم المستخدمون الأجانب مكبرات الصوت في Amazon؟ كان نائماً في الليل ، وفجأة كان الضوء في وضع التشغيل ، ثم سخر مرتين! هذا رهيب ، مخيف ، زاحف! إذا واجهت هذا الموقف ، ضحك المتحدث فجأة في منتصف الليل. بالإضافة إلى سحب قابسه ورميه من أعلىه ، لم تكن هناك طريقة جيدة لحل قلبي. الكراهية ، حتى نتمكن من رؤية أن منتج روبوت الدردشة هذا ضعيف حقًا.

الحديث عن منتجات روبوت الدردشة ، لماذا تفعل ذلك بشكل سيء؟ بصفتي ممارسًا ، ما زلت متسامحًا للغاية ، لأنني أعرف أين توجد حدود روبوت الدردشة ، لذلك كنت أفكر عندما سألت منتج Chat Robot: قد يواجه منتج روبوت الدردشة مشكلة في هذه التكنولوجيا المحلية ، لذلك أنا لا ألتزم طلب طلب أو محاولة تجنب سؤاله. لكن المستخدمين العاديين لا يتسامحون مع منتجات الدردشة الروبوت. لقد أنفقت الكثير من المال لشراء متحدث روبوت الدردشة هذا. ما آمل أن يكون روبوتًا يمكنه التحدث معي بشكل طبيعي ، ولكن بعد ذلك لا يمكن الوصول إليه ، سيشتكي من التطوير التنمية. بواسطة.

يتمتع المستخدمون عمومًا بتسامح منخفض لمنتجاتنا. ويشعرون أن التكنولوجيا الخاصة بك ضعيفة حقًا. في الواقع تحدد الدرجة. قال المعلم تشو مينغ ، نائب عميد معهد أبحاث مايكروسوفت آسيا ، ذات مرة إن ذكاء اللغة هو اللؤلؤ في تاج الذكاء الاصطناعي. إذا تعاملنا اللؤلؤ على التاج. ما معنى؟ معالجة اللغة الطبيعية نفسها أمر صعب للغاية!

اسمحوا لي أن أعطي مثالاً بسيطاً ، يفهم الجميع ، على سبيل المثال ، قلت كلمة ، "من الواضح أنها أفهمه ، لكنه لا يقول." سألت زملائي في الفصل ، من يحب ومن؟ من لا يقول ذلك؟ هذه الجملة صعبة. اسمحوا لي أن أقول كلمة ، على سبيل المثال ، "لم أره يأخذ محفظتك". إذا كان لدينا نغمة مختلفة ، نغمات مختلفة ، فإن معنى هذه الجملة مختلفة تمامًا. على سبيل المثال ، "لم أره يأخذ محفظتك" (الإجهاد على "رؤية") ، وهذا يعني أنني لم أره يأخذ محفظتك ، قد أستمع إلى رؤيتها بعيني ، أو "لم أفعل "أراه يأخذ محفظتك" (التوتر على "المحفظة") ، أي أنه أخذ الشيء الآخر ، لكنه لم يأخذ محفظتك.

لذلك عندما نفهم الجملة ، يتبع ذلك بالفعل السياق ، والذي يرتبط بشدة بمناظر المتحدث العالمية ، وعاطفة المتحدث ، وبيئة المستمع ، والرأي العالمي للمستمع. هل هو؟ " يختلف معنى الحوار في شخصيات مختلفة تمامًا ، لذا فإن تقنية NLP نفسها صعبة للغاية.

بالطبع ، هل تريد أن تفعل ، لماذا تريد أن تفعل ذلك؟

قلت ذات مرة في تقارير أخرى تفيد بأن Microsoft اقترحت مثل هذا الشعار في عام 2016 يسمى "الحوار هو المنصة". إنها تعتقد أن اللغة هي الطريقة الأكثر طبيعية للتفاعل البشري. بالتعاون وتردد بعضها البعض ، عند الحصاد ، يمكنك الثرثرة مع كل شخص في القرية لتعزيز صداقة الجميع. لذلك ، اللغة طريقة طبيعية للتفاعل مع البشر. ومع ذلك ، نظرًا للأجهزة والبرامج ، فإننا نتفاعل بشكل أساسي مع الكمبيوتر مع لوحات المفاتيح و muses من قبل ، لذلك بعد أن نكون الآن في التعلم العميق والبيانات الكبيرة وتحسين الأجهزة في GPU ، يمكننا استخدام اللغة مباشرة للتفاعل مع الجهاز. هذا هو هذا أيضًا هذا أيضًا. لماذا اقترحت Microsoft مفهوم "الحوار هو النظام الأساسي" في عام 2016.

نظام تكنولوجيا الدردشة البيئية روبوت

دعنا نلقي نظرة على كيفية تصنيف روبوت الدردشة. يمكن تقسيمه إلى ثلاثة أنظمة بيئية رئيسية: أحدهما هو الإطار ، والآخر هو المنتج ، والثالث هو النظام الأساسي.

كيف أفهم؟ Echo هو منتج ، Siri من Apple هو منتج ، و Son Xiaobai منتج ، و IBM Watson منتج ، و Xiaobing هو أيضًا منتج روبوت دردشة. تحتوي هذه المنتجات على نماذج عرض مختلفة ، مثل شركة Siri's Carrier هي الهواتف المحمولة أو WeChat أو Weibo ؛ لدينا مكبر صوت هو أجهزته. يجب أن تحتوي هذه المنتجات على حامل. قم بتضمين بعض المنصات مثل WeChat ، Line ، MSN ، إلخ. يمكننا أن نفهم أن هذا الإطار يستخدم لإنشاء منصة لهذا المنتج. هناك Alexa و Luis و Wit في الخارج. بعض الأطر المحلية مثل Ruyi و Unit تنتمي إلى إطار روبوتات الدردشة.

في اتجاه المنتج ، يتم تقسيم المنتجات بشكل أساسي إلى اتجاهين رئيسيين. تسمى الفئة الأولى التفاعل السلبي تسمى الفئة الثانية التفاعل النشط جوهر التفاعل السلبي الذي يطلق عليه الأمر كذلك هو أنني أطلب منه الإجابة ، وأقول كلمة لها ، ويخبرني كلمة ، وهذا يسمى التفاعل السلبي. تحدثنا للتو عن التفاعل السلبي ، ويتم تقسيم التفاعل السلبي بالفعل إلى عدة أنواع.

الممارسة الهندسية لروبوت الدردشة (شرح الكود)

سيتم الحديث عن الكود التالي للرمز مع الجميع من الدردشة ، إلى المهمة ، إلى السؤال والإجابة ، وفرز جميع فئات روبوتات الدردشة تمامًا. لا يمكن للعديد من روبوتات الدردشة القيام بالتفاعل النشط لأنه يتطلب معرفة خريطة معرفة قوية وتصميم مشهد . Amway ، نشرنا كتابًا بعنوان "المبادئ التقنية والتطبيقات الخاصة بـ Chat Robot" ، ويمكن للطلاب المهتمين إلقاء نظرة.

ابدأ الآن في إدخال الرابط القتالي الفعلي ، أبدأ بأبسط ، دون أي احتياطيات من المعرفة ، حتى أتمكن من عمل روبوت الدردشة. حتى نذهب إلى إطار chatbot ، واستخدام Python لتحقيق روبوت الدردشة هذا.

ابدأ بسرعة

ruyiruyi.aiHiHelloHi/Hello/ruyiHelloHelloruyi.ai

UNITUNITUNITunit.baidu.comUNITruyitesttest

كيف نفعل ذلك؟ruyiweathercityctiy

UNIT

NLUGPSDSTDPODPLDSTDPODST

UNIT

retrievalretrieval2014

(1)

3

TF-IDFBM25CS 224NChristopher ManningNLP

ElasticSearchESHNSWPDFPPT

ESPPTESImportElasticSearchESIP172.27.1.2039201similarity_chatqa_corpus

التالي هو العملية العادية. على سبيل المثال ، يجب علينا أولاً تهيئة كائن ، كائن ES صغير. جميع المعلومات الموجودة في هذا الكائن تأتي من معلومات ES التي قمنا بتكوينها للتو ، وهي رقم المنفذ و IP. بعد ذلك ، نريد إضافة بيانات إلى هذه ES ، لأننا نريد إضافة مجموعة من البيانات إلى ES. كيف يمكننا إضافة هذه البيانات في 13 صفحة؟ هنا لدينا طريقة للتعرف. تسمى هذه الطريقة insert_one_data ، وهي الطريقة التي ندخل بها سؤالًا وإجابة. كيفية إدراجها؟ يشتمل سؤال وجواب واحد على جزأين ، يسمى أحدهما الاستعلام ، والآخر يسمى الإجابة ، وهو Q ، A ، ثم نسمي طريقة فهرس ES. في الجسم. كيف يفعل ذلك؟ إذا لم تكن قاعدة البيانات هذه موجودة ، فستقوم مباشرة بإنشاء قاعدة بيانات جديدة تسمى هذا الاسم وإنشاء جدول يسمى "qa_corpus". بعد ذلك ، لكل بيانات ، بالإضافة إلى الاستعلام والإجابة ، هما عمودين من البيانات ، استعلام واحد ، إجابة ، ويقوم تلقائيًا بإنشاء معرف ، وهو ما يعادل آخر البيانات التي ننشئها. إنه إجابة ، العمود الثالث هو معرف ، الذي أنقذنا مثل هذه الجمل مقدما.

ماذا عليك أن تفعل بعد ذلك؟ بعد ذلك ، نحتاج إلى إجراء بحث. بعد أن وصلنا إلى سؤال ، حددنا طريقة تسمى "التشابه _chat". العتبة. الإجابة بدرجة من التشابه هي أكثر من 90 ، والعودة كأفضل إجابة مرشح. تنسيق الجسم هو الاستعلام وهذا الحد الأدنى _ chould_match ، وهو قيمته بنسبة 90 . ثم نستخدم طريقة بحث ES للعثور على مجموعة المرشحين الخاصة بها ، وبعد العثور على المرشح لمقارنة هذه العتبة. إذا كانت جميع العتبات أقل من 90 من تصميمنا ، فسوف يعيد جيبًا مباشرةً ، مثل الإجابة ، على سبيل المثال ، الإجابة ، الإجابة هذا هو رد جيب ، ثم إرجاع الإجابة ، هذه هي طريقة التنفيذ بأكملها.

ألقِ نظرة على العملية المحددة. أولاً وقبل كل شيء ، الصورة على اليسار هي المجموعة الثلاثة التي أدخلناها. الاستعلام والإجابة المدرجين في المجموعة الثلاثة "ملابسك جميلة جدًا" ، "شكرًا لك على مدحك" ، ثم هاتين الجملتين. لدينا الآن Query_Sent هو "ملابسك جميلة". نسمي طريقة "التشابه Quality_Chat" التي قمت بإعدادها للتو لصب هذا الاستعلام في ذلك ، ثم استرجاع أفضل جملة هي الأولى. بمعنى آخر ، نستخدم بالفعل طريقة الحساب لدرجة التشابه الافتراضي لـ ES الافتراضي هنا. يمكن أن تخبرك طريقة الحساب هذه هنا. يمكنك تغيير طريقة الحساب الخاصة بك فيها لأننا نعرف درجة المطابقة. يمكن أن تكون النتيجة محسّن بنفسك. لذلك ، يمكنك ضبط طريقة الحساب للنتيجة بناءً على موقفك الفعلي ، ثم إنشاء محرك بحث أكثر تخصيصًا. أخيرًا ، هذه الإجابة هي "شكرًا لك على مدحك". يتم تقديم الطريقة باختصار هنا.

لتلخيص ، ما هي ميزة محرك بحث تشابه ES؟ يشبه النص نفسه دعمًا معينًا للتعميم. على سبيل المثال ، يمكنك إضافة كلمة نغمة "AH" أو "OH" ، أو إضافة فاصلة ، إضافة علامات ترقيم ، والتي يمكن أن تلعب بشكل أفضل استرجاع في استرجاع التشابه. بالطبع ، هذا التعميم بحد ذاته هو وحدة أكثر أهمية يمكن قولها بمفردها. على سبيل المثال ، تسمى طرقنا الشائعة الاستخدام الترجمة الآلية. يمكننا استخدام طرق الترجمة الآلية لتعميم عدد كبير من الجمل ، بحيث يمكن لروبوت الدردشة لدينا دعم جمل أكثر تعميمًا. النقطة الثانية من المزايا ، خوارزمية BM25 في ES لديها الكثير من الأوزان لضبطها ، وهي أكثر منطقية من المسافة الهامشية في النص القصير.

العيب واضح أيضًا. أعطني مثالين ، والجميع يفهمه جيدًا. على سبيل المثال ، "أنت جميلة جدًا" ، "أعتقد أنك تبدو جيدًا" ، دعونا ننظر إلى تشابه هذا النص. أي الكلمات فيه هي نفس التقاطع "أنت" هو نفسه "جيد" ، والكلمات الأخرى مختلفة ، والدلالات متشابهة ، ولكن عندما لا تكون شخصية النص متشابهة للغاية ، قد لا تكون خوارزمية التشابه جيدة ، ولكن دلالاتها متشابهة للغاية. الوضع الثاني هو ماذا تفعل؟ على سبيل المثال ، "أنا معجب بك" و "أنا لا أحبك" ، فهذا يعني عكس ذلك تمامًا ، ولكن عندما يكون استرجاع تشابه النص ، إذا لم نحصر الكلمات السلبية ، فإن الدرجات عالية جدًا "،" أنا عشرات مثلك "و" أنا لا أحبك "مرتفعة للغاية ، وهذا الموقف صعب للغاية. ما هي طريقة العلاج العامة لدينا؟ الطريقة الأولى هي القواعد. على سبيل المثال ، يمكنني تعيين بعض قواعد التصفية للكلمات السلبية. عند مواجهة "لا" ، فهذا يعني عكس الجملة الأصلية ، أو كيفية استخدام طريقة دلالات النص. استرجاع الدرجة ، نحن سيخبرك بالثاني التالي ، كيفية القيام بذلك بناءً على التشابه الدلالي.

(2) بناءً على التشابه الدلالي

والثاني يعتمد على التشابه الدلالي. التشابه الدلالي هو عمومًا ثلاث خطوات. الثلاثة من مدرستي هنا عبارة لا أتحدث عما يجب القيام به. إذا كنت مهتمًا ، فيمكنك قراءة الأوراق الأصلية مثل Word2Vec ، أو إلقاء نظرة على نماذج اللغة التي نكون الآن Elmo و Transformer و Bert. كيف هو ناقل الكلمات الديناميكي؟ لن أشرح كلمة ناقل. إخراج المتجه الكلمة هو تحويل كلمة إلى متجه ، مثل التحول إلى ناقل 200 أبعاد أو 300 أبعاد. هذا هو متجه الكلمة.

الخطوة الثانية هي صنع متجه الجملة. على سبيل المثال ، المثال الذي أعطيته للتو "أنا معجب بك" إنه ثلاث كلمات. أنا ، مثل ، كيف يمكننا أن نجعل متجه الجملة بعد أخذ ناقل هذه الثلاثة الكلمات؟ عندما تخرج ، هناك بعض الطرق ، مثل إضافة متوسط ، مثل قيمة القطب المتجه ، مثل fasttex متجه الجملة. في الواقع ، يمكنك استخدام بعض متجهات ما قبل التدريب. على سبيل المثال ، يجب أن يكون لدى Tencent ناقل كوربوس كبير مسبقًا.

والخطوة الثالثة هي حساب مسافة المتجه. بعد أن يكون لدينا جملان من المتجه ، فإن الخطوة التالية هي حساب تشابهها ، أي مسافة المتجه. قد يتبنى النهج العام نفس الدرجة من مسافة اليورو أو السلسلة ، مما يعني أننا نحصل على درجة. أو بعض الأساليب القائمة على التعلم العميق هي الطرق التي تستمر في التشابه الدلالي لحساب تشابه النص في PPT لدينا. فيما يتعلق بخوارزميات مطابقة ، قمت فقط بإدراج بعض الخوارزميات الأولى أو الأكثر كلاسيكية التي تم اقتراحها. إذا كنت مهتمًا ، فهناك العديد من الأوراق التي يمكنك قراءتها ، بما في ذلك العديد من الأوراق الجديدة في هذا المجال.

من أقرب الحديث ، اقترحنا خوارزميتين في هذه الورقة في مختبر Ark's Ark's Huawei في عام 2014. تعتمد خوارزمية واحدة على التعبير وتستند خوارزمية على التفاعل. الفرق الأكبر بين الاثنين هو أنه عندما يتم احتساب الجملة من التشابه ، فإن خوارزمية التعبير بناءً على التعبير هو أداء الالتفاف والبدون لهاتين الجملتين ، والحصول على درجة المطابقة من خلال آلات الإدراك الحسي متعددة الأطباق. تعتمد الخوارزمية مثل MatchPyramid على التفاعل ، وقد ارتفعت هذه الخوارزمية الجملتين من البداية. نحن مكافئون لعملية حسابية منفصلة واحدة. يتم فصل الأخوين أولاً ، ثم يتم فصلهما أخيرًا ؛ هناك شقيقان يفركان معًا ويعجنون في مصفوفة. هناك بعض من المشغل. الجميع ، الجميع ، الجميع ، الجميع ، الجميع ، الجميع ، الجميع ، الجميع عند النظر إلى الورقة الأصلية ، هناك نوعان من المشغل ، واحد مضاعفة والآخر يزيد. نحن نستخدم هذه الكلمات الثمانية في هذه الجملة ، وكل كلمة تؤدي تشابهًا مع مصفوفة 8 8. ثم في هذا الأمر ، نقوم بذلك. يحصل التصور النهائي متعدد الطبقات على درجته النهائية. لذلك لا يوجد سوى هذين الاتجاهين ، طريقة مطابقة مسماة ، وطريقة مطابقة تفاعلية. إذا كنت مهتمًا ، فيمكنك إلقاء نظرة على الورقة بعمق.

(3) بناءً على التعلم العميق

ثالثًا ، هناك طريقة استرجاع أخرى تعتمد على التعلم العميق. اخترت ورقة أكثر كلاسيكية للتحدث معك لفترة وجيزة. اقترح فريق Microsoft Xiaobing طريقة في عام 2016 ، ليس فقط النظر في مستوى الكلمات ، ولكن أيضًا تشابه مستويات الجملة. ماذا يعني ذلك؟ لشرح باختصار ، لدينا 4 جمل هنا: u (1) ، u (n-1) ، u (n) ، r ، هناك العديد من الجمل في الوسط ، نفترض أنها 4 جمل ، إنها تريد الآن حساب u و r التشابه ، كيف تحسبها؟ سوف تضمن كل كلمة ، أي ، مثل التوجيه ، ثم أخذ الكلمة بكلمة r مباشرة ، أي الحصول على مصفوفة M2. بعد الحصول على هذه المصفوفة حساب تشابه سلسلة Yu Xian ، نحصل على مصفوفة تمثل M1 ، وبالتالي فإن المصفوفتين من M1 و M2 يمثلان تشابه الكلمات ومستوى بناء الجملة ، ثم من خلال CNN ، و GRU ، وأخيراً الحصول عليها. هذا هو البعض منا الذين لديهم بعض أساليب استرجاع التعلم العميقة ، ولن أعرض في العمق. لقد أخبرتك للتو عن التشابه القائم على النص ، والتشابه الدلالي ، وطرق الاسترداد القائمة على التعلم العميق.

(4) طريقة التعلم العميق بناءً على صيغة التوليد

النوع الرابع ، تحدث إليكم عن طريقة التعلم العميق بناءً على صيغة التوليد. هذه هي الورقة الأولى ، ويجب أن تكون ورقة صنعتها هواوي. ما فعلوه في ذلك الوقت هو توليد الرد النهائي مباشرة من خلال الجملة ، أي من خلال x (1) إلى x (t) ، توليد y مباشرة y (1) y (1).) إلى y (t) ، اقترحوا ثلاث طرق مختلفة. أحدهما هو الحصول على سياقها مباشرة من هذه الحالة الضمنية ، والطريقة الأخرى هي إضافة الانتباه إلى الداخل ، واستخدام هذا الاهتمام للحصول على الجملة النهائية ، والآخر هو إدخال ، واهتمام مستوى الكلمات ، يدعونهما إلى اثنين من الاهتمام ولدت من قبل المحلية والعالمية. هناك أيضًا العديد من الأساليب التوليدية بعد ذلك ، لأن هذا الحديث يعتمد على القتال الفعلي ، لذلك نحن لا نفعل الكثير في التفسير المتعمق للجوانب النظرية.

تصميم العمارة

أخيرًا ، جئت إلى القطعة الأكثر تعقيدًا. إذا أردنا استخدام رمز Python الخاص بنا من 0 إلى 1 لإنشاء روبوت دردشة ، كيف ينبغي لنا أن نفعل ذلك؟ الخطوة الأولى هي تصميم الهندسة المعمارية أولاً. يجب تقسيم بنية روبوت الدردشة هذا إلى عدة أجزاء. يجب أن نستخدم Python لكتابة وحدة DM (إدارة الحوار) ، ثم ستتلقى هذه الوحدة بعض المعلومات عن فهم اللغة الطبيعية (NLU). إجراء جمل على الجمل. تحليل النية ، في الوقت نفسه ، سيختار وظيفة تستند إلى نتائج النية ، مثل ما إذا كان حوار المهمة أو حوار وظيفي أو سؤال وإجابة أو دردشة. لديه طريقة مختلفة للمعالجة. الوحدة النمطية ، هذه هي بنية بسيطة لروبوت الدردشة بأكمله.

NLG. لماذا لا تتحدث عن الوظيفة والدردشة؟ تفترض الوظيفة أنه يمكنك استخدام حزم مهارات Ruyi ووحدة مباشرة ، ولن نطورها. تحدثت أيضًا عن الدردشة الآن. استخدمنا طريقة الاسترجاع للدردشة. استخدمنا العديد من Corpus لإجراء دردشة من نوع البحث. هذا هو تصميم العمارة الذي نقوله.

nlu

النقطة الأولى ، كيف تفعل NLU. خذل الجميع ، لا يوجد رمز في NLU ، لماذا لا يوجد رمز؟ نظرًا لأن العديد من المشاريع المفتوحة المصدر تقوم بعمل NLU ، فإن NLU هي في الواقع الكثير من الوحدات النمطية. على الأقل هناك أكثر من عشرة وحدات نستخدمها الآن. ماذا تتضمن هنا؟ الكلمات ، علامات الكلمات ، الاعتماد ، التحليل العاطفي ، الروابط الجسدية ، الاكتشاف الجسدي ، الاضطرابات الدلالية ، الاعتراف بالموضوع ، حكم فعالية الجملة ، إلخ. هذا ليس درسًا يمكن الانتهاء منه. لكنني أقترح عليك ، إذا كنت تريد حقًا تحقيق روبوت الدردشة بطريقة بسيطة ، لماذا لدينا أشياء جيدة؟ يعد تجزئة Word Word Jieba مشروعًا مفتوحًا جيدًا للغاية. يحتوي الأكاديمية الصينية للعلوم أيضًا على Nlpir. معهد Harbin للتكنولوجيا لديه LTP. إذا قمت بذلك بنفسك ، فهذا أمر مزعج للغاية إذا قمت بذلك بنفسك. على سبيل المثال ، إذا قمت بتقسيم الكلمات وتعتمد عليها ، فستقضي الكثير من الوقت. أفضل طريقة هي استخدام أشياء شخص آخر. سأضيف بعض التخصيص الخاص بي. هذا ما أريد أن أخبرك به.

نية

النقطة الثانية هي تصنيف. أريد أن أتحدث إليكم أسهل طريقة لتنفيذ نية النية. هناك عدة أنواع من تصنيف الطريقة بأكملها. على سبيل المثال: الطرق التقليدية ، بالطرق التقليدية ، يمكننا استخدام الميزات ، واستخدام بعض المصنفات ، ثم مباشرة إلى هذه النية ، مثلنا ، مثل الولايات المتحدة ، استخدم شجرة القرار أو SVM لتصنيف الجملة مباشرة. بالطبع ، يمكن تصنيفه بطرق العمق ، مثل CNN أو CNN+LSTM. الصورة الموجودة على اليمين هي طريقة للتصنيف العميق. إنها كلمة بعد التضمين. أنا كلمة. إنها متجه 5 أبعاد. هذا مثال. ثم كل كلمة لها كلمة. سيكون لدينا بعض عمليات الالتفاف والتجميع. آخر شيء نحصل عليه هو نتيجة تصنيف ثانية. ويتم ذلك أيضًا باستخدام التعلم العميق. ولكن ماذا نحتاج أن نأخذ في الاعتبار في الهندسة؟ من الضروري أيضًا النظر فيما إذا كنا فئتين أو فئتين متعددة أو تصنيف هرمي. فئتان بسيطتان ، 1 و 0. التصنيف المتعدد بسيط للغاية أيضًا ، على سبيل المثال ، هناك "تحييد" في العواطف. تصنيف المستوى معقد نسبيًا. على سبيل المثال ، تحتوي منتجاتنا على خمس طبقات من التصنيف وأكثر من 300 نية ، لذلك عندما أفعل ذلك ، ما هي الطريقة التي يمكن أن تضمن أن لديها استدعاء مرتفع نسبيًا. هذه هي المشكلة التي يتعين علينا القيام بها في المشروع ، وهي في الواقع معقدة للغاية.

بعد ذلك ، سأتحدث إليكم كيفية تصنيف نية القواعد والأساليب. من الدقيق للغاية تصنيف نية تنفيذ نية القواعد ، ولكن عيبها هو أننا نحتاج إلى تغطية كل جملة. سيصبح النموذج من الصعب للغاية الحفاظ عليها ، وهو عيبها. دعنا نلقي نظرة على كيفية قيام القواعد بذلك. على سبيل المثال ، أعطي حجة هنا لثلاث نوايا مختلفة ، أحدهما "نكات" ، ويسمى أحدهم "تعبيرات التوصيل التنين" ، ويسمى أحدهم "الطقس". يتم كتابة القواعد المقابلة مثل هذه ، مثل "مزحة" ، والتي يمكن تغطيتها. التالي هو نفسه.

كيف افعلها؟ دعنا نلقي نظرة على وجود وظيفتين على اليمين. تسمى الوظيفة الأولى البناء ، وتسمى الوظيفة الثانية intent_recognition. يتمثل دور هذه الوظيفة في التجميع بانتظام ، وينبغي أن يكون التجميع العادي واضحًا للغاية. إذا قمنا بتسجيل التعبيرات العادية مسبقًا ، فيمكننا تسريع سرعة المطابقة العادية بشكل فعال. هذا هو التجميع. لن أتحدث عنها. والثاني هو تصنيف التصنيف. إذا كان هناك استعلام قادم ، كان المرشح _list فارغًا في البداية. إن طول السلسلة هو الترتيب إلى النية. بمعنى آخر ، قد يتطابق مع نوايا مختلفة. في هذا الوقت ، نحتاج إلى فرز النوايا بناءً على طول السلسلة التي تتطابق معها ، وأخيراً يتم فرز المرشح وإخراجه. قطعة من الكود.

طب الله: نص سريع

إذا كنت لا تريد أن تكون مزعجًا للغاية ، فهناك دواء سحري يعالج جميع الأمراض التي تسمى FastText ، وهي طريقة تصنيف تستخدم على نطاق واسع من قبل مجتمع الهندسة في عام 2018. بالطبع ، يتم استبدال هذه الطريقة بخوارزميات أكثر تقدماً مثل Bert و Elmo ، Transformer ، وهي ليست تجاوزًا. لا يزال الجميع يفعلون ذلك معًا ، وأحيانًا عند القيام ببعض طرق التراص ، سنستخدم أيضًا Bert أو GPT. ومع ذلك ، فإن تأثير fasttext نفسه واضح للغاية على تصنيف النوايا ، ولأنه يعتمد على السلسلة ، فإن أدائه مرتفع للغاية أيضًا. تصنيف عالم الهندسة.

دعونا نرى مدى استخدام النص ، إنه بسيط للغاية! الكود الخاص به بسيط للغاية. نحتاج فقط إلى إعداد مجموعات البيانات مع علامات مصنفة. تنقسم مجموعات البيانات المصنفة إلى كلمات جيدة. على سبيل المثال ، تسمية هذه الجملة هي الطقس ، وتسمية هذه الجملة هي الموسيقى ، وعلامة هذه الجملة هي الأخبار. لقد أعددنا عشرات الآلاف من مجموعات البيانات لتقسيمها إليها فيه فيه فيه فيه إلى تقسيمه إلى ذلك. مجموعات الاختبار ، مجموعات التحقق ، ومجموعات التدريب. تدرب ، يمكن استخدامه مباشرة مع القطارات. هذا هو التدريب. كيفية استخدامها؟ طرحنا النموذج ، ثم ذهبنا إلى ملصق التنبؤ ، ثم تنتهي علامة الإرجاع. Fastext هي خوارزمية سهلة الاستخدام للغاية.

DM (إدارة الحوار)

النقطة الثالثة ، بدأ الجزء التالي في الحديث عن DM. لم يتم نشر رمز DM هنا لأن هذا معقد للغاية. اسمحوا لي أن أخبرك كيف يتم تحقيق الإطار بأكمله. يتحكم DM في الحوار. في كثير من الحالات ، جولات متعددة من التحكم في الحوار. أعطيت حوارًا متعدد الصدفة هنا. المثال هنا هو الطقس. أنا مدرج هنا 1 و 2 و 3. إنه بعض المستخدمين الذين قالوا في الجولات الثلاث الأولى. هل تمطر يوم الأحد؟ " كان وقت الحوار في الساعة 8 في 21 مارس. كانت نيته الطقس. الجوهر بعد أن ترسم هذه المعلومات ، سوف نرد على ما يشبه الطقس في شنغهاي في 17 مارس. هل تمطر؟ هذه هي الجملة الأولى من المستخدم يسأل. فيما يلي هو نفسه.

سألت الجملة الثانية من المستخدم "ما هو الطقس في شنغهاي اليوم" ، لذلك فإن ردها الأخير هو الطقس في شنغهاي في 21 مارس. قال مستخدم الجملة الثالث أنه غير ذي صلة. يشعر المستخدم بأن الطقس سيء للغاية اليوم. ماذا يجب أن أفعل؟ "لا تخرج غدًا." في هذا الوقت ، بدأنا نقول هذه النقطة. النقطة المهمة هي أنه عندما قال المستخدم في الجملة الرابعة ، "ماذا عن الغد ، ماذا علي أن أفعل؟" بعد أن نظرنا إلى عملية المعالجة ، دخلت الجملة "غدًا" تحليل النية ، وجدنا أن النية الطبيعية لهذا الجملة النتيجة منخفضة للغاية ، أي أنها ليست مثل نية طبيعية. لقد قمنا بالفعل بتحميل السياق عندما يتم الحكم على النية ، أي سجله أعلاه. في هذا الوقت ، نستخدم نموذج المصنف للحكم أو استخدم بعض القواعد. الحكم قد ينتمي إلى نية متعددة متعددة. أي واحد من هذه النية المتعددة ينتمي إلى؟ سنجد هذه النافذة. هناك نوافذان ، يُطلق على إحدى النافذة الزمنية ، والآخر يسمى نافذة رقم العجلة. إنها 5 دقائق ، وسيتم التقاط البيانات في 5 دقائق. بعد التقاط هذه البيانات ، نحكم على أنها بالفعل جملة أدناه. بعد هذه الجملة ، ملأنا الفتحة. "غداً" حكمنا أنه كان يسأل الطقس. ما هي معلومات الفتحة لهذا الطقس؟ غدا هي معلومات الوقت ، أين الموقع؟ الموقع الذي استخدمناه مباشرة معلومات الأخدود عن المكان الذي سأل فيه الطقس في الجولة السابقة. لذلك في النهاية ، تكون معلومات الفتحات الخاصة بنا هي في الواقع "شنغهاي" ، والوقت هو "22 مارس" ، وهو الطقس في شنغهاي غدًا. استخدم جهاز الحالة هنا ، ثم حدد نوع التشغيل الذي نقوم به بعد ذلك ، وسوف يمر عبر خطوات DST. في الوقت نفسه ، بعد الرد ، أضفنا أيضًا هذه السجلات إلى قاعدة بيانات السجل الخاصة بالسجل ، وأخيراً أظهرنا محادثة. هذه هي عملية تشغيل DM.

الحوار على أساس مهام محددة

النقطة الرابعة هي مثال حوار يعتمد على مهمة محددة. هناك العديد من كود المهام المحددة. لا توجد طريقة لتثبيتها ، لذلك فقط نشر الوحدات الأساسية. على سبيل المثال ، سيكون لدينا قيود على الفتحة أولاً ، مثل التاريخ هو الوقت المناسب بما في ذلك "اليوم | غد | معبد | هذا الأسبوع | الأسبوع المقبل" ، إلخ. الموقع ، عندما يكون هناك مثل هذا السؤال ، سنقوم أولاً خذ النية لتحديد ، النية الموفرة ، سنحدد هذا الاستعلام. إذا كانت هذه النية الطقس ، فستدخل استخراج الفتحة أولاً. لقد استخرجنا استخراجنا. يعتمد الأخدود على معلومات الفتحة الموجودة أسفل الطقس. ومكان ، لذلك لدينا وظيفة لضخ الوقت ووضع المعلومات. بعد ذلك ، بعد استخراج الفتحة ، نحتاج إلى أن نسأل واجهة الطقس. في هذا الوقت ، على سبيل المثال ، نستخدم الطقس Sina ، وهناك خدمة للطقس Sina. نحتاج إلى استخدام هذا التاريخ والمحلي في مثل هذا الطقس ، يطلق عليه Weather-INFO. مع هذا الجهاز التنفيذي ، نستخدم وحدة NLG لإجراء رد على الحصول على هذا anwser ، والذي يعتمد على العملية البسيطة لحوار المهمة الخاص بنا.

وحدة أسئلة وأجوبة

النقطة الخامسة ، قدمت بعد ذلك وحدة الأسئلة والأجوبة في الوحدة النمطية الآن. ما عليك سوى إخبارك عن طريقة الأسئلة وطريقة الإجابة المستندة إلى الوحدة النمطية ، هناك المزيد ، مثل التحليل الدلالي بناءً على نطاق هذه الدورة. ماذا تفعل بناءً على القالب؟ على سبيل المثال ، سأل المستخدم ، "هل ترغب في مشاهدة قطعة واحدة؟" تستخدم هذه الجملة طريقة معالجة القالب لمطابقة مكتبة القالب هذه أولاً. وسوف تتطابق مع هذه الجملة في مكتبة القالب هي الأقرب إلى من. بعد المطابقة ، سيكون لدينا قاموس أنيمي. إنه ينتمي إلى قطعة واحدة. قطعة واحدة تنتمي إلى نوع الأنيمي للترفيه ، لذلك يعطي أخيرًا عبارة رد مقابلة.

كيف افعلها؟ هذه هي العملية ، ونهجها مثل هذه. نحافظ أولاً على مجموعة من مكتبات القالب العادية ، مثل "أنت تحب (.*)". هذه مكتبة القالب العادية حوالي الآلاف أو المئات. سوف تتطابق مع جميع المكتبة العادية في مكتبة القالب العادية. على سبيل المثال ، فإن الانتظام المنتظم يتطابق مع الجملة "أنت تحب" ، ثم ارسم جزء "أنت مثل" ، أي ، "انظر إلى قطعة واحدة؟" تم استخلاصها كمرشحين. يجب أن يتضمن المرشح بعض الصفات وعلامات الترقيم والكلمات التي لا معنى لها ، وكيفية حذفها؟ اعتمدنا طريقة تسمى TriEmatch. في الواقع ، يمكننا استخدام الطريقة الأكثر شيوعًا للمطابقة. لقد تطابقنا أخيرًا مع القاموس الذي يسمى "قطعة واحدة" في القاموس ، ثم نرسم الكلمات الرئيسية "One Piece" إلى النص ، تنتمي "قطعة واحدة" إلى قاموس أنيمي ، ثم يمنح المستخدمين الرد ، وهو تفسير بسيط هنا.

مثيل توليد اللغة الطبيعية (NLG)

أخيرًا ، دعنا نتحدث عن توليد اللغة الطبيعية. بمعنى آخر ، عندما نرد ، من المستحيل السماح لها بالرد على الإجابة التي وجدناها. مع أخذ الطقس كمثال ، فإن النتيجة النهائية للطقس هي درجة حرارة الهواء بشكل عام والطقس. لذلك لا يمكنني الرد على المستخدم مباشرة لأقول "غائم ، 10 درجات ، 15 درجة" ، أريد بالتأكيد الرد على جملة طبيعية للغاية. إنه مثل هذا: على سبيل المثال ، قمنا بتصميم هذا في رد الطقس في الطقس. تشمل إجابته أربعة أجزاء. ما هي درجة الحرارة؟ الجزء الثالث هو "ما هي درجة الحرارة" والجزء الرابع هو "مجموعة الاسترداد الشخصية ". يمكننا أن نرى أنه عندما يكون لدينا مثل هذه slots_info ، عندما يكون لدينا درجات "غائمة ، 10-15" ، يمكننا أن نجعل هذه المعلومات الأربعة مباشرة في جملة. قد تكون هذه الجملة "الطقس اليوم هو الطقس اليوم. درجة الحرارة الدنيا. هو 10 درجات ، والحد الأقصى لدرجة الحرارة هو 15 درجة ، والطقس بارد بعض الشيء ، والمالك يرتدي معطفا رفيع "، وهذا هو توليد اللغة الطبيعية. الكود.

لتلخيص ، كيف يتحقق إطار عملنا بالكامل؟ أول، nlu ، نستخدم Jieba لتقسيم الكلمة ، معهد Harbin للتكنولوجيا LTP ؛ التحليلات يمكننا استخدام fasttext أو bert ؛ NLG نستخدم طريقة التكوين للقيام بها ؛ DM نكتب مع بيثون بأنفسنا. مربع الحوار نستخدم القواعد للتنفيذ ؛ الوحدة الوظيفية نحن جاهزون؛ وحدة أسئلة وأجوبة نستخدم القوالب. وحدة القيل والقال نستخدم طريقة استرجاع ، حتى نتمكن من تحقيق روبوت الدردشة بسيط للغاية. هذا هو الجزء الرئيسي من اليوم.

التطبيق والمسار الفني لخريطة المعرفة في الحياة الافتراضية

بعد ذلك ، سأتحدث معك عن المعلومات حول خريطة المعرفة ، والتكنولوجيا الأساسية للدردشة على وشك التحدث معك.

تحدث عن اختبار تورينج. أصبح روبوت الدردشة الآن ضعيفًا للغاية ، لكن في عام 2014 ، ما زلت أجري اختبار Turing. كان اختبار Turing نفسه عبارة عن تورينج تم اختراعه في الخمسينيات. في غضون 5 دقائق ، أنا وحدي. هناك جدار. لا أعرف إذا كان هناك هو جهاز كمبيوتر على الجانب الآخر. أتحدث إليه لمدة 5 دقائق. إذا تم خداع 30 من الأشخاص المشاركين في الاختبار ، فأنا أقول إن هذا الكمبيوتر قد اجتاز المرور. في الواقع ، فإن معيار الاختبار هذا شخصي للغاية. يمكننا استخدام العديد من الرحلات لتجاوز هذه الإعدادات. في الواقع ، لا يعكس اختبار Turing حقًا ذكاء الروبوت ، لأن ما هو مصدر اختبار تورينج؟ ربما تكون قد سمعت هذه القصة. Turing هو مثلي الجنس ، لذا فإن اختبار Turing هو كل اختبار يومي يجب أن تمر كل الشذوذ الجنسي في المملكة المتحدة في الخمسينيات ، أي أنه مثلي الجنس ، هل يمكنك التظاهر بأنه من جنسين مختلفين ، في الواقع ، هذا هو السبب الأول لاختبار تورينج. في الواقع ، إنها قصة مأساوية. في النهاية ، كانت تورينج ملتزمة بالانتحار بسبب الإخصاء الكيميائي ثم الاكتئاب. لقد كان من المؤسف. لذا فإن السبب في أننا تحدثنا عن ذلك هو أنه حتى لو شعرنا أنه حتى روبوت الدردشة اجتاز اختبار تورينج ، فإنه لا يمثل تأثيرًا ذكيًا حقًا.

لذلك سوف نفكر في: نظرًا لأن روبوت الدردشة هذا يعمل بشكل سيء ، كيف يمكننا تحسين تجربته وتأثيره؟ واحدة من الطرق التي نفكر بها هي إعطاء الشخصية و IP لروبوت الدردشة ، مثل Big White ، مثل R2D2 ، مثل الأجانب ، يبدو أنه منظمة العفو الدولية ، هذا الفيلم ، "العالم الغربي" ، هل يمكننا وضع هذه الصور في الدردشة ، اذهب في الروبوت ، هذا ما نريد القيام به.

منتج ثانٍ -تم تقديمه من قبل هو كيفية جعل روبوت الدردشة أكثر تعبيرًا مثل الحياة. لا يتم تشغيل الفيديو بسبب الوقت. لذلك لدينا تعريف كامل نسبيًا للحياة الافتراضية. نسميها "الحياة الافتراضية". بالإضافة إلى القدرات الأساسية لروبوتات الدردشة ، فإنه يحتوي أيضًا على بعض جوانب القدرة ، وهذا هو تأثيرنا على الحياة الافتراضية. التعريف هو أننا نريد أن يتفاعل مع حالة متعددة الأطباق ومتعددة الأسلوب ، ولديها إدراك قوي وقدرة إدراكية ، وزيادة إدراك الوعي الذاتي والتطور الذاتي. هذا هو ملخصنا للتكنولوجيا الكلية للحياة الافتراضية. يمكننا أن نرى أنه بالإضافة إلى الصور ، الصوتيات ، والتفاعلات المعرفية ، لدينا أيضًا إيماءات وعواطف مختلفة وأغاني وغناء ومتعدد الأشرطة ، والتعريف العاطفي ، والتوصية النشطة ، إلخ القدرة.

كيف تحقق هذه القدرات؟ هذه الرصيف أمامنا هو قيادة المحتوى الذي نريد التحدث عنه بعد ذلك ، يسمى "خريطة المعرفة" ، وكيفية السماح لروبوت الدردشة حقًا بتفكيرنا وفهمهم وقدرتنا على التفكير ، وهو ما نبحث عنه في المعرفة تقنية الخريطة التي ندرسها. أحضر لنا ما يمكن أن نتوقعه. نحن نعلم أنه في عصر التعلم العميق والبيانات الضخمة ، تستخدم التعلم العميق والبيانات الضخمة قوتها الحوسبة وتستخدم بياناتها ، والتي يمكن إدراكها ، مثل التعرف على الصور ، والتعرف على الصوت ، وتوليف الصوت. ولكن عندما تواجه بعض المشكلات يجب التفكير في هذا التعلم العميق. للحصول على مثال بسيط ، على سبيل المثال ، أعطى السيد شياو يانغهوا ذات مرة مثالاً كلاسيكياً ، "أضع البيض في السلة ، هل البيضة كبيرة أم السلة؟" مسألة السلال الكبيرة. بالإضافة إلى ذلك ، يمكنني أيضًا أن أطرح سؤالًا ، "ما هي جنسية والدة والدة زوجة ياو مينغ؟" أعتقد أن روبوت الدردشة الحالي سيكون بالدوار دون استثناء ، لأن زوج والدة والدة والدة والدة ياو مينغ هو في الواقع ياو مينغ ، لكن الروبوت ليس لديه طريقة لفهم مثل هذه الرسالة المعقدة.

مصدر المعرفة

التمثيل

RDF

ثم تحدثت هذه PPT إليك عن إكمال المعرفة. كيف اكتملت المعرفة؟ اسمحوا لي أن أعطيك مثالاً. على سبيل المثال ، زوجة تشن دومنغ هي دو شيان. ذهبنا للتحقق من دخول تشن دومينغ في الموسوعة. سنجد أن لديها رسالة مفادها أن زوجته دو شيان ، ولكن عندما قمنا بفحص دو. أشار Xian One إلى Chen Doming ، ثم إذا كان لدينا نظام معرفة ، فسيقتصر ذلك على ما إذا كان شخص ما هو زوج شخص آخر ، فيجب أن يكون هذا الشخص زوجة هذا الشخص. هذا المنطق لا ينبغي أن يكون خطأ؟ قد يكون هذا خطأ ، لماذا؟ إذا كان كلاهما رجلًا ، أو إذا كان كلاهما امرأتين ، فهذه مشكلة. لكننا نفترض أن هذا غير موجود. نفترض أنه إذا كان الشخص زوجة شخص ما ، فيجب أن يكون هذا الشخص زوجًا آخر. لذلك مع نظام المعرفة هذا ، يمكننا التعويض عن جانب واحد. على سبيل المثال ، زوج دو شيان هو تشن دومينغ. هذه الحافة يمكن أن تعوض تلقائيًا. زوج فيريدا هو تشنغ يوان ، لذا فإن زوجة تشنغ يوان هي مجرد زوجة تشنغ يوان زوجة فقط Ferida ، مع هذه الوسائل ، يمكن أن تحتفظ بإنجاز المعرفة ، وهو أيضًا شيء يجب القيام به أثناء المعالجة المسبقة.

توسع المعرفة

ما هو توسع المعرفة؟ وهذا هو ، لقد تعلمنا بعض العلاقات الثابتة وانضموا إلى خريطة المعرفة. قد يكون المثال الذي أعطيته غير مناسب ، لأن هذه العلاقة موجودة بالفعل ، أنا أتحدث فقط عن كيفية القيام بهذه الطريقة.

"في 1 أكتوبر 2015 ، عقدت ليو تشيانغدونغ وشقيقة شاي الحليب حفل زفاف في أستراليا." هناك علاقة في هذه الجملة. ما هي العلاقة؟ Liu Qiangdong و Milk Tea Sister هي علاقة الزوج والزوجة ، ثم نجد الاسم الحقيقي لشاي الحليب في قاعدة البيانات من خلال الروابط الجسدية ، حتى نتمكن هذا يوسع المعرفة إلى خريطة المعرفة الحالية لدينا ، وهذا ما نسميه محتوى توسيع المعرفة.

اكتشاف المعرفة الجديد

اكتشاف المعرفة الجديد هو أيضًا شيء يتعين علينا القيام به ، لأننا نعلم أن التغييرات في المعرفة سريعة جدًا. لدينا العديد من المعرفة الساخنة مؤخرًا لتحديث إدراكنا. ماذا يعني "يو سانجيا"؟ يشير في الأصل إلى العائلات الرئيسية الثلاثة خارج عائلة Tokugawa ، والتي قد تشير الآن إلى هذا ، مثل المشاعر الآسيوية الثلاثة: Yao Ming ، مدير المتحف الذهبي ، Hyogo North ، هذا النوع من الثلاثة الملكية. هناك أيضًا "فرعون المجاور". يشير الفرعون المجاور إلى الفرعون المجاور. والآن لديه معنى يسمى أيضًا "الأب البيولوجي". هذا أيضًا اكتشاف جديد للمعرفة. سنجد شيئًا ما. "التضحية السماء" حار جدًا في العام السابق. فيديو العاصفة ، لكنني أعتقد أنه مثير للاهتمام للغاية. التضحية هي طقوس تحتفظ بالمستخدمين عن طريق قتل المبرمجين ومديري المنتجات. إنه في الواقع تفسير جديد للكلمات القديمة. في الواقع ، عندما نكتشف معرفة جديدة ، نحتاج إلى اكتشاف مثل هذه المعرفة الجديدة. ماذا يجب أن أفعل بعد هذه المعرفة الجديدة؟ يتم تحديثه لاحقًا. لدينا تحديثان. طريقة التحديث الأولى تدريجي. عندما نجد مثل هذه الكلمة الساخنة ، سنزيد التحديث الإضافي للكيانات المحيطة به ؛ والآخر هو التحديث الكامل ، على سبيل المثال التحديث الشهري لخريطة المعرفة ، لأن تكلفتها كبيرة جدًا ، وبالتالي فإن تحديث المعرفة هو أيضًا جزء لا غنى عنه من خريطة المعرفة لدينا لضمان نضارة خريطة المعرفة.

سؤال وجواب على أساس خريطة المعرفة

السؤال والإجابة بناءً على خريطة المعرفة هو تطبيق لخريطة المعرفة. مثال ذلك معك هو السؤال والإجابة على خريطة المعرفة الدلالية هذه. يمكننا أن نرى أن أسئلة وأجوبة أسئلة وأجوبة تدمج الوحدات المختلفة لمعالجة اللغة الطبيعية ، وكذلك تجمع حقول المعرفة التي شاركناها في خريطة المعرفة.

ما هي جنسية زوجة ترامب؟ بادئ ذي بدء ، سوف ترسم كياناتنا "ترامب". "ترامب" يشير إلى سيتشوان الماندرين؟ أو يشير إلى ترامب؟ هنا نحتاج إلى رسم خرائط ، كيان للقضاء على الخلل ، وفي النهاية نحصل عليه يشير إلى ترامب. المعيار المقابل لـ "الزوجة" هو "الزوج" ، "الجنسية" هو "الجنسية" ، "؟" هو "؟ X" ، سنجمع بين هذه الدلالات ، مثل زوجة ترامب "؟ "؟ y" هو "؟ X" ، والآخر منا هو "؟ X" ، لذلك سوف يكتب بهذه الطريقة ، "تحديد التوزيع؟ X" أين ، ما هي الحالة المحدودة؟ إن جنسية "؟ y" هي "؟ x" ، وتقييد زوجة ترامب هو "؟ y". في النهاية ، نحصل الجواب هو "الولايات المتحدة". للحصول على تفاصيل محددة ، يمكنك دراسة خريطة المعرفة بناءً على التحليل الدلالي. هناك الكثير من التقنيات ، بما في ذلك الكلمات ، ومدخلات ، و NER ، واستخراج العلاقة ، وما إلى ذلك ، ليست نطاق مناقشة الدرس لدينا.

قضايا أخرى من الهبوط الهندسي

نشعر بأننا أتقنت الكثير من المعرفة NLP ، والعديد من تقنيات KG ، ولدينا بعض الطرق الهندسية ، وأشعر أنه يمكنني صنع منتجات جيدة للغاية. ولكن نظرًا لأن هذه الصورة تُرى للجميع ، فما هي الطيور ، لقد نسيت أيضًا أن تكون بطًا بريًا أو ما هي عليه. لقد تراجعت عندما هبطت على الجليد. لقد كان مختلفًا تمامًا عما تخيلناه. لذلك ، هناك العديد من العوامل التي يجب مراعاتها عند هبوط المشروع. هذه ليست مجرد مشكلة فنية. قد تكون التكنولوجيا جزءًا صغيرًا جدًا من منتجنا بالكامل. نحتاج إلى التفكير في من الذي يتم بيع هذا المنتج وكيفية البيع ، ثم نحتاج إلى النظر في بنية أداء النظام بأكمله.

نحن نستخدم الدردشة والإجابات ، أو نطرح أسئلة وأجوبة تفاعلية متعددة الوسائط. في الوقت نفسه ، علينا أن نفكر في ما يبدو عليه إدخال البرامج والأجهزة وإدخال القوى العاملة وظروف السوق. لا سيما الآن لم يعد روبوت الدردشة نفسه هو سوق البحر الأحمر ، وهو بالفعل سوق بحر الدم. نوع المنافسة ستواجه؟ سيواجه متحدث Xiaomi Small Love من 49 يوان ، وسيواجه الجان tmall من 79 يوان ، وتواجه Xiaomi Xiaoli في 199 يوان ، والدرجة الصغيرة من 299 يوان بايدو في المنزل. لذا ، فإن كيفية القيام بالهندسة والإنتاجية هي أيضًا سؤال يتطلب منطق أعمالنا.

استنتاج

في النهاية ، قمنا بتأخير الجميع لمدة دقيقتين. اسمحوا لي أن أتحدث لفترة وجيزة عما نفعله. ما نفعله هو الدردشة الروبوتات. لن تخبرك العملية المحددة. أولاً وقبل كل شيء ، الابن Xiaobai. في أغسطس 2018 ، أطلقنا هذا المنتج الجديد المسمى Amber. إنه متحدث ذكي للدردشة للإسقاط الثلاثية الأبعاد. في مايو 2019 ، سوف تتعاون مع أسياد بدوام كامل لإطلاق نسخة من إصدار Ye Xiu من Amber Robot. نحن ننظر يمكن للمستخدمين التفاعل مباشرة مع Ye Xiu من خلال الروبوتات ، ثم انظر إلى بعض تصرفاتها. في ديسمبر 2019 ، في نهاية هذا العام ، سنطلق نجمًا ذكرًا. يجب أن يكون هذا النجم الذكري أفضل 10 نجوم من الذكور في حركة المرور المنزلية لدينا. النجم الذكري الطازج الصغير ، نأمل أيضًا أن ينتبه الجميع لمنتجاتنا.

تأسست معهد أبحاث الذكاء الاصطناعي لدينا في شنغهاي. ومن بين الخبراء أيضًا المعلم تشانغ مين والدكتور وانغ هاو فين. أعضائنا يأتون من مختلف الجامعات المعروفة جيدًا. لقد أنشأوا أيضًا مختبرًا مشتركًا مع جامعة SU وجامعة شرق الصين العادية. يسمى المحرك محرك "أعطى".

هذه هي صفحتي الأخيرة. تحدث إليكم بضع كلمات أخرى. يشمل محرك حياتنا الافتراضية بأكملها عدة مستويات: لقد فعلنا بالفعل الكثير من الأشياء على طبقة البيانات ، بما في ذلك خرائط المعرفة ، بما في ذلك تحليل البيانات الأساسي والمنصات التشغيلية ؛ في الطبقة ، سنقوم ببعض الذكاء المعرفي ، وذكاء الإدراك ، مثل الصوت ، والصورة ، والتعرف على الوجه ، والتعرف العاطفي ، وبعض الذكاء المعرفي مثل التفكير ، والارتباط ، والذاكرة ، والمنزل الذكي ، والأسئلة متعددة الأسلوب و الإجابات ، إلخ. في النهاية ، يمكننا أيضًا توفير نقاط وصول للمنصات المفتوحة للسماح للجميع بالوصول إلى بعض وظائفنا.

شكرًا لك على دعمكم ، وهذا ما يتحدث عنه دورتي.

QA

السؤال 1: يتضمن نظام الحوار العديد من المحتوى. من الأفضل استخدام نظام النهاية إلى -end ، أم أنه من الأفضل تقسيمه خطوة بخطوة؟ أشعر أن كمية الهندسة رائعة.

شاو هاو : انظر إلى هدفك. إذا كنت تريد القيام بأغراض بحثية ، فيجب أن تنتهي. إذا كتبت الأطروحة ، فيجب أن تنهيها. هذا لا شك فيه. يجب أن تظل الهندسة سهلة الاستخدام ، وبالتالي فإن مبدأ الهندسة هو استخدام أبسط طريقة للحصول على التأثير قدر الإمكان ، وإذا لم يكن الأمر كذلك ، فإننا نفكر في طرق أخرى.

الآن فقط أتحدث عن مستويين. إذا كنت تريد تعلم الهندسة ، فلا تزال تستخدم هذه القواعد للقيام بذلك بنفسك ؛ إذا كنت ترغب في القيام بالأطروحة ، فلا تزال تركز على الأطروحة والنهاية.

السؤال 2: المعلم ، هل خريطة المعرفة مهمة في نظام الحوار؟ هل هو أكثر استخداما الآن؟

شاو هاو : مهم ، ولكن ليس كثيرًا الآن ، لماذا؟ ما قلته هو خريطة المعرفة في نظام الحوار. لا تزال خريطة المعرفة مهمة للغاية في نظام الأسئلة والأجوبة. ما زلنا نستخدم الكثير من خرائط المعرفة في مسابقة خريطة المعرفة ، ولكن في الوحدات الوظيفية الأخرى ، تحدثت فقط عن ذلك ، مثل القيل والقال ، مثل Dialog Task Dialog ليس كثيراً. وعالم الهندسة لا يستخدم بشكل خاص في خريطة المعرفة.

السؤال 3: إذا وصلت إلى الكلمة الرئيسية في الفتحة في DM ، ولكن لا يوجد تاريخ ووقت إرجاع ، فسيقوم بإرجاع السؤال المقابل إلى المستخدم. يرجى استكمال التاريخ والوقت. هل هذه المشكلة تم تعيينها يدويًا أيضًا؟

شاو هاو : تم تعيين هذه المشكلة قبل أن نذهب للقيام بهذه المهمة. على سبيل المثال ، سأعطيها بعض الأخاديد ، ويسمى أحدهم "الوقت" وواحد يسمى "التاريخ". سأعطيها بعض الفتحات: المغادرة ، الوجهة ، وقت المغادرة ، الرحلة ، المطار. لذلك في الواقع ، يمكنك المهمة التي تم تعيينها بشكل مصطنع. يتم الرد على هذا السؤال ببساطة ، والذي يتم تعيينه يدويًا.

السؤال 4: إذا كان الهدف هو تخزين ورسم وعقل قاعدة البيانات غير العلائقية. هل يتم تخزين هذه التخزين في SQL أو NOSQL؟

شاو هاو : مثل Jena و MongoDB و DOM4J ، يجب علينا اختيار تنفيذ قاعدة بيانات مختلفة في المشروع وفقًا للمشهد المحدد. لكي نكون صادقين ، من السهل جدًا استخدام MySQL في بعض السيناريوهات ، بالإضافة إلى MongoDB و ES. هذه قاعدة البيانات هذه فعالة في بعض الأحيان من قاعدة بيانات الرسم البياني. لذلك ، من الضروري تحديد الوظائف التي يجب تنفيذها بناءً على سيناريو الهندسة المحددة.

السؤال 5: تأثير الخوارزمية الحالية ليس جيدًا مثل تأثير العادي أو القالب. فكيف تختار؟

شاو هاو : إنها طريقة اندماج. لدينا أيضًا عدد كبير في نظام روبوت الدردشة الخاص بنا ، لكننا سنقوم بتصميم بعض الاستراتيجيات متعددة الأدوات. على سبيل المثال ، سنقوم ببعض الاستراتيجيات عندما نشعر بالقلق إزاء تحديد الهوية. سيكون لدينا بعض القواعد قبل النية. إذا كانت دقة القواعد هي الأفضل ، إذا لم يكن من الممكن تغطيتها ، فسنستخدم أساليب التعلم العميقة ل تصنيف نية تصنيف نية التصنيف. طريقة الانصهار (التراص) ، سنحكم بشكل شامل على ما إذا كان سيتم اختيار النموذج الذي يحمل أعلى النقاط بعد التكامل.

وعندما نقوم بذلك ، عادة ما نعود Top3 أو Top5. في الوقت نفسه ، إذا وجدنا أنه لا يمكن متابعة هذه النية ، فلدينا وحدة "رفض". المنتج.

السؤال 6: هل تحدد عمدا جميع قواعد نية التحرير اليدوي؟ هل هناك أي طريقة أخرى؟

شاو هاو : المثال الذي قدمته للتو من قبل القواعد لتحديده ، ولكن كان هناك ppt ورائي أن القصد من تحديد هو في الواقع طريقة الانصهار ، بحيث يمكنك الحصول على قواعد أولاً ، ثم استخدام بعض أساليب التعلم العميق لاحقًا لاستخدام بعض العميق أساليب التعلم. FastText لقد ذكرت الآن يمكن أيضًا تصنيفها من خلال هذه النية ، ولكن هناك كمية كبيرة من البيانات للإشراف والتعلم.

السؤال 7: كيفية اختبار تأثير روبوت الدردشة تلقائيًا؟

شاو هاو : انظر إلى معايير التقييم. سيكون لدينا معايير التقييم الخاصة بنا بمفردها. يحتوي معيار التقييم هذا على مئات الاختبارات ، مثل صوتها الصوتي. ينقسم صوته الصوتي إلى بضعة أمتار ، مثل المعرفة القريبة من الحقل ، بعيدًا ، ثم أثناء الحوار العملية. سيتم استخدام عدد العجلات ، وقت التعلم ، الحوار ، الطبيعي للصوت ، وما إلى ذلك ، كتأثير اختبار روبوتات الدردشة. لذلك ، لا توجد طريقة دقيقة وصارمة لاختبار الروبوتات والدردشة. إذا كنت ترغب في الرجوع إليها ، فهناك الكثير من روبوتات الدردشة هذه في العالم الأكاديمي. هناك العديد من التقييمات. يمكنك إلقاء نظرة. يحتوي كتابنا أيضًا على طريقة للتقييم.

السؤال 8: ما هي الطريقة الجيدة للتصنيف بعد نية التعرف عليها؟ إطلاق مباشرة من الأعلى إلى الأسفل إلى المجال أو الروبوت ، أم أن التحكم المركزي توزيع وجمع التعليقات أولاً؟

شاو هاو : ممارسة كل روبوت ليست هي نفسها. المجال الذي قلته هو في الواقع تصنيف مستويين. نحن تصنيف خمسة مستويات. سيعتمد نهجنا استراتيجية من طبقتين. نقوم أولاً بإجراء تصنيف تقريبي ، ثم نمتلك نتيجة TOPK ، ثم نقوم بتوزيع نتيجة هذا TOPK على المواد الفرعية K للتنفيذ. كل وحدة فرعية تعادل A TELEVETION العلاقة. بعد أداء هذه المشاكل ، أعطيتني ردود الفعل. على سبيل المثال ، أنا وحدة موسيقى. ملاحظات DM الخاصة بي هي أنني أعتقد أنني أبذل قصارى جهدها. أسجل 10 نقاط لنفسي. إذا كنت على استعداد لقبول هذه النتيجة. ثم سيتحكم DM في التحكم المركزي ثم تحديد ما جمعته. على سبيل المثال ، بعد جمع ملاحظات جميع الوحدات النمطية عند 500 ميلي ثانية ، ثم قرر الوحدة النمطية التي يجب العودة إليها. لذلك هذا ليس هو نفسه اعتمادًا على نظام كل روبوت.

السؤال 9: إذا كان اختبار تورينج لا يمكن أن يعكس الطبيعة المتقدمة لروبوتات الدردشة ، ما هو الاختبار المستخدم لاختبار الأداء؟

شاو هاو : هذا هو نفس المشكلة التي قلتها للتو. لدى المجتمع الأكاديمي المزيد من بيانات التقييم. يمكنك الانتباه إلى هذه المسابقات ومعرفة كيف تفعل الدوائر النظرية.

السؤال 10: إذا واجهت نوايا متعددة عندما تواجه استعلامًا في الاعتراف ، كيف ينبغي أن يكون أفضل؟

شاو هاو : لدينا بالفعل Topk ، والتي سيتم الحكم عليها من خلال درجتها النهائية.

السؤال 11: هل ستجعل NLU معالجة مسبقة؟

شاو هاو : نعم ، سوف تفعل ذلك بالتأكيد ، وكلها وحدات منفصلة ، مثل كلمات النغمة والتوحيد ، والتي يتم إجراؤها بواسطة وحدات منفصلة.

السؤال 12: كيف تفعل معنى الكلمة؟

شاو هاو : هناك طرق مختلفة لمعنى معنى الكلمة ، هناك قواعد ، وكذلك القواعد القائمة على الحرارة. على سبيل المثال ، استنادًا إلى الحرارة ، على سبيل المثال ، عندما نتحدث عن "737" ، قد يشير إلى 737-800 أو 737max. في هذا الوقت ، قد نحكم على أن الأخبار الأكثر شعبية هي مؤخرًا تحطمت طائرة 737max. في هذا الوقت يمكنك استخدام الحرارة لتختفي. هناك العديد من الطرق للاختفاء. يمكننا استخدام السياق والحرارة والمساهمات. يمكن استخدام هذا.

السؤال 13: هل سيتم تحسين الأداء في الحقل العمودي واستخدام خريطة المعرفة؟

شاو هاو : سيكون هناك بالتأكيد ، لأننا قمنا أيضًا بالعديد من المشاريع الرأسية المشابهة للعلاج الحكومي والطبي ، وسيؤدي استخدام خرائط المعرفة إلى تحسين تأثيرها وإجابةها بشكل كبير. سيكون هذا بالتأكيد.

السؤال 14: الرابط للتعامل مع الروبوت طويل جدًا. كيفية تحقيق التوازن بين جودة سرعة الاستجابة وجودة وحدة الارتباط؟

شاو هاو : هذا السؤال جيد جدًا ، لأن لدينا الآن مشكلة خطيرة للغاية في روبوت الدردشة المسمى "نقل الخطأ". إذا كان لديك المزيد من الوحدات التسلسلية ، فسيكون ذلك سيئًا للغاية للخطأ. عندما نتوازن ، يجب علينا إعداد "مهلة" وفقًا للموقف المحدد. على سبيل المثال ، عندما تتم معالجة بعض الوحدات بالتوازي ، سنختار معالجة الشخص بدون مهلة وأفضل تأثير.

السؤال 15: كيف تقيس جودة العاطفة؟

شاو هاو : لدينا نظام ثلاثي الأطباق بأنفسنا ، حوالي 27 معايير الحكم. قد يتم الحكم عليها أيضًا وفقًا للوضع المحدد. لا توجد وسيلة لإعطاء مؤشر قياسي.

السؤال 16: هل هناك أي مؤشر لتحديد مزايا إجابات الدردشة؟

شاو هاو : أحد أكثر المؤشرات المباشرة هو معرفة ما إذا كان المستخدم على استعداد للتحدث معك. اقترح Xiaobing بالفعل الكثير من المؤشرات ، مثل عدد العجلات التي يتحدثها المستخدمون إليك كمؤشر.

السؤال 17: كيف يتم تصنيف النية المتعددة؟

شاو هاو : يجب أن أكون واضحًا في PPT الآن ، "غدًا" لم يذهب إلى النوايا العادية. درجات النية الطبيعية منخفضة للغاية. إنها أقل من قيمة مجالنا ، لذلك نحن إما نتجاهلها أو نرفضها إما الحكم على ما إذا كان ذلك هي جولات متعددة. إذا ذهب إلى جولات متعددة ، فسنستخدم جولات متعددة من آلات الحالة لإجراء اختبار عليها.

السؤال 18: هل هناك طريقة مطابقة للسؤال والإجابة على إجابة السؤال والإجابة ، أو فقط طريقة المطابقة للسؤال والمشكلة؟

شاو هاو : هذا السؤال أفضل ، كلانا يستخدم. ماذا؟ نظرًا لأن بيانات السجل الخاصة بنا كبيرة جدًا ، فقد يتضمن ذلك أشياءنا منخفضة المستوى نسبيًا ، لذلك لن أقول الكثير. سيتم استخدام كلتا الطريقتين ، وتتم مطابقة الطريقة للإجابة في بعض الأحيان عن طريق إنشاء السؤال بعد طرق أخرى لإنشاء الإجابة. هذه الطريقة فعالة للغاية. يوصى بتجربته.

تطبيق الشبكة العصبية الجديدة لـ Transformer في الترجمة الآلية | يتعلم ملايين الأشخاص الذكاء الاصطناعي

جيثب محة الساخنة: متصفح لا يصدق متصفح-2020 الاسبوع ستار على مدى 3000

بعد قراءة هذا واحد، كنت على الأمن الربيع محة سبيلا لل| برنامج القوة

مطرقة الحجر! بيثون صعبة مرات قبل هذا العام ل؟ المبرمجين: أنا مجنون

جافا GC شهدت العديد من المقالات، وهذا خمسة أسئلة قد لا يعرف

محلل البيانات مقابل خوارزمية مهندس، بيثون المبرمجين كيفية اختيار الولادة؟

ثلاث شركات سيحل حزمة المستخدم القديمة والجديدة قضية حقوق مختلفة، المحموم التعاون مع الأهتزاز، بوابة 2.26 الإفراج | المهوسون العناوين

كيفية تغيير الحياة البشرية في التفاعل بين الإنسان -الحاسوب | مليون شخص يتعلمون الذكاء الاصطناعي

فقدت 30 مليون $ bitcoins نقدا، لأن بطاقة SIM؟

دفتر الملاحظات الذي دمرته زوكربيرج ، يخفي كل النجاح أو فشل الفيسبوك

حزب المؤتمر SISHUI الشعبية فرع "العلامة التجارية شجرة لعرض القلب والروح للمساعدة على الخروج من الفقر".

"التحفة" في وسط العزلة