جامعة فودان، شياو يانغ هوا: رمز التحقق 12306 لم يعد آمنا، والمستقبل ينتمي إلى رمز ذكي

13 أبريل معهد للعلوم والتكنولوجيا، والأكاديمية الصينية للاستشارات الاستراتيجية ومعهد بحوث تينسنت في بكين الذي عقد بالاشتراك مع "2017 الذكاء الاصطناعي: تكنولوجيا والأخلاق وحلقة الدراسية للقانون"، دعا اجتماع الرئيس للاستراتيجية التشاور معهد بحوث تكنولوجيا، والأكاديمية الصينية للعلوم بان تدرس الذروة رئيس معهد بحوث تينسنت قسم شياو، الأكاديمية الصينية للكلية العلوم قواعد ومراكز البحوث ودعم الأخلاقية باربرا لي، جامعة الكمبيوتر شياو يانغ هوا فودان، وعشرات من الخبراء والعلماء في مجال الذكاء الاصطناعي، لمناقشة الحالية تواجه تطوير تكنولوجيا الذكاء الاصطناعي و السؤال من الآثار الأخلاقية والقانونية والاجتماعية والاقتصادية.

خلال، قدم البروفيسور يانغ شياو هوا تحت عنوان "مستقبل التمييز بين الانسان والآلة - لغة التعليمات البرمجية أساس الاعتراف ذكي من" تبادل، شبكة لى فنغ في مقال على أساس تسجيلات حية، PPT، والمقابلة.

وفقا لشبكة لى فنغ: شياو يانغ هوا، جامعة فودان كلية علوم الحاسب الآلي والتكنولوجيا، أستاذ مشارك، المشرف على الدكتوراه، نائب مدير بلدية شانغهاى الإنترنت واسع مركز البيانات الهندسية. أبحاثها التوجيه والإدارة للتعدين البيانات الكبيرة، وقاعدة المعرفة.

لماذا أحتاج هذا الرمز؟

أولا وقبل كل شيء، سعداء جدا أن تتاح لي الفرصة لأشاطركم بعض الأفكار وعملي من حيث التمييز بين الانسان والآلة. I تعمل اساسا في مجال البحوث الكمبيوتر، في السنوات الأخيرة، مزيدا من الاهتمام هو البحث في مجال الذكاء الاصطناعي. في عملية مستمرة من البحث، ونحن أكثر وأكثر وعيا بقوة من المشكلة التي لدينا من الصعب الآن أن نميز خلف الكمبيوتر في الإنسان نهاية أو الجهاز، والتي يمكن أن تؤدي بسهولة إلى موقف محرج للغاية، ونحن الآن في نهاية تفاعل الناس مع آلات أو في التفاعل؟ سمعت مؤخرا نكتة، وهو رجل يتحدث مع الأصدقاء على مواقع التعارف، وأخيرا وجدت دردشة الروبوت معه. حتى اصبحت المنطقة بين الانسان والآلة مسألة في غاية الأهمية.

في النهاية كيفية التمييز بشكل فعال على الطرف الآخر من الإنترنت هي آلة، والناس؟ وتعطى برنامجنا في مجال رمز حاسوبي. هذا رمز التحقق القليل هو الأكثر دراية للجميع ولكن معظم الغريب، تقريبا تستخدم كل الرموز، ولكن تم التحقق آليات ومبادئ وراء رمز يست معروفة جيدا. لماذا الحاجة إلى إدخال هذا الرمز عند تسجيل الدخول إلى النظام؟ في الواقع الحياة للتمييز الجهاز، النظام يحتاج إلى معرفة الشخص الحقيقي أو آلة في الحصول على البيانات لدينا، أناس حقيقيين لا تزال شراء الجهاز في سلخ فروة الرأس، وتذاكر لأناس حقيقيين أو آلات لانتزاع الأصوات. حتى التحقق ليس مجرد مسألة تتعلق بهوية الإنسان بأكملها والكرامة من الأشياء، ولكن أيضا لديه شعور كبير من قضايا السلامة، ولكن أيضا لضمان أمن الموقع، وأمن البيانات وأمن العمليات وأمن المعاملات لعبت دورا كبيرا.

  • الأمن الموقع: تسجيل القمامة، والدخول الخبيثة، سرقة حساب

  • أمن البيانات: الزحف البيانات والفساد البيانات

  • السلامة التشغيلية: فرشاة الخبيثة واحدة وارتفاع كاذبة، استعراض وهمية

  • الأمن عملية: التداول كاذبة، والنقدية الخبيثة، ودفع بطاقة مسروقة

لماذا كان رمز التحقق التقليدي غير آمنة؟

ولكن في السنوات الأخيرة تطوير الذكاء الاصطناعي، وخاصة ساعدت البيانات الكبيرة في تنمية الذكاء الاصطناعي تحت، أدى إلى قدرة الإدراك من الجهاز لتصل حتى إلى ما بعد مستوى الإنسان، ما هي النتيجة المباشرة لهذا الاتجاه التكنولوجيا هو؟ ويستند CAPTCHA على إدراك الطريقة فشلت بالفعل.

أولا استعراضا موجزا للاتجاهات في السنوات الأخيرة، وتطوير الذكاء الاصطناعي. إذا كنت تريد أن تبدو لسبب بسيط لشرح لماذا السنوات الأخيرة، الصيد الذكاء الاصطناعي على، أو لماذا الذكاء الاصطناعي مزدهرة جدا، لذلك ينبغي أن يكون هذا سببا لوصول عصر البيانات الكبيرة، يمكن أن يكون هناك أية بيانات رئيسية اليوم تنمية الذكاء الاصطناعي. لدينا الآن أكثر البيانات على نطاق واسع، وعلم البيئة البيانات أكثر اكتمالا، وهو شرط مسبق وأساس الذكاء الاصطناعي على قدم وساق. وبالإضافة إلى ذلك، لدينا كبير مستوى الأجهزة عصر البيانات تظهر اتجاها للنمو المتسارع. لدينا الآن القدرة الحاسوبية لم يسبق لها مثيل، وهذه القدرة الحاسوبية ما زال ينمو بسرعة. وهذه هي الزيادة السريعة في القدرة الحاسوبية والتراكم السريع للبيانات كبيرة وضعت الأساس لتطوير الذكاء الاصطناعي على قدم وساق. ويمكن القول عصر البيانات الكبيرة لتطوير الذكاء الاصطناعي لتحقيق أرباح غير مسبوقة البيانات.

التطورات الأخيرة في مجال الذكاء الاصطناعي، وينعكس تعلم آلة خاصة في عمق التعلم، ممثلة في السنوات الأخيرة شهدنا عمق التعلم حققت اختراقات غير مسبوقة في العديد من المجالات. وكانت دراسة متعمقة قادرة على التطور السريع، في الواقع، بسبب كميات هائلة من البيانات الشرح، لذلك نرى الكثير من الاختراقات الاخيرة معظمهم من عمق التعلم، مثل جوجل، الفيسبوك مثل هذه الشركة الكبيرة، ولماذا؟ لأن لديهم كميات هائلة من البيانات.

التطور السريع في دراسة متعمقة تمثل نتيجة مباشرة لتقنيات الذكاء الاصطناعي: وصلت قدرة آلة الإدراك في بعض المناطق حتى بعد المستوى الإنساني. على سبيل المثال، مايكروسوفت دقة في التعرف على الصور تصل إلى 96.43، 94.9، والإنسان فقط. أن الناس ليس لديهم بالضرورة لرؤية الجهاز صور وفهم دقيق. معدلات الخطأ التعرف على الكلام انخفض منصة DeepSpeech بايدو بين 3.7 -5.7، بينما نسبة الخطأ البشري لا يزال 4 -9.7، وذلك في آلة التعرف على الكلام تجاوزت البشر. جعلت دراسة متعمقة كممثل للتكنولوجيا الذكاء الاصطناعي آلة الإدراك في الجانب البصري، السمعي من تقدم كبير في السمعي البصري هذه الجوانب الأساسية للإدراك البشري ليس لديها ما نفخر به. الآن آلة حولنا، تصورها في الواقع أقوى منا بكثير.

ما هي نتيجة مباشرة لهذا الاتجاه التكنولوجيا هو؟ أننا الأكثر فشلت تماما نهج مألوف صورة التحقق. هذه النتائج ليست أعلى من المختبرات و، ولكن طلاب الدراسات العليا من العمل بطبيعة الحال الجامعة. لهذا الرمز معقدة نسبيا التحقق صورة معقدة، والتعرف على الجهاز دقة تصل إلى 98 -99.8. وعلى النقيض من تجربة الانسان والآلة، حوالي 10 شخصا داخل لخطأ 3، وآلة 10 فقط داخل خطأ واحد، في الأساس هزيمة الإنسان والآلة. العديد من المنصات على شبكة الإنترنت لا تزال تعتمد بشكل كبير على هذا النوع من التعليمات البرمجية، التي يمكن أن تمنع فرشاة واحدة، وتذاكر فرشاة، الخ، ولكن في واقع الأمر ليست آمنة.

يمكن القول رمز التحقق التقليدي لكانت غير آمنة جدا. على سبيل المثال، اسحب الصورة أعلاه متاحة، وعلى استعداد لاختراق الإجراءات الآلية. ومثل هذه البرامج تكسير لا تحتاج إلى أي خبير للقيام بذلك، ومن هنا بلدي مظاهرة مختبر للطلاب استخدامها لمشاريع الكراك ومن ناحية الممارسة. أولا معرفة مكان من منطقة الجزاء عن طريق خوارزميات معالجة الصور الهدف، ويرجع ذلك إلى خصائص واضحة من موقع مربع، من السهل العثور على. بعد تصميم المعلمات المسار مع هيئة جامدة نموذج محاكاة الحركة، ثم المعلمات من محاكاة العشوائية من السحب مسار حقيقي، وبالتالي تحقيق الكراك.

12306 CAPTCHA

بالإضافة إلى السحب ورمز قطرة، يقال الحيرة الكثير من مشتري التذاكر في الواقع رمز التحقق 12306 ويمكن أيضا أن تصدع. في القيام الاعتراف الكائن في الصورة على طبيعة رمز التحقق 12306، حتى تتمكن من الاستفادة من بالفعل ناضجة تماما ImageNet الخوارزميات ذات الصلة، وImageNet ذات الصلة كيان خوارزميات الاعتراف الصورة قد وصلت إلى معدل دقة عالية جدا.

جوجل CAPTCHA

وعلاوة على ذلك، يمكن متصدع حتى جوجل رمز التحقق صورة بطريقة مماثلة. تحديد جوجل رمز التحقق صورة صعوبة كبيرة في أنواعه المختلفة: في بعض الأحيان يتم تحديد الصورة جزء التوقيع، وأحيانا سيارة مربع على الخريطة. ومع ذلك، هناك استراحة المقابلة لكل نوع من أساليب المصادقة، ولا سيما بالنسبة للرموز الاعتراف الكائن الصورة القائمة، ويمكن استخدامها لكسر ارتباط خوارزمية ImageNet مماثلة.

اليوم، وقد تم بالفعل متصدع كلها تقريبا التيار كود التقليدي، وقد تم المصادقة التقليدية غير آمنة لفترة طويلة.

المستقبل ينتمي إلى رمز ذكي على أساس الإدراك لغة

مخرج؟ رأيي واضح جدا، وهذا هو على أساس الإدراك البشري التمييز بين اللغة، وهذا هو اختبار آلة ذكية القدرة المعرفية رمز اللغة، وهذا سيكون خيارا هاما في الفترة المقبلة.

الفكرة الأساسية لرمز التحقق من هذا القبيل هو السماح للآلة لقراءة النص، ثم الإجابة على هذا السؤال. وهي تشبه إلى حد ما لغة القراءة والفهم. على سبيل المثال، الناس أو آلات لقراءة مثل هذا النص: "شخص ما تخرج من قسم الفلسفة في جامعة فودان، والآن مدرسا للجامعة تشنغتشو كلية العامة" ثم يسأل الناس للنقر أو جهاز يحتوي على إجابات "ما هو وحدة وظيفة هذا الشخص هو؟" يمكن التحقق من شظايا النص. هذا التحقق هو في جوهره اختبار الفهم البشري النص أو آلة. لشخص بسيط جدا، ولكن للجهاز، وهذا أمر صعب جدا. على سبيل المثال، المثال السابق، فإن الجهاز قد يجيب جامعة فودان، وجامعة تشنغتشو، فمن الممكن أيضا للإجابة، ولكننا جميعا نعرف أنه ليس هناك سوى جامعة تشنغتشو، ويقضي وحدته. للإجابة على هذا السؤال الآلة يجب أن نفهم هذا هو معنى تلك الكلمات، يجب أن تكون قادرا على التمييز بين جامعة تشنغتشو وجامعة فودان يدرسون وحدة، تعمل وحدة. وبعبارة أخرى، يجب أن يكون الجهاز أناس مثلنا، مثل القدرات المعرفية، للقضاء هذا الرمز. ولكن للأسف، بعد كل شيء، والجهاز لا يحب الناس المتعلمين من السنوات العشر، يمكن أن يكون هناك مثل هذا النص مع الفهم. الجهاز الحالي في القدرة المعرفية، وخاصة في اللغة المعرفية، على الأقل في الفترة المقبلة من ويندوز الوقت لا يزال مستوى الإنسان بعيدة المنال، قد يكون عشرين عاما أخرى، ثلاثين عاما قد تكون قادرة على الوصول إلى هذا المستوى، ولكن من اثنين أو ثلاثة السنوات العشر لاحق شيء.

دعونا ننظر في AI الحالي في النهاية ما هي المشكلة. المشكلة الحالية الذكاء الاصطناعي يتجلى في فهم الحس السليم والمنطق مهارات محدودة للغاية. ما هو المنطق؟ الجميع تقريبا يعرف أننا لا نقول أن يسمى علم الحس السليم. على سبيل المثال، تشرق الشمس من الشرق، والناس سوف تذهب ولكن لن تطير، والأسماك تسبح، ولكن لن تذهب، وهناك الدجاج قدمين وأربع أرجل الأرانب هي مماثلة لتلك المعرفة، دعا الحس السليم. نقص عام في المعرفة من هذا الجهاز، لأن الجهاز يتم تعلمه الآن من داخل النص للتعلم، ولكن الشعور السائد هو أن الجميع يعرف، وليس هو مذكور في النص، فهذا يعني أنه لا يوجد بيانات موجودة، وبالتالي فإن الجهاز لا يمكن أبدا أن يتعلم. وحتى الآن الجهاز هو نقص عام في الحس السليم.

ونحن نحاول أن نفكر لماذا الناس لديهم هذه المعرفة؟ المعرفة البشرية من خلال تفاعلها الخاص مع العالم الناشئة، من الجنين يبدأ في التراكم في الحس السليم، لمجرد أن تشعر بمرور الوقت، هناك شعور من الفضاء. عندما كنت سوف يتعرض للضرب القليل من الأطفال مطيع تعلمون، لذلك عليك أن خبرة لأنه يجب أن يكون هناك الفاكهة. الإحساس بالوقت، والشعور الفضاء، والشعور السبب والنتيجة، ويتم تشكيل الجسم عن طريق سنوات طويلة من الخبرة. للبشرية في بضعة عقود، لوضع هذه المعرفة التي تم الحصول عليها من خلال التجربة في طريقة تغذية ملعقة لغرس آلة أمر صعب للغاية.

من ناحية أخرى محدودة القدرة على التفكير. سألت الكثير من الروبوت على الانترنت: "أوباما هو الرجل الأبيض أن تفعل؟"، الجواب هو ليس بالضبط الكثير من الآلات. في الواقع، والمعرفة المكتبة تقريبا وراء هذه الآلات هناك، "أوباما الأسود"، حقيقة، ولكن من "أوباما الأسود" الاستدلال "أوباما ليس أبيض"، والآلة هي صعبة للغاية. من جهة أخرى المنطق يد الإنسان أنها قادرة على تحمل الكثير من الاستثناءات. على سبيل المثال، "المجنح يمكن أن تطير الطيور"، في معظم الحالات من هذا القبيل، ولكن سوف تجد بعض الاستثناءات، مثل طيور البطريق لها أجنحة ولا تستطيع الطيران، لا يطير النعامة مع الأجنحة. آلة يمكن أن يكون إلا المؤهلين أبيض وأسود المنطق، المنطق التسامح غير طبيعي للجهاز المعني لا يزال من الصعب، ولكن بالنسبة للأشخاص الذين حقا بسيط جدا. وذكرت المشاكل هنا ديها حاليا بيان غير ناضجة، والمعروفة ب مشكلة AI-كاملة، أن هذه المشاكل يجب أن تنتظر حتى تصل إلى آلة مستوى الذكاء البشري عندما يمكن حلها. ومن الواضح أن هذا التناقض، ولكن هذا البيان يمكن رؤية مدى صعوبة هذا النوع من المشاكل.

وبناء على هذه النتائج، فإننا نقترح وتنفيذ قانون على أساس خرائط المعرفة. لدينا أكبر على العالم حاليا في قاعدة المعرفة الموسوعة الصينية CN-DBpedia. باستخدام قاعدة المعرفة الخاصة بها، وتوليد التلقائي للأسئلة اللغة الطبيعية، وتحديد تلقائيا الجواب. يتم إنشاء جميع الأسئلة كلها تلقائيا، فإن المشكلة يمكن أن تولد من الناحية النظرية المليارات. وفي الوقت نفسه يمكن أن برنامجنا تلقائيا تحديد الجواب، ولكن لا أعرف آلة الإجابة، يجب على آلة تعرف الإجابة من طرف مهارات فهم. له كود لدينا أيضا ميزات صديقة التفاعلية مجرد النقر يمكن التحقق منها.

حتى نظامنا هو كيفية معرفة الجواب على ذلك؟ في الواقع المخزنة في CN-DBpedia هناك أكثر من 200 مليون من الحقائق منظم، مثل (جامعة فودان، والموقع، وشنغهاي)، استنادا إلى بنية هذه الحقائق، فإننا تولد تلقائيا المسألة اللغوية الطبيعي عن طريق نموذج التعلم العميق، وهو ما يعني أن نظامنا عندما سؤال ونعرف الجواب.

إذا كنا نريد أن كسر الشفرة يتطلب الاحتياطيات الفنية التالية:

  • صور الهوية داخل النص للحصول على المشكلة

  • فهم النص والمشاكل، ومن ثم توليد الجواب

  • نظام QA باستخدام قاعدة معرفية متطورة تغطي مئات الملايين من العلاقات

  • لذلك، على الأقل كسر هذا الرمز للقضاء من رمز التحقق صورة شعبية هو أصعب (الخطوة 1 أعلاه). QA في فهم النص وقاعدة المعرفة (لى فنغ شبكة ملاحظة: على وجه الخصوص، يمكن الإجابة على مئات الملايين معرفة QA)، ويجري حاليا دراسة واستكشاف هذه المسألة، ليس هناك حل تنضج. لذلك، على الأقل حتى الآن، وحتى لغة الآلة لم تصل بعد إلى مستوى القدرات المعرفية الإنسان، ورمز لدينا من الصعب كسر.

    التكنولوجيا الأساسية لدينا هي الجيل التلقائي من مشكلة اللغة الطبيعية داخل هيكل مستودع المعرفة. نقترح نموذج يستند إلى شبكة الجيل المواجهة (GAN) لتوليد أسئلة اللغة الطبيعية من ثلاثة أضعاف منظم لتوليد تلقائيا ندرك عشوائي المشكلة. من الناحية النظرية هناك مئات الملايين من الأسئلة مرشح الفضاء، فإن المستخدم الحقيقي لا تواجه نفس المشكلة مرتين، وبالتالي ضمان التحقق آمنة وموثوق بها.

    وفي الوقت نفسه، من أجل زيادة تحسين أمن التحقق، والمصادقة خفض عتبة المستخدمين الحقيقية، ورفع الحد الأدنى للتحقق من صحة الجهاز، أن نأخذ بعين الاعتبار التحقق الهرمي. إذا كنت مستخدم عادي السجلات الأولى، أنها بسيطة للتحقق، إذا كان حساب الوصول عالية التردد لاستخدام التحقق من صحة تعقيدا، على سبيل المثال، مثل فرشاة واحدة تاوباو، يمكننا التحقق من خلال مزيج من، الجهاز سوف يرفض الباب.

    التحقق هو في الواقع مزيج من فهم من خلال الجمع بين النص، وتحديد الصورة، والتعرف على مسار طرق مختلفة لزيادة صعوبة رمز الجهاز تكسير، مما يتيح التحقق الأمن أقوى.

    لدينا الحس السليم هو الشكل النهائي للرمز التحقق. على سبيل المثال: "الناتج المحلي الإجمالي شنغهاي في المرتبة الثانية بعد طوكيو، اليابان، الذي طلب أول مدينة الناتج المحلي الإجمالي هو" يجب أن يكون الجواب "طوكيو"، الإجابة عن هذه الأسئلة هو في جوهره اختبار الحس السليم فهم من الجهاز. ويمكن القول الحس السليم فهم للمشكلة على قضية تاج الذكاء الاصطناعي.

    لديه الكثير من السيناريوهات، بما في ذلك منصة الأعمال الإلكترونية يخطفها الأصوات احدة، تسجيل المستخدم لمكافحة غيبوبة، مضادة للطائرات لواء الربيع فرشاة، يعلق الجيش للماء، ومكافحة الزحف استرجاع المعلومات استنادا إلى مكتبة ذكي لغة التعليمات البرمجية منتدى الإدراك بلوق تحطم وهلم جرا. وعلاوة على ذلك، هذه الرموز لديهم الكثير وراء التمييز بين الانسان والآلة من التطبيقات التجارية في المستقبل:

    • لا شعوري الإعلان التصور (الإعلان واعي): تصور لا شعوري أقل من السلوك عتبة التحفيز الناجمة عن رد الفعل. على الرغم من أننا لا يشعرون، ولكنها يمكن أن تشكل الذكريات في العقل الباطن لتوجيه بعد اتخاذ القرار.

    • التعهيد الجماعي وسم البيانات: رمز المستخدم مصادقة تسجيل الدخول هو السبيل الوحيد، وقد رست Google صور علامات تلقائيا تصنيف عينة من الصور، والتعرف على وجوه وهلم جرا.

    • التحكم في الوصول: حارس مماثلة، إضافة أقليات معينة، فإنها يمكن أن تلعب دائما دورا مميزا، فقط أولئك الذين يعرفون معرفة جماعات محددة إلى مصادقة الجواب دخول النظام.

    "البيض" بيوم العلم مزدوجة 12.31 | منغ يان: كيفية تصميم للمشروع من خلال شهادة نظام الاقتصادية الفعالة؟

    يمكن كتابة الأطروحة تبدو جيدة جدا، وكان له فقط

    التطبيق في التعدين عملية إدارة المصرفية

    ارتدائه في كل الكلاب المذبوحة شعاع، والقيادة ليلا لرؤية أكثر وضوحا | القصوى من الحياة

    "كوكب القرود 3: في نهاية المطاف معركة" أمريكا الشمالية قبل الارتفاع لاول مرة الاستبداد "قيصر الساخنة" الساحقة الانتشار العالمي

    هذه النسخة الحديثة من "حلم القصور الحمراء" أضع غبي تماما

    أفضل لعبة الوقت هذا الأسبوع: أعلنت هذا الأسبوع عدد قليل من المباريات؟

    وقد حاصرت "سيد تجول" من المنزل عن طريق مرساة أداء تقريبا في غير المرغوب فيه الأكل العامة

    الشوط الاول، والغوص، والصمامات، وباختصار، يأخذ الأسهم من السحر 2018

    وثائقي يحكي قصة المجتمع مثلي الجنس أيضا اقترب من كسر منحنى جمهور

    الرخصة التجارية الإلكترونية وتطبيقاتها في العمل المصرفي

    إعادة 2018 سهم