حصريا | تكنولوجيا AI وتطبيقات البيانات الكبيرة في التكنولوجيا المالية

هذه المقالة مأخوذة من الرئيس التنفيذي لشركة الخدمات المالية مائة الذهب تشانغ Shaofeng وCRO جي يوان في مساء يوم 14 سبتمبر 2017 في تسينغهوا البيانات الكبيرة "التكنولوجيا المتطورة " سلسلة محاضرات - تكنولوجيا البيانات الكبيرة ومنظمة العفو الدولية في مجال التكنولوجيا المالية مشاركة على. وأوضحت اثنين من كبار السن جنبا إلى جنب مع السنوات التي قضاها في التنقيب في القطاع القطاع المالي والتكنولوجيا المالية، جنبا إلى جنب مع القطاع لمكافحة الغش المالي، وتحديد مخاطر الائتمان، وجمع الأصول السيئة، والتسويق الدقة وسيناريوهات الأعمال الأخرى، في لغة عامة الشعب ضد توليد شبكة والتعلم نقل، تعزيز التعلم، الخ طريقة النمذجة ممارسة الصناعة المالية.

خلفية الرد الكلمة "0914"، وتحميل النسخة الكاملة من PPT محاضرة .

رويال كينج خدم الرئيس التنفيذي مائة تشانغ Shaofeng

 رويال كينج خدم مائة يوان الموسم CRO

تشانغ Shaofeng: أولا وقبل كل متحمس جدا أن أعود مع جامعته، والخريجين، والأصدقاء للمشاركة في التقرير. ندخل في العلوم المالية والتكنولوجيا في عام 2012، أول تبادل لدينا مع البنك، ونحن نريد لتعزيز نموذج الشركة دعا لوجستية الانحدار خوارزمية (اللوجستية الانحدار الخوارزمية) في تطبيق المصرفية، البنك تستخدم بعد ذلك لتطبيق الخوارزمية باستخدام آلة التعلم خوارزميات، كما هو خوارزميات بسيطة نسبيا. لكنني أعتقد جازما أن فائدة البيانات، على ما هي الفائدة، في الواقع، على التفكير بوضوح، ولكن اجتمع في وقت لاحق اندلاع كبير من القطاع المالي، والتغيرات، إلا أن العثور على بيانات التطبيق في القطاع المالي وذلك مباشرة.

القطاع المالي هو ركيزة مهمة جدا من نظام الائتمان. الصين سبع أو ثماني مائة مليون شخص ليس لديهم احتياجات المالية من تاريخ الائتمان، والتي تقيد ما يسمى التمويل الشامل للصين، وحفز تنمية المشاريع الصغيرة والمتناهية الصغر، والتنمية المستهلك، والتي هي جزء من مشكلة البنية التحتية.

تطبيقات البيانات الكبيرة الطبقية

من جهة نظر الصناعة بيانات كبيرة، بعضها شائع.

الخطوة الأولى في جمع البيانات.

والخطوة الثانية، ومعالجة البيانات. تم تطبيع البيانات، وتنظيف البيانات القذرة، بيانات غير دقيقة، أو القيام ببعض الحساسية.

الخطوة الثالثة، والحد من أبعاد البيانات. إذا كان كل صف من الجدول هو المستخدم، قائمة فإن عددا يصل إلى 500000، وهي أبعاد كبيرة جدا، للتعامل معهم يؤدي إلى انخفاض الكفاءة، والحاجة إلى القيام ببعض تخفيض البعد البيانات، فمن الضروري القيام ببعض المتغيرات المشتقة.

الخطوة الرابعة، نمذجة البيانات. هناك نوعان من النماذج المالية من أهمها: اكتساب (CPA) نموذج الأول هو تسويق ، لتوقع ما الناس بحاجة إلى أي نوع من الخدمات المالية، وذلك أساسا لتوقع احتياجات العملاء. والفئة الثانية هي نموذج السيطرة على المخاطر.

الخطوة الخامسة، تطبيقات البيانات الكبيرة. الصناعات المختلفة تفعل التطبيقات المختلفة.

القطاع المالي يمكن استخدام مناطق محددة فيه

الخطوة الأولى لمعالجة دقيقة تسويق . تبحث جيدا واحتياجات العملاء، وهذه المعايير اثنين يتم فرضه. صناعة المالي الدقة التسويق هو أصعب بكثير من السلع الاستهلاكية العادية، التي هي الطبيعة الخاصة للصناعة المالية التسويق الدقة.

الخطوة الثانية ، قبول . إذا كان التقدم بطلب للحصول على القرض الخاص بك، أو شراء التأمين الخاص بك، فإنك لا تستطيع أن تضع له؟ وبمجرد الحصول على الموافقة. على سبيل المثال، يمكنك الذهاب إلى البنك للقيام على قرض أو بطاقة ائتمان للقيام، وتتيح لك ملء الكثير من المعلومات.

الخطوة الثالثة ، وتقييم العملاء جولة أو في إدارة الائتمان.

الخطوة الرابعة ، متأخر . هذا هو إدارة ما بعد القرض.

من التسويق، والوصول، والإدارة، تأخر، يمكن أربع خطوات كل خطوة الاستفادة الكاملة من البيانات الكبيرة وخوارزميات الذكاء الاصطناعي لتحسين الكفاءة.

نحن الكمال محرك الغش التهديف، وتقييم احتمال وكم كنت يمكن أن يكذب. القواعد هي ما آلت إليه الأوضاع التدابير الواجب اتخاذها. نموذج المجرد هو منطق صنع القرار، والذي يتضمن بيانات تتعلق بالتزوير.

نحن نقدم خدمات مخصصة للمؤسسات المالية، لمنتجاتك وعملائك مع المؤسسات المالية الأخرى لا يمكن أن يكون بالضبط نفس الشيء. نموذج لدينا يمكن أن تكون متباينة، وإعداد البيانات، الفحص الأولي والاختبار والتفتيش، وفحص المتغير الارتباط الكبير نسبيا، والبيانات الجزء، النموذج النهائي.

نحن نستخدم بعض خوارزميات التصور تمكين المؤسسات المالية والجهات التنظيمية نرى أكثر وضوحا، والقواعد لم تصل، وكيف حول توزيع قاعدة العملاء. في قسم عشرات موضوعي، مثل 300 تعيين شركتنا إلى 1000 نقطة، 700 نقطة مثل نظيره البشري 100 شخص، سوى ثلاثة أفراد من التقصير، و 500 نقطة في 100 الناس الذين تتوافق خرق سبعة أشخاص في الداخل، في قطاعات مختلفة من متوسطات درجات أسعار افتراضية مختلفة، وهذه المرة سوف أعلم أنني يجب أن تعطي أكثر من 700 نقطة من الإقراض. والنتيجة هي مهمة جدا بالنسبة للمؤسسة مالية، وتعتبر كنت ما يكفي من النقاط واضحة لكل من 500 شخص مد ألف دولار من حجم الاموال ستكون الخسائر، ونظام التسجيل تساعدك على التنبؤ بها.

وفي وقت لاحق، والسيد جين مائة الخدمات المالية حصة CRO توشيوكي معك حالة محددة التطبيق.

الحالة الأولى: الشكل دراسة متعمقة عصابة تطبيق الكشف عن الغش

جي يوان: مائة المجموعات في تتبع الاحتيال المالي، وذلك أساسا من خلال الجوانب لمكافحة الغش من غير خاضعة للرقابة - مراقبة سلوك غير طبيعي، وكذلك من خلال التعلم تحت إشراف - تحليل موقع غير طبيعي (Geohash)

يتميز تنفيذ خوارزمية التعلم المحددة في FIG.

وربما هذا هو ميزة خريطة إطار خوارزميات التعلم. لأننا دخلت الرسم البياني المميزة عملائنا، وهذا FIG تضم حواف والقمم من هذه الصفات، وتمديد الطيف التكوين عقدة FIG والخصائص الأساسية للعملاء. من خلال عمق الشبكة العصبية، بدءا ميزات أكثر تعقيدا المستمدة من هذه الميزات الأساسية. ما هو لدينا الناتج النهائي؟ هو سمة من سمات مشتق، لوحظ ملاحظة أخرى لخاصية الرياضية مستمدة من نهاية قاعدة، هذه الخوارزمية لتشكيل شيء جيد المحمولة إلى أجزاء أخرى.

ويترك هذا الجدول استخدمنا بعض الخصائص من المشغل. ويعكس هذا الرقم مرحلة محددة من مائة المشتقات المالية المحلية المصنوعة من DI يتميز كتبها Faier، والمستمدة من الميزات الجديدة. في الواقع، هذه الخوارزمية أربعة من المزايا:

أولا وهو يدعم سمات مختلفة الرسم، لأن عادة نحن فقط تعيين العقد والحواف، ويمكن أن تعكس فقط طوبولوجيا.

في المرتبة الثانية ويمكن انتاج العلاقات المعقدة عبر وظيفة الشبكة يستخدم لتعلم النقل؛

ثلث يمكن أن تتعلم ملامح متفرق.

رابع وهو يدعم موازية، وكفاءة عالية من الخوارزمية.

هذا هو واحد من عملائنا لتطبيق بيانات المستخدم في يناير 2017 إلى مايو، ورقم الطلب 340000، 47000 المستخدمين، ما مجموعه 70 الميزات. من خلال خوارزمية حددت الاحتيال لديها أكثر من 12،000 من المستخدمين، ينتمون إلى 238 مجموعة.

الحالة الثانية: تعزيز نموذج التعلم المستخدمة في بناء المجموعات

بعد اقتراض المال للمؤسسات المالية، إذا لم يكن لتسديد الأموال مرة واحدة متأخرة، وهذه المرة مؤسسة مالية وفقا للالداخلية الخاصة بك هو الوقت تأخر لتقسيم الخاص بك، M1 يمثل طال شهر، M2 هو شهرين، في مختلف الوقت تأخر، وسوف تعطيك عمل مجموعة مختلفة.

علينا أن ننظر من وجهة نظر تسلسل، لأن الناس مختلفة تستجيب لإجراءات مختلفة ليست هي نفسها. في الواقع سوف كل خطوة من إجراءات المتابعة تؤثر على النتيجة، يجب أن الحد الأقصى لردود الفعل في جميع مراحل العملية، أن تقرر أي نوع من الإجراءات التي نتخذها في أي جزء. وضعنا هذا هو تعريف عملية جمع قطعة كعملية قرار ماركوف.

لحل عمليات اتخاذ القرار ماركوف من خلال تعزيز التعلم. يجب علينا أولا تحديد وظيفة الأسعار، تليها لك لسحب الأموال في فترات زمنية مختلفة، عامل الخصم تستخدم لتحويل العرض الحالي كحد أقصى، ونحن نطلب وظيفة القيمة المثلى، ويتحقق هذا من خلال خوارزمية تكرار القيمة.

حالة 3: الهجرة التعلم تطبيقها لبناء النتيجة قاعدة العملاء

ويشمل لدينا نظام الائتمان التهديف التهديف العالمي بالإضافة إلى ست نقاط قاعدة العملاء، والنتيجة مشابهة لنتيجة السمسم المشتركة. والنتيجة هي كيفية استخدام المؤسسات المالية ذلك؟ يمكننا أن نرى هذا المخطط، ويمثل الرسم البياني شريط نسبة عدد قسم عشرات مختلفة، فإن معدل الافتراضي هو خط الرسم البياني لعدد من الباب عشرات مختلفة، ونحن نرى بلغت أدنى درجة من 300 معدل الافتراضي شريحة 20، بزيادة 700 نقطة أو أكثر أقل من 1. حتى مؤسسة مالية إذا كان الناس في اختيار أكثر من 500 نقطة، فإن ذلك يعني أولئك الذين لديهم 500 نقطة تركت رفض أن يسقط، وإذا كان أكثر من 500 نقطة طالما نسبة القروض المتعثرة الشخص أقل من 8، إذا كان يريد للحد المتعثرة معدل، مثل خفض بنسبة 4، وهذا يعني أنه يريد تحسين معايير الوصول، من الممكن تحسين عتبة الوصول إلى 600 أو أعلى.

هذا هو موقفنا النقاط الأساسية الست العملاء، وهذه النتيجة هي في الواقع مهمة جدا من حيث المؤسسات المالية، لأننا نريد لتصفية كاملة من الأشرار، الأخيار حيز العموم، فإنه من المستحيل تحقيقه. في الواقع نحن مقيما في تصنيفات بين البلدين، وهدفنا هو أن قدر الإمكان على مقربة من الجزء الأفضل. وبالإضافة إلى هذه المعدلات القياسية السبعة لدينا منتجات مصممة خصيصا للعملاء للقيام قدمت للتو شاو فنغ نموذجا حسب الطلب، وذلك لأن الزبائن يريدون الجمع بين بياناته الداخلية جيدة ولدينا مائة البيانات المالية معا لبناء جزء مخصص له يسجل، وهذا التأثير سيكون أفضل من المعدل القياسي.

هناك بعض المشاكل العملية في عملية بناء درجة الائتمان، وقبل أن أتحدث عن هذه الأسئلة تعطيك مقدمة موجزة من ما يسمى التعلم نقل. مفهومين أساسيين:

أولا ومن نطاق ، مجالات تشمل بالفعل اثنين من العناصر، X هو جزء الميزة، أبعاد هذه المتغيرات، P (X) هو التوزيع الاحتمالي من الفضاء ميزة، في الواقع، لدينا عينة وتوزيع هذه الميزات.

في المرتبة الثانية ومن مهمة ، وتشمل المهام مساحة التسمية، الفضاء في خصائص عينة Shanghao أكثر المحتوى أو سيئة، هي جزء من التعلم تحت إشراف.

ونحن نعلم أن مساحة نطاق والتسمية للعثور على الاحتمال الشرطي.

في التعلم نقل الأمر الذي يتطلب اثنين من المجالات والأهداف، وهو المجال المصدر والمهمة، واحد هو المجال الهدف والمهام. ونحن الآن قد حددت فقط وفقا لأربع حالات:

أولا ، مختلف الفضاء ميزة وميزة مساحة مصدر المجال الهدف مجال.

في المرتبة الثانية التوزيعات الاحتمالية الهامشية مختلفة.

ثلث والفضاء تسمية مختلفة.

رابع الاحتمال الشرطي مختلفة.

هذه الأربعة معا هو 16، ولكن في الحياة الحقيقية التي لا وجود لها 16 مجموعات. بما في ذلك هذه الفئات الثلاث هو الوضع الطبيعي:

أول غير متواجد حاليا وقاعدة العملاء قاعدة العملاء، وخصائصها ليست هي نفسها، لأن أكثر من الأبعاد يمكننا جمع خصائص الجمهور على الانترنت.

الثاني نفس قاعدة العملاء من المنتجات من مختلف المؤسسات، وزعت بشكل رئيسي في احتمال التوزيع الاحتمالي هامشية ومشروط.

الثالث هي منتجات مختلفة مع مجموعة عملاء المؤسسية، وذلك أساسا الفضاء ميزة والاحتمال الشرطي ليست هي نفسها.

نحن عملية النمذجة أكثر واقعية من المشاكل التي واجهتها، وبعض الزبائن لا اقول لكم تسمية الفضاء، ثم كيف النمذجة في هذه الحالة؟

الخطوة الأولى ، حيث الكائن المصدر للحد من البعد المجال من خلال خوارزمية التكيف المجال.

الخطوة الثانية ، بناء تجربة توزيع هامشية. وظيفة المنشئ للاختلافات تميز في المجال المصدر والتوزيعات الهامشية المجال الهدف، والفرق بين التوزيعات الاحتمالية للقياس في النهاية أن يكون.

الخطوة الثالثة ، تخطيط توزيع الظروف التجريبية. مهمة تحديد مصدر وحالة الاحتمال الشرطي للأهداف والمهام من احتمال الفرق.

الخطوة الرابعة ، بناء على الخطوات الأولى والثانية القيام الأمثل دالة الهدف.

الخطوة الخامسة ، وحساب تكرارية.

الحالة الرابعة: خريطة المعرفة القرض تطبق قبل مكافحة الغش

خريطة المعرفة هي في جوهرها شبكة دلالية، كانت هناك مدرستان الذكاء الاصطناعي، وهو رجل اسمه الترابطية نحن الحالة الأولى التي كانت على وشك عمق الشبكة العصبية لتوصيل عقيدة، بل هو تكوين الأجهزة محاكاة الإنسان الدماغ هو طبيعة الإحصائية. النوع الثاني يسمى رمزية المعرفة على تعزى الخريطة لرمزية، بل هو محاكاة المنطق الدماغ البشري، والعقل البشري هو في الواقع البرمجيات. وكان كل من المدارس في الواقع بالتوازي مع ذلك، الخمسينات والستينات من القرن الماضي، عندما صعود الذكاء الاصطناعي هو زعيم رمزية فقط، في السنوات الأخيرة، مع رفع مستوى القدرة الحاسوبية، الترابطية بداية العرض.

رسم الخرائط معرفة ما يعادلها من خبرة التي تريدها الناس تمثيل المعرفة، لذلك كنت ترغب في تجربة عزز في خريطة المعرفة، وقيام لمكافحة الغش الحكم عليها من خلال هذه العمليات الدلالي. ونحن عادة وضعت في المنطق: التحقق التناقض. المحللين غير طبيعي.

طبيعة غير معروفة من التحقق، ويقول شخصين استخدام وحدة الهاتف نفسها، ولكن اسم الوحدة الكتابة وعنوان الوحدة ليست هي نفسها، وفقا لتجربتنا هذه ليست منطقية، والتي حددها المعرفة الخرائط التي يمكن عن طريق الاحتيال.

تحليل ساكنة ونحن الحالة الأولى التي كانت حول الهيكل. التحليل الديناميكي، والخصائص السلوكية موظف يجب أن يكون عادة مستقرة، إذا كنت التغيرات قصيرة الأجل بسرعة، ثم نفكر لديك الاحتيال.

هذه هي أساسا ما أشارك، شكرا لك.

تشانغ Shaofeng السيد تخرج من جامعة تسينغهوا، جامعة تسينغهوا، البكالوريوس في الهندسة الكهربائية التشغيل الآلي، ودرجة الماجستير. لديه 15 عاما من تكنولوجيا المعلومات والخبرة بيانات كبيرة في هذا المجال، استمرار منظم، وقد لعبت لأوراكل، ESS، IBM وغيرها من شركات التكنولوجيا العالمية. وكان قد أسس الشركة ركزت من Broadcom العبقرية على استخراج البيانات، نائب الرئيس التنفيذي، في عام 2009 مع تأسيس شركة شريكين تكنولوجيا البيانات الكبيرة وتطبيق مراكز خدمة الشركة الرائدة في مجال التكنولوجيا، والآن احتلت الشركة 90 من محرك فائقة توصية المحلي السوق. في عام 2014، أسس السيد تشانغ Shaofeng للتركيز في مجال الخدمات المالية في مجال شركة بيانات كبيرة خدمات المعلومات المالية 100 خدم رويال كينج، وشغل منصب الرئيس التنفيذي.

جي يوان السيد الدكتور قسم الرياضيات، جامعة تسينغهوا، وتشارك في إدارة المخاطر المصرفية في السنوات الأخيرة، مطلعة على إدارة الكمية الرقابة المالية المخاطر، واستراتيجية المخاطر وغيرها من تحسين الأعمال التجارية، والمدير السابق للسوق المالي بنك الصين ايفربرايت للخطر، وتحليل البيانات في الصناعة المالية، والهندسة المعمارية منصة والفهم العميق والبحث المتعمق، ونماذج البحث واستراتيجيات المخاطر لديها. 2017 انضم مائة رويال كينج شغل منصب CRO، المسؤولية الشاملة عن مائة ثوب الذهب عموما المخاطر المالية مراقبة الأعمال.

جامعة تسينغهوا - معهد تشينغداو بيانات أبحاث العلوم "المتطورة تكنولوجيا " سلسلة محاضرات عن البعثة إلى المعرفة نشرها وتقاسمها التكنولوجيات الجديدة والمتطورة التحديات بيانات كبيرة، يهدف إلى تقديم يواجه البيانات الكبيرة تحديات جديدة ومجموعة متنوعة من التقنيات المتطورة، والتفاعل مع فريق بحثي المدرسة الصرف. أرسلت والبيانات عدد شقيقة THU (ID: DatapiTHU): المزيد من الأنشطة المثيرة تحت البضائع الجافة والخط، حتى لا تنزعج البيانات THU الإرسال (datapi ID).

رويال كينج هو تجنيد مائة الملابس، بقصد الطلاب وراء الكواليس الرد "باي رونغ" عرض وظائف ~

"إرسال البيانات THU" أكاديمية تشينغداو للعلوم البيانات الرسمية رقم القناة الصغرى العامة الكلمة عودة الظهر "0914"، تحميل النسخة الكاملة من PPT محاضرة - أكثر إثارة نرجوا الالتفات إلى تسينغهوا .

واسعة Yuanqing سيتشوان 36 قرى وبلدات لتحقيق التغطية الكاملة لمرافق النار

حصريا | أثار التفكير التعرف على الوجه أمن البيانات فون X

غوغل والحرس الذكاء الاصطناعي، مصممة خصيصا لالنصف الآخر الخاص

سيد GIF-! قدم انيستا البالغ من العمر 34 عاما ثلاثة أهداف فقط في اليابان، التي تمر فترة طويلة لمعرفة حالة سكر

حصري | مقال واحد لفهم خوارزمية التحسين

تسريع تغيير جيل، المستعملة النقالة الروابط التجارية الهاتف تحليل | 36 البحوث الكريبتون

الدوري الاسباني مشهد غريب! وكان هدف المعارضين الحقيقي 5 دقائق في مهب مرتين، VAR فارغة فعلا الغرفة

حصريا | مايكل I. الأردن أحدث المحاضرات تسينغهوا!

الدوري الالماني مشهد مثير للاهتمام! المهاجم الياباني ضرب المرمى الخالي، والكرة هي في الواقع سدت الثلوج خطوط الباب

حصريا | تطبيقات بيئة البيانات الكبيرة والآفاق

الفقراء والضعفاء والبائسين! حضانة فقط كسل الطفل عند الولادة تم رفض الأم الحقيقية

حصريا | انغ هاى فنغ، والحديث بايدو الأول حول التخطيط الاستراتيجي لمنظمة العفو الدولية (PPT تنزيل)