CCF ADL 87 ورش عمل مراجعة: جيا وى هان وغيرها من 13 الماشية الكبيرة شامل التحليلية والبيانات التعدين الشبكات الاجتماعية

لى فنغ شبكة AI تقنية مراجعة من قبل: 22-24 ديسمبر 2017، من قبل الاتحاد الحاسوب الصين (CCF) ورشة عمل CCF الحدود يوم 87 المواضيع تنظيم (CCF المتقدم التخصصات محاضرات، ويشار ADL) معهد الحاسبات التكنولوجيا الاكاديمية الصينية للعلوم في بكين كان النجاح، شبكة لى فنغ باعتبارها الشريك الإعلامي الحصري، التقرير الكامل.

موضوع الورشة هو "الشبكات الاجتماعية واستخراج البيانات." الشبكات الاجتماعية واستخراج البيانات هو البحث الساخن في علوم الكمبيوتر، ونظرية يغطي بحثية محددة، كل تطبيق الأساسية من التكنولوجيات الرئيسية وتطبيقات الإنترنت.

ورشة عمل دعا إلى سلسلة من دانيال الأكاديمي، بما في ذلك:

أستاذ جيا وى هان --UIUC، ACM / IEEE زميل

تتميز فيليب S Yu-- أستاذ في جامعة شيكاغو إلينوي، عميد أكاديمية تسينغهوا من البيانات، ACM / IEEE زميل

وانغ وي - أستاذ في جامعة كاليفورنيا، KDD 2016 جائزة الخدمة

هو جين تاو Xiangen - جامعة ممفيس، أستاذ الصين الجامعة المركزية عادي، عميد كلية علم النفس

جيمس A. أستاذ قسم علم الاجتماع من جامعة شيكاغو Evans--

حجم - جامعة تسينغهوا أستاذ مشارك

شين هوا وي - معهد زميل أبحاث الحاسبات

ايشيكاوا - جامعة بكين لل

Songguo جي - جامعة بكين أستاذ مشارك

بنغ تسوى - جامعة تسينغهوا أستاذ مشارك

ليو تشى يوان - أستاذ مساعد في جامعة تسينغهوا

تشاو شين - أستاذ مشارك في جامعة الشعب الصينية

يانغ يانغ - جامعة تشجيانغ أستاذ مساعد

خلال ثلاثة أيام من الوقت، والشبكات الاجتماعية والتنقيب عن البيانات في مجال نطاق التغطية، وكان 13 المعلمين حول واحد أو عدة اتجاهات بحثية مختلفة، يمكن وصف كل مباراة كما الجافة. خصوصا أستاذ هان جيا وى واثنين من الأكاديميين، أستاذ فيليب دانيال، يمكن أن ينظر من تقاريرها، مختلفة على الرغم من أنها تتحدث مفاهيم مختلفة، والأساليب المستخدمة، لكنها في الأساس نفس الاتجاه، ودراسة من قبل اثنين من عمالقة الأكاديمية قد تمثل أيضا اتجاه لاستخراج البيانات الحالية.

دعونا خلاصة المحتوى الرئيسي من ورشة العمل (عن طريق تبادل ملخص الزمني، في أي ترتيب معين).

فيليب S يو: برود التعلم عن طريق الانصهار الاجتماعي معلومات الشبكة

أستاذ فيليب كما استخراج البيانات من أعلى الأرقام في تقرير وضع مفهوم --Broad التعلم (اتساع التعلم) دافع لسنوات.

ويعتقد أن عصر البيانات الكبيرة، ونحن بحاجة ليس فقط لمعرفة عمق واتساع نطاقها حاجة لمعرفة المزيد. ليس كل البيانات البيانات الكبيرة هي كبيرة أو معقدة جدا، وهناك الكثير من البيانات بالإضافة إلى مجموعات كبيرة من البيانات يمكن استخدامها. في عصر البيانات الكبيرة مجموعة متنوعة واسعة من البيانات يمكن استخدامها، من أجل الاستفادة بشكل أفضل من هذه البيانات، نحن بحاجة إلى تحديد والحصول على البيانات ذات الصلة والمفيدة، ومن ثم تصميم نموذج من مصادر البيانات غير المتجانسة سيتم دمجها في ذلك، ومن التعدين مثل هذه المعلومات في مصدر البيانات.

معرفة الفرق بين اتساع وعمق تعلم أن التعلم العميق "العميق" من رقم طراز طبقات، واتساع متنوعة من التعلم "واسعة" مشتق من البيانات والنماذج.

وفقا لدراسة التعلم واسعة، ويعتقد فيليب اتساع التعلم مقسمة إلى ثلاث فئات:

1) بمعالجة أنواع مختلفة من المعلومات على نفس الكيان، والذي يتضمن متعددة الرأي، متعددة النماذج، متعددة المصادر التعلم.

2) معالجة المعلومات على مختلف ولكن مشابهة كيانات، بما في ذلك التعلم النقل؛

3) ليتم معالجتها من خلال شبكة معقدة من المعلومات المتصلة بالعلاقة بين أنواع مختلفة من الكيانات، بما في ذلك شبكة المعلومات غير المتجانسة (شبكة المعلومات غير المتجانسة، HIN) التكامل.

أستاذ فيليب اسع تعلم أن هناك نوعان من المهام الرئيسية: 1، والانصهار المعلومات؛ 2، واكتشاف المعرفة. والتحدي هو، وكيفية الاستفادة من التكامل المعرفة وكيف؟ لأنه الآن في أسلوب الانصهار المعلومات سوف تختلف مع بيانات مختلفة، بالإضافة إلى ذلك، لا يمكن لجميع البيانات تكون مفيدة في مهام محددة اكتشاف المعرفة.

ثم أوضح البروفيسور فيليب بمزيد من التفصيل قبل ثلاثة أمثلة التعلم مفهوم واسع، على التوالي: POI التنبؤ، المعرفة عبر منصة الشبكة الاجتماعية فيوجن، التنبؤ الموقع.

حجم: الشبكة الاجتماعية التعدين

حجم في المحاضرة يحلل ما هو تاريخ الشبكات الاجتماعية، والشبكات الاجتماعية، ثم أوضح كيفية إجراء البحوث، ونموذج وتطبيقات الشبكات الاجتماعية واستخراج البيانات.

ويرى تانغ جي تتكون الشبكات الاجتماعية من مجموعة من الأفراد (العقد) الرسومات، من خلال مترابطة واحد أو أكثر ( "الجانب") مرتبطة. هذا هو حقل للكشف عن أنماط السلوك الشخصي أو الاجتماعي من خلال جمع وتحليل البيانات على نطاق واسع.

تانغ جي انه اذا أردت أن تفهم ما شبكة اجتماعية، تحتاج إلى فهم تطور الإنترنت بأكمله. تطور الإنترنت على ثلاث مراحل رئيسية. 1.0 في عصر المعلومات، والشبكة هو بنية تتكون من سلسلة من الصفحات (الوثائق) وصلات على تكوين الصفحة. في الحقبة الأولى على واحد من جهة لا تزال الصناعات التقليدية أكثر وأكثر للانضمام، لذلك لديها بيانات كبيرة، كما رافق من قبل جيل من الحوسبة السحابية. في عصر المعلومات 2.0، والذي ينضم المستخدمون شبكة "عناوين اليوم" هو تطبيق نموذجي في هذا الصدد. في عصر المعلومات 3.0، يبدأ المستخدم على الشبكة، وشكلت بين التفاعل مع المستخدم، والتي شكلت مساحة الفضاء المعلومات والمستخدم، من خلال دمج المعلومات المكانية لانتاج اثنين الذكية.

مع البيانات، وكيفية العثور على والنفوذ قيمة البيانات الكبيرة، والحاجة إلى أساليب استخراج البيانات وتحليل جديدة لتكون قادرة على اكتساب المعرفة والبصيرة من البيانات غير المهيكلة.

تاريخ البحوث الشبكة الاجتماعية، تانغ جي من ست درجات من التباعد 1967 اقترح ميلغرام الحديث، وعرض التعادل ضعيف (1973)، وعدد دنبار (1992)، والثقوب الهيكلية (1995)، HITS (1997)، عالم صغير ( 1998)، مقياس الحرة (1999)، كشف المجتمع (2002)، وصلة التنبؤ (2005)، انتشار السمنة (2007)، والتأثير الاجتماعي تحليل (2009) وهلم جرا.

مع هوى Tangjie كيفية منظمة العفو الدولية ( "خشبية") وكيفية تطبيقها على مظاريف حمراء الدرجة مو من خلال دراسة بيانات الهاتف حالات محددة الظاهرتين الاجتماعية، وكيفية إجراء البحوث حول هذه المسألة من الشبكات الاجتماعية.

من حيث النموذج الحسابي للبحث الشبكة الاجتماعية، تانغ جي الى "توحيد شبكة التضمين" كموضوع، قدم DeepWalk، خط، PTE، وnode2vec وNetMF أساليب أخرى.

البحث هوى Tangjie لأكثر AMiner البحوث التي أجريت مؤخرا أنه وصف بالتفصيل مثال على كيفية استخدام الشبكات الاجتماعية للمشاكل العملية منها. وقدم أيضا بعض التطبيقات المثيرة للاهتمام، بما في ذلك توقعات تدفق المغلف الأحمر، والمدرسة عبر الإنترنت مع القراءة الروبوت "خشبية".

Songguo جي: لتعظيم تأثير الشبكات الاجتماعية

Songguo جي يقدم خلفية معرفية أساسية لتحقيق أقصى قدر من الشبكة الاجتماعية، ومن ثم "تعظيم تأثير" على التعريف بها، نقلا عن اثنين من ممثل الخوارزميات ويفعلون بعض الأعمال على حد سواء. وأخيرا نحن تلخيص بعض الاتجاهات مستقبل هذا المجال.

ما يسمى نشر هو شيء من أعضاء النظام الاجتماعي من خلال بعض القنوات مع مرور الوقت كانت هناك تتأثر المزيد من الناس، مع انتشار الفيروس يمكن أن نفهم بشكل أفضل هذا المفهوم، مثل اندلاع السارس والديدان الكمبيوتر. في عيون الناس القيام الشبكات الاجتماعية، على نحو مماثل لكيفية انتشار المعلومات في منصة الشبكة الاجتماعية، وكيف يمكننا تحقيق أقصى قدر من انتشار نفوذ (للإعلان الخ).

تعظيم أثر عموما يمكن تقسيمها إلى عدة نماذج، مثل نموذج لمرة ومنفصلة، ونماذج زمنية متواصلة، نموذج نشر تنافسية أو نماذج أخرى مثل انتشار الأوبئة نموذج التصويت. عتبة النموذجية ووضع تتالي حيث نموذجين في نموذج وقت محدد من الفئات الأساسية.

عندما تعطى نموذجا، يصدر الأمثل مثل:

1، وكيفية اختيار مجموعة من المستخدمين، ومنحهم بعض كوبونات خصم، وأخيرا تمكين تتأثر المزيد من المستخدمين؟

2، واختيار تلك الجماعات للتطعيم، والعدوى يمكن التقليل؟

3، إذا كان هناك جهاز استشعار، والتي يمكن أن تعجل كيف يتم وضعها للكشف عن الأمراض المعدية؟

في الجزء خوارزمية الدراسة، Songguo جي تفاصيل خوارزميات كسلان تقييم خوارزمية وMIA ارشادي.

ثم قدم Songguo جي لهم للقيام بهذا العمل من أربعة، وهي:

1، وكيفية الحد من تأثير تكلفة حساب المستهلك.

2، وكيفية تسريع عملية التقارب.

3. ماذا يحدث عندما نشر المعلومات مختلفا؟

4، ما سوف تواجهها عند الشبكة الاجتماعية الحيوية.

وأخيرا قال Songguo جي أنه في تطبيقات الأعمال الفعلية لا بالضرورة تتطلب خوارزمية أكثر كفاءة، ولكن تميل إلى استخدام أكثر نضجا واستقرارا الخوارزمية. فكيف لإيجاد نقطة جيدة للتطبيق في سيناريوهات معينة، والدافع والنقطة الأساسية إجراء مزيد من البحوث في هذا الصدد.

تشاو شين: المعرفة من منصات وسائل الإعلام الاجتماعية للتعدين التجاري

جاو شين كبرى منصات وسائل الإعلام الاجتماعية من منظور التطبيق. لأول مرة شرح وسائل الإعلام الاجتماعية دراسة الدوافع، ثم قدم تحليل نوايا المستخدم، صورة المستخدم بناء، أوصت احتياجات المستخدمين ثلاثة بحوث، تشاو شين أخيرا إعطاء بعض الآفاق البحثية ذات الصلة.

بيانات كبيرة الاجتماعي في كل مكان، ويرتبط ارتباطا وثيقا مع المستخدم (الهوية الاجتماعية والهوية الحقيقية للملزم)؛ مستخدمي البيانات الكبيرة الاجتماعي على الإطلاق يحتوي على ثروة من قيمة الأعمال، وكيفية الاستفادة من المعرفة وراء هذه البيانات مهمة للغاية. وغالبا ما أوصى أنظمة الكهربائية التقليدية من قبل الشركة المصنعة فقط خدمة الإحالة في محطاتهم، بمجرد مغادرتهم برنامجهم، خدمة توصيتهم لا تستطيع أن تفعل أي شيء. ولكن المستخدمين قد يتعرض لبعض المنابر الاجتماعية الأخرى تملك شراء احتياجات شخصية، على سبيل المثال في الدقيقة بو قدم "تريد تغيير الهاتف، تسعى التوصيات،" اذا كنا نستطيع انتشال هذه المعلومات، ومركز المعلومات في الوقت الحقيقي باستخدام الاكتشاف الاجتماعي شراء المستخدمين ستعالج نية المورد الكهرباء التقليدية عن هذا النقص.

تحديد نية المستخدم لشراء الغذاء والسفر والتعليم وغيرها من المجالات على أساس. فإنه لا ينطبق على التعلم تحت الإشراف، يمكنك القيام به فقط ما يصل الى التعلم شبه إشراف. في تصنيف نية المستخدم يمكن بناؤها إطار تسوية للنموذج العام، بما في ذلك النص - كلمات التنظيم، والنص - تنظيم النص، الكلمة الرئيسية - تنظيم الكلمات الرئيسية والتقدير الأصلي.

صورة المستخدم، يمكن للمستخدمين تطبيق النظام التقليدي تواجه مشاكل جديدة مثل معلومات قليلة جدا المتاحة؛ في هذا الصدد، أنه من الممكن حل هذه المشاكل اذا كنا نستطيع استخدام المعلومات على منصات وسائل الإعلام الاجتماعية.

الخطوات الأولى والثانية (والمستخدم تهدف إلى تحديد صور) العمل للخطوة الثالثة - ينصح احتياجات المستخدمين. توصية المنتج على أساس جمهور للنظر في بعدين: نوع الجنس والسن، في حين أن المنتجات في الجمهور لديه ملف معين، هناك وجهة نظر معينة لتوزيع جمهور.

تشاو شين اعتقد انه يجب بناء المسائل التطبيقية المحيطة البيانات والمعرفة القوية التي حصل عليها ضعف البيانات + المعرفة + نموذج. وبالإضافة إلى ذلك، وقال انه يصور انه مع تشكيل شبكة من نظام الاسم الحقيقي، والهوية الاجتماعية اتجاه البحوث الهامة جدا.

جيمس أ. إيفانز: هيكل الفريق والتقدم العلمي

كعالم اجتماع جيمس، وتقاسم أبحاثهم على العمل الجماعي (التعهيد الجماعي والعمل الجماعي كبير) في التقرير.

وقدم لأول مرة على سبيل المثال، أستاذ بيكر وفريقه في عام 2010 لإعادة تصميم الإنزيمات تحفيز رد فعل DIEL-ألدر، ولكن غير فعالة. أنها وضعت دعا Foldit! لعبة البروتين، وقريبا الباحثين لاسترداد ما يقرب من 200،000 التصاميم، وزيادة انزيم النشاط 18 مرة. هذه الظاهرة التعهيد الجماعي يمكن نسخه إلى مجال الحاسب الآلي، مثل التدريب غير خاضعة للرقابة (أشرف) أو جهاز أكثر تطورا تعلم الخوارزميات المهام المتوازية؟

فريق جيمس درس بين 1954-2014، أكثر من 50 مليون ورقة، وبراءات الاختراع والبرمجيات والمنتجات، وهذا التحليل من خصائص الفريق. ووجد الباحثون أن فريق صغير لأداء أفضل في العمل النوعي، والفريق هو ميزة كبيرة في العمل الكمي.

وانغ وي: شبكات النمذجة الديناميكية

يركز البروفيسور وانغ وي في التقرير على دراسة SCAI مجموعة التجريبية في شبكة ديناميكية.

وهناك الكثير من البيانات في شكل شبكة، مثل الشبكات الاجتماعية، وشبكة الإنترنت، وشبكة التفاعل البروتين، وشبكة الطرق، واستشهد الشبكات.

مع الأخذ بعين الاعتبار القوى المحركة للشبكة، ووصف هيكل الشبكة وانغ وي بوصفها وظيفة من طريقة الوقت: الوقت نموذج الشبكة الى عوامل. أيضا حول التعميل المصفوفة إلى قسمين المصفوفة المعتمدة على الزمن. طريقة بسيطة جدا، لكنها فعالة جدا، لأن وقت محسوب لا إعادة حساب دائما من نقطة الصفر. تطبيق هذه الطريقة، توجه بصرف النظر أو غير موجهة الرسم البياني في الشكل. التنبؤ الارتباط في السؤال يمكن أن يرى مزايا هذا النهج. للكشف عن الشذوذ، ويمكن حساب مباشرة من قبل فرق التوقيت بين الجانبين المجاورة.

بالإضافة إلى النظر في اتساق اتساق ذلك الوقت، وكذلك الفضاء. من خلال النظر في التفاعل بين حواف المجاورة، عامل فضاء الشبكة التي تأخذ بعين الاعتبار ديناميكية.

من خلال النظر في طبيعة ديناميكية من الزمان والمكان، فمن الأفضل قادرة على التنبؤ تطوير الشبكة. ثم يقول البروفيسور وانغ التنبؤ حافة (LIST) وجود خصائص التماسك الزمنية للشبكات وديناميكية (DANE) واستخدام شبكة دينامية تضمين الكشف عن شذوذ (NetWalk).

هو جين تاو Xiangen: التمثيل الدلالي والتحليل (SRA)، وكذلك التطبيقات المحتملة

أستاذ هو Xiangen من وجهة نظر علم النفس المعرفي للنظر في التمثيل الدلالي والتحليل (SRA)، ويدخل بعض التطبيقات التي تعتمد.

هو جين تاو Xiangen النظر لا يمكن مساواته البيانات والمعلومات. من وجهة نظر نفسية التركيز لا تعتبر بيانات كبيرة، ولكن السلوك البشري.

قدم هو جين تاو Xiangen أبحاثهم في مجال التوجيه الذكي AutoTutor. ما يسمى التوجيه الذكي هو مبدأ التعلم والذاكرة في علم النفس المعرفي لتصميم نظام الكمبيوتر، نظام الكمبيوتر تكرار تفاعل الإنسان. والفرق الرئيسي هو الدراسة التجريبية الذكية البحوث هو Xiangen وفرق بحثية أخرى أن المزيد من التركيز على اللغة الطبيعية التفاعلية. ووصف بالتفصيل الإطار وتطبيق التوجيه الذكي في التقرير.

التفاعلية اللغة الطبيعية تحتاج أولا إلى خلق فضاء دلالي، والذي يتضمن بناء أول الإحضار، تليها الإحضار المشفرة في الفضاء الدلالي، وأخيرا التطبيق. لتطبيق معين (وخاصة في مجال التعليم)، هو Xiangen أعتقد أننا يجب أن تختار أفضل الإحضار، مع أفضل أسلوب الترميز المستخدمة في معظم التطبيق المناسب، وإلا فهو غير مسؤول عن حياة الطفل.

ثم كيف اختياره الإحضار، وتطبيق الترميز وتقديم شرح مفصل عن AutoTutor في.

ايشيكاوا: غير متجانسة النمذجة شبكة المعلومات وتحليلها

إيشيكاوا أول استعراض المراحل الثلاث للتنمية الشبكات الاجتماعية: يتميز الكائن التعدين قبل عام 2000، بعد عام 2000 على أساس شبكة تفاعلية تربط علاقة يحدث التعدين، فضلا عن مجموعة متنوعة من العلاقات المعقدة بين الأشياء التي تظهر شبكة المعلومات غير المتجانسة التعدين.

ثم يقدم المفاهيم الأساسية لشبكات المعلومات غير المتجانسة، ومقارنة مع متجانسة شبكة المعلومات شبكة المعلومات غير المتجانسة، وأوجه التشابه والاختلاف بين الشبكات متعددة، شبكة معقدة. وهو يعتقد أن مزايا التعدين شبكات المعلومات غير المتجانسة هي شبكات المعلومات غير المتجانسة في كل مكان، بما في ذلك عدد كبير من المعلومات الدلالي وشاملة غنية، ولكنها تواجه أيضا الكثير من التحديات، مثل بنية معقدة ودلالات التعدين صعبا.

يتبع إيشيكاوا ببضعة أمثلة محددة لكيفية إدخال التعدين غير متجانسة بيانات الشبكة، على التوالي، وقياس التشابه (HeteSim)، أوصى (SemRec) والكشف عن البرامج الضارة (HinDriod). وكان آخر من KDD لهذا العام هي أفضل أوراق التطبيق.

وأخيرا إيشيكاوا يلخص وضع شبكة غير متجانسة من المعلومات البحثية والاتجاهات للبحث المستقبل. وهو يعتقد أن شبكة المعلومات غير المتجانسة لا تزال شابة، واعدا مجالات البحث. ل5V البيانات الكبيرة (المجلد، السرعة، منوعات، الصدق والقيمة)، وشبكة المعلومات غير المتجانسة التنوع (فارايتي) التي سوف تعزز بشكل كبير. ويتمثل التحدي في كيفية حل المشاكل الأكثر تعقيدا (مثل خريطة المعرفة)، وكيف تصبح أكثر قوة وكيفية التعامل مع البيانات الكبيرة. وبطبيعة الحال، غير متجانسة تجهيز شبكة المعلومات، وهناك العديد من الفرص، بما في ذلك تفسير وعرضها وتحليلها. وضع إيشيكاوا معا شبكات المعلومات غير المتجانسة هي المواد الورقية أكثر أهمية، معلومات مفصلة يمكن الوصول إيشيكاوا الصفحة الرئيسية الشخصية.

كوي بينغ: شبكة جزءا لا يتجزأ من: تمكين تحليل الشبكات والمنطق في الفضاء ناقلات

بنغ تسوى في يسلط التقرير الضوء على بعض الأعمال التي هي جزء لا يتجزأ في جميع أنحاء الشبكة. وقال كوي بينغ أن الآن مجموعة كبيرة من البيانات والطاقة الحسابية لأجهزة الكمبيوتر تزداد أضعافا مضاعفة، وإذا كان التطور في هذا الاتجاه، فإنه لن يكون مشكلة للبحث البيانات الكبيرة.

ولكن الواقع هو أن هناك علاقة بين البيانات، الأمر الذي أدى إلى زيادة ليس فقط بيانات مؤشر، ولكن مؤشر الرقم القياسي.

لمثل هذا بيانات الشبكة على نطاق واسع، وقال انه يعتقد وجود رابط، وسوف يسبب التعقيد الناجم عن التكرار والجمع، إلى جانب طريق جلب التوازي ويمكن أن يكون سببه الانتماء بين التطبيقات تعلم آلة العقدة بعض المشاكل.

كوي بينغ ثم أدخل إلى شبكة تضمين الى متجهة فراغ، ثم على أهمية عقدة، والكشف عن المجتمع، وبعد المسافة الشبكة، وصلة التنبؤ وهلم جرا يمكن أن تتحول إلى الفضاء ناقلات المشكلة. كيفية الشبكة جزءا لا يتجزأ من الفضاء ناقلات الأمراض؟ يعتقد تسوى بنغ ان هناك هدفين: 1، والقدرة على إعادة بناء شبكة الأصلية من مساحة النواقل؛ 2، ويدعم تمثيل الفضاء ناقلات الشبكة.

بعد إدخال هذه الخلفية المعرفة، قدم كوي بينغ اثنين من عملهم مؤخرا. واحد هو من وجهة نظر بنية أكثر تعقيدا من فرط شبكة التضمين، والثاني لخصائص ديناميكية الشبكة التضمين من منظور أكثر تحديا للنظر فيها.

يعتقد تسوى بينغ أن التطبيق العملي هو أبعد ما يكون عن استخراج البيانات الشبكة، وعقبة رئيسية تواجه التعقيد وتطويره. الحل الأكثر أساسية لهذه المشكلة هو يتعلم الشبكة، وكانت الشبكة جزءا لا يتجزأ ثبت أن نهج واعدة، ولكن لا يزال أمامنا طريق طويل لنقطعه.

شين هوا وى: نشر المعلومات توقعات وسائل الإعلام الاجتماعية على الإنترنت

شين وي هوا من زاوية المعلومات التنبؤ نشر لرواية قصة، ومحتويات الرئيسية للتقرير وينقسم إلى قسمين.

شين وي هوا أول المشتركة دراسة تأثير تكبير. ما يسمى تعظيم الأثر، وإعطاء حجم ثابت للشبكة الاجتماعية إلى العثور على مجموعة من العقد التابعة، إلى تأثير تعظيم. لهذه الدراسة لديها مشكلتين رئيسيتين: كيفية تحديد احتمال انتشار بين الناس تتأثر العقدة؟ كيفية تصميم كفاءة ودقة الخوارزمية تأثير تعظيم؟ الخوارزميات الموجودة خوارزميات الجشع، خوارزميات الكشف عن مجريات الأمور، ولكن أنهم يواجهون التدرجية - دقة من المأزق. شين وي هوا حل منها هو إعادة استخدام نفس مجموعة مونت كارلو المحاكاة، واقترح خوارزمية StaticGreedy.

ثم قدم شين هوا وي التنبؤ نشر. طرق للتنبؤ نشر القائمة، وهناك نوعان: أساليب تعتمد على ميزة والتحليل الزمني. ومع ذلك، هذه الأساليب تتجاهل الحشد هو انعكاس لعملية ديناميكية المشاركة الجماعية. لذلك اقترحوا طريقة القائم على العملية. وهو يعتقد أن المجموعة هي عملية ديناميكية وصوله يمكن التقاط المعلومات حول كيفية تتراكم مصدر قلق، وسيتم دمج أساليب تعتمد على ميزة في خصائص عملية التعلم.

في التقرير النهائي، جعل شين هوا وي اثنين من التوقعات:

1، سيتم تغييرها في المستقبل من خلال ميزة الهندسية لميزة التعلم؛

و2، في العام المقبل سيكون شبكة اختراق الاجتماعي العام.

ليو تشى يوان: تعلم اللغات والعلوم الاجتماعية الحاسوبية يمثل

ليو تشى يوان النقطة الأساسية هي: الحساب هو نسبة بحوث العلوم الاجتماعية "الفكرة". وهو يعتقد أن اللغة هي نقطة مهمة من وجهة نظر دراسة المجتمع البشري، وقال انه استشهد العديد من الأمثلة المثيرة للاهتمام. على سبيل المثال، استخدم فريق البحث في جامعة هارفارد جوجل الكتب ومسح خمسة ملايين أنواع المنشورات بين 1800 و 2000 وحدة مع مرور الوقت حسب التردد من استخدام كلمات مختلفة، وتحليل خصائص التطور الثقافي البشري؛ فريق ستانفورد جمع 9 Leskovec عشرة ملايين المقالات الإخبارية، استخدم علامات الاقتباس لتصريحات استخراج كما ميمي شعبية، في الوقت المناسب والفعال فهم الحياة السياسية والاقتصادية والثقافية الأمريكية بسبب تغيير التردد وضعية التتبع. هناك أيضا البحث على الانترنت نموذج التحول لغة المجتمع لدراسة مركز ثقافي للتغيير، وتطوير تطبيق الصغرى بلوق باستخدام الكلمة ولد المعلومات الموت المشاهير. ليو تشى يوان أعتقد أن هذه هي "عصر يتعلم الأمامية" - على أساس الرموز التمثيل، وهذه الدراسات ليست كلمات ليعبر عنه نموذج واحد الساخنة. هذا النموذج التمثيل لا يمكن أن تمثل العلاقة بين كلمات مختلفة. ثم قدم يتعلم الموزعة، في هذا التمثيل تمثيل الأشياء كما كثيفة، قيمة الصلبة، ناقلات منخفضة الأبعاد، والمسافة بين ناقلات فمن الممكن أن تمثل العلاقة بين كلمات مختلفة.

وبناء على هذا التمثيل، بدأ نموذج التعلم word2vec لتطوير. وقال الكشف عن التغير الدلالي المعجمي نص مشترك - وهذا نموذج التعلم له نتائج جيدة جدا من حيث حساب التشابه، في حين أن العلاقة الضمنية الاستحواذ بين الكلمات، والعثور على المستوى الدلالي المعجمي، وإنشاء عبر لغة التمثيل المفردات، وخلق بصرية.

ثم قدم ليو تشى يوان منشور على "الطبيعة" من نتائج البحث من العلوم المعرفية، واللغة التي يتم توزيعها في التمثيل في الدماغ يعكس استخدام تمثيل موزعة وضع شروط خرائط الدماغ. ووجدت الدراسة كلمات مختلفة تفعيل مناطق الدماغ لا يقتصر على منطقة معينة من الدماغ، ولكن توزيعها في أجزاء مختلفة من الدماغ، ومعنى المصطلحات ذات الصلة في تفعيل مناطق الدماغ مماثلة.

وأخيرا، تفاصيل ليو تشى يوان أيضا حول احتساب بحوث العلوم الاجتماعية، بما في ذلك إدماج HowNet معنى التمثيل، خرائط المعرفة وهلم جرا. انه يعتقد ان وزعت تمثيل يوفر أكثر من التمثيل الرمزي للقدرة حوسبة قوية، مع نظرة أكثر عمقا، ولكن يمكن أن المفتاح أيضا معرفة كيفية استخدامها بشكل خلاق.

يانغ يانغ: مجموعات من سلوك المستخدم في تحليل الشبكات الاجتماعية وتقديم التعلم

يانغ يانغ من محتوى التقرير فقد اثنين من الموضوع الرئيسي، مجموعة واحدة لتحليل سلوك المستخدم، والثاني هو ليتعلم الشبكة.

تحليل سلوك مجموعة من المستخدمين، قدم يانغ يانغ ثلاث دراسات حالة محددة. من وجهة نظر سوسيولوجية لعرض دراسات الحالة من حلم المهاجرين في المناطق الحضرية - ينظر الأنماط السلوكية من الجماعات المهاجرة، وتقترح مدينة الموجهة التخطيط. في هذه الحالة، يانغ يانغ من مختلف الفئات (السكان المحليين والمهاجرين القدامى والمهاجرين الجدد) من خلال استخدام 700 مليون يوان البيانات (أي محادثة، فقط لتقديم وتلقي البيانات) 54 مليون مستخدمي شركة تشاينا نيتكوم وشنغهاي لهجة الاختلافات في أنماط السلوك. ووجد الباحثون أن المهاجرين الجدد على الاندماج في البيئة الجديدة على ثلاثة أوضاع: الاقتراب نحو السكان المحليين، إلى الاقتراب نحو المهاجرين القدامى وتفشل المهاجرين. ووجد الباحثون أن المهاجرين الأنماط السلوكية للالأسبوعين الأولين بعد وصوله إلى المدينة القرار النهائي بشأن نجاح المهاجرين.

ثم يروي قصة قضية في مجال الاتصالات السلكية واللاسلكية منه أن يفعل - لتحديد المستخدم من خلال سجلات المكالمات ما إذا كان المستخدم هو عملية احتيال المحتالين استراتيجيات الهاتف والمحتالين التعدين. مجموعات البيانات بنفس الحالة المذكورة أعلاه، ولكن بناء على مخطط موجه. ووجد الباحثون أن المحتالين في وتيرة المكالمات الصادرة أعلى من المستخدم العادي بقدر 200 مرة، المحتالين تلعب علاقة الكائن هاتفية بين الضعيف للغاية. في الوقت وجد المحتالين توزيع الوقت لتوزيع المكالمات والعمال مماثل.

الحالة الثالثة هي مجال التمويل - وفقا لوضع المستخدم لتحديد ما إذا كان القرض دعوة تأخيره ستمول السيطرة على المخاطر، وهذا هو، إعطاء قرض دون أي سجل عميل جديد للحكم عن طريق سجلات المكالمات له ما اذا كان سوف المتأخرة القسم.

في دراسة يلخص تحليل سلوك المستخدم المجتمع الشبكة الاجتماعية، وقال يانغ يانغ أننا لسنا بحاجة في كثير من الحالات لديهم الخبرة اللازمة، ولكن الحاجة إلى فهم سلوك المستخدم. على سبيل المثال، قال إن ملك المجد من أجل سلوك المستخدم الدراسة، لعب هو وطلابه شهر من مجد الملك.

ثم قدم يانغ يانغ شملت محتويات جماعتهم اثنين AAAI 2018 المادة. واحد هو دينامية شبكة التضمين من قبل النمذجة تكاملي ثلاثي اختتام عملية، ويصف الحب الذي تريد أن تتعلم التمثيل الديناميكي للشبكة، والآخر لتعلم التمثيل لشبكات خالية من مقياس، يتعلم قدم مجانا مقياس المنحى الشبكة.

جيا وى هان: تحليل متعدد الأبعاد للجسم على نطاق واسع

مشترك جيا وى هان أبحاثهم المنحى المعرفة في بعض البيانات الكبيرة يصبح في التقرير. أولا، وهو ما يفسر كيفية القيام بذلك.

هناك الآن بيانات كبيرة وتقوم 80 من البيانات على نص غير منظم، والصور، والعلاقات الاجتماعية وتمثيل الآخرين. وقال جيا وى هان مجموعة أبحاثهم على ثلاث كلمات، وهي: منظم (الهيكلة)، والربط الشبكي (الشبكات) والتعدين (التعدين). لذا ثلاثية عملهم، الأول هو كيفية انتشال هيكل مخفية عن البيانات النص، تليها الشبكات والنص في TextCube، وأخيرا انتشال المعرفة المنحى من الشبكة وTextCube في.

قبل التعدين البيانات، والبيانات الأولى في الشبكة وTextCube، جيا وى هان أعتقد أن هذا الاتفاق هو أكثر قوة، وضرب مثلا لأطروحة توقع المشارك المؤلف توضيح هذه المشكلة.

ثم قدم جيا وى هان عمل عدة الأخيرة من هيكل التعدين النص غير منظم. أولا قدم أعمال الحفر العبارة، التي تترجم إلى ذات جودة عالية الإحضار الأصلي من العبارات والإحضار مجزأة. الثاني، هو جعل عبارة ذات مغزى، وهو يصف العمل التحليلي الكيان / العلاقة. ثم قدم العمل ميتاباد أن الفوقية خصائص نموذج يحركها من المثول كبيرة من النص وجدت. وأخيرا، وقدم أيضا العديد من التعدين تصنيف (متعدد الأوجه تصنيف التعدين).

استخدم الغرض من القيام بهذه الدراسات لإنشاء TextCube متعددة الأبعاد. يفسر جيا وى هان كيفية تقديم بشكل صحيح إلى خلية مكعب، مع وجود الكثير من البيانات وكمية صغيرة من التسميات لTextCubes بناء. جيا وى هان نعتقد أنه من أجل أن تصبح المعرفة الكبير البيانات الكبيرة، واحد مهم جدا هو أن يكون الهيكل، والآن هذا الهيكل، وهناك نوعان، واحد هو عبارة عن شبكة غير متجانسة، والآخر هو TextCube، مع هذين الهيكلين للخروج المعرفة هي قوية جدا، والآن كيفية الجمع بين الشبكات غير المتجانسة وTextCube، لا تزال لم تحل.

وقال جيا وى هان من البيانات غير المهيكلة في المعرفة هو وسيلة طويلة منذ ما يقرب من عقدين من الزمن يفعلون بالضبط على طول هذا الطريق للذهاب، والآن هذا الطريق هو مجرد طريق صغير، ويتوقع في نهاية المطاف ليصبح طريق واسع.

AI تقنية مراجعة جيا وى هان ثم الانتهاء من التقرير الكامل، حتى لا تنزعج!

لوحة

وبالإضافة إلى هذه التقرير الممتاز، كما نظمت ADL رابط لوحة الشذوذ رائع. هناك جيا وى هان، ليو تشى يوان، إيشيكاوا، شين هوا وي يانغ يانغ وطالبة من الحقل المحدد على لوحة. فرز شبكة لى فنغ التالية من السؤال والجواب جزء من الجوانب الرائعة للفريق.

سؤال: ما هي التحديات التي تواجه البحوث الشبكة الاجتماعية التي؟

ليو تشى يوان أعتقد أن التحدي البحوث الشبكة الاجتماعية مستويين، الأول هو: المعرفة هي زاوية قطع مهمة، وثانيا، تضمين فنيا وسوف التعلم العميق تصبح وسيلة فنية هامة.

ويعتقد جيا وى هان استخراج من البيانات غير المهيكلة في استخراج البيانات المهيكلة من البيانات المهيكلة في شبكة وtextCube، واستخراج المعرفة هي في غاية الأهمية من الأخيرين. لأتمتة مهمة جدا واحد هو للخروج من هياكل البيانات الكبيرة.

شين هوا وي يمثل نقطة جديدة نسبيا للعرض، نضع دائما تضمين بيانات الشبكة إلى الفضاء، ثم ما إذا كان يمكن أن تفعل العكس؟ وهذا يعني أن يهاجر مشغل الشبكة، أو لبيانات الهجرة إلى مشغل الشبكة.

ويعتقد يانغ يانغ إما تضمين أو علم الحوسبة الاجتماعية، والخوارزميات تفعل عدم تفسيرها.

السؤال: كيف تنصهر فيها والعلماء في مجال المعرفة في مجالات أخرى؟

شين وي هوا التفكير والعلماء في مجالات أخرى من مجالات التعاون أساسا على ثلاثة أمور:

1، لنرى ما يهمني، ما إذا كنا نستطيع القيام به بالنسبة لك.

2، لنرى ما هو أبحاثهم روتينية سواء يمكننا أن نتعلم من.

3، الانتهاء من فوق خطوتين، وسوف تجد أنه في الواقع نحن لا هي نفسها، مجرد زاوية مختلفة من النهج، لغات مختلفة.

في الواقع، لم يكن من الصعب، والمفتاح هو ما الغرض هل عقد هذا الشيء.

السؤال: كيف مجال المعرفة في تطبيق التعلم عمق الحالي والتنمية حار جدا؟

جيا وى هان أعتقد التعلم العميق لا تزال تتطور. الآن تعلم عمق ما زال يحتاج إلى الكثير البيانات التسمية. حتى إذا كان الحقل لا يمكن الجمع بين المعرفة وعمق التعلم يمكن أن تجعل من عملية التعلم بشكل أفضل. وبالإضافة إلى ذلك، وضعت كثير من العلماء إلى الأمام كيفية القيام عينات صغيرة من التعلم العميق، وحتى الآن هو التناقض المهم جدا هو التناقض بين البيانات الكبيرة والبيانات ليتل. الآن هو ليس مجال المعرفة لا طائل منه، ولكن لم يحن بعد لتطبيقات التعلم العميق معرفة هذه الخطوة.

لى فنغ ملخص الشبكة: وقد تم تنظيم ورشة العمل هذه القضية ADL تانغ جي وليو تشى يوان والمنظمات المعلم أخرى، إلى دعوة الجمهور في الداخل والخارج كبيرة الماشية العلماء، بما في ذلك كبار العلماء في مجال البيانات التعدين جيا وى هان وفيليب S يو وأساتذة آخرين، وكذلك هو Xiangen، جيمس أ. إيفانز وعلم النفس، الخ علماء علم الاجتماع المعروفة. لمدة ثلاثة أيام، و 13 باحثا من جميع الزوايا، على التوالي، على الشبكات والبيانات الاجتماعية التعدين في التفاصيل، ومجموعة كاملة من التفسير.

من وجهة نظر الطالب وجهة نظر، الناس يمكن العثور ليس فقط في علوم الحاسب الآلي واستخراج البيانات من الشبكات الاجتماعية المهتمة في بعض علم النفس والإدارة وغيرها من طلاب المهنية أيضا جاء للاستماع، بل وتشمل عددا من أساتذة الجامعات، والأعمال التجارية والموظفين التقنيين وكذلك بعض قسم أمن الدولة.

هناك الكثير من الناس الذين لديهم اهتماما كبيرا في هذا المجال، ربما مدرسا توقع شين هوا وي أن العام المقبل قد تكون شبكة اجتماعية في السنة اختراق.

وبطبيعة الحال في وقت مبكر ذكرت بالكامل، تخضع لقيود الموقع لم يقدم المزيد من الأماكن، وCCF قدم أيضا المزيد من الدورات ADL. من أجل السماح للهواة المخابرات أكثر الاصطناعي، والعاملين في الصناعة، يمكن الباحثين العلميين رؤية CCF ADL الدورات وفاز الذكاء الاصطناعي AI مدرسة مو التدريب من الدرجة منصة CCF الحصري على الانترنت حقوق التأليف والنشر الفيديو، أو مسح يلي؟ كود ثنائي الأبعاد يمكن أن تكمل استنساخ العلماء 13 في الموقع التعليمات، مشهد الاتصالات.

"بيبى شارع" ظهرت على CCTV "حفظ حنين"، وقد عرض نفسه لZhonghuai وابنه وغيرها من القهوة كبيرة في Zuofu

"شاطىء البحر مانشستر" الصف قليلا من الفيلم؟ هذه المرة ليس بسبب المسارح ليست متفائلة حيال ذلك

السائقين الآخرين أكره سلوك ما يقود؟

"مقاطعة الاقتصادية الدراسة" وشى مقاطعة، عقدت حملة التعداد الاقتصادي الوطني الرابع

الحديث شيه نا عن "منظمة الصحة العالمية والذي لعب الأحمر" يانغ دي ليو وي تضحك الغاز! ونحن مؤهلون!

وقال التعرض ممن لهم ثلاثة المهنية كاميرا رقمية عدسة الكاميرا أيضا هناك ضغط

Yiyanbuge يقول البراءة وطنية، ونحن يمكن أن يكون لها مناقشة جيدة من الذئب 2 كفيلم ذلك؟

100 ثانية لرؤية تشونغتشينغ، Youyang

بعد العلامة التجارية أحذية الخريف وتسريع خصبة بو العلامة التجارية التعمير

الإخوة شياو وو للعودة كل يوم من الصعب! الحديث عودة مستقلة "كل يوم"!

كتلة دراسة سلسلة | ما هو عبر السلسلة؟

"التنين كويست باني 2" المخابرات الجديد: بناء نظام أوتوماتيكي والدفاعية أسلحة