حصري | مقال واحد لفهم تحليل الشبكات الاجتماعية (باستخدام موارد التعلم)

(انقر لمشاهدة صورة بشكل اكبر)

المقال الرئيسي للتوضيح:

  • الخصائص الهيكلية وآلية تطور الشبكات الاجتماعية

  • تشكيل سلوك مجموعة الشبكات الاجتماعية وقواعد التفاعل

  • نشر المعلومات وآلية تطور الشبكة الاجتماعية

تصفح الفصول الأربعة الأخيرة للمحتوى ، يرجى الرجوع إلى المقالة التالية (المادة 2 في 26 سبتمبر 2017).

مقدمة

تُعرَّف الشبكة الاجتماعية في ويكيبيديا على أنها "بنية اجتماعية تتكون من العديد من العقد. تشير العُقد عادةً إلى الأفراد أو المنظمات ، بينما تمثل الشبكات الاجتماعية علاقات اجتماعية مختلفة." قبل ولادة الإنترنت ، كان تحليل الشبكات الاجتماعية هو دراسة علم الاجتماع و فرع مهم من الانثروبولوجيا. تشير الشبكات الاجتماعية المبكرة بشكل أساسي إلى الشبكات المهنية التي تم إنشاؤها من خلال العلاقات التعاونية ، مثل شبكات التعاون في البحث العلمي ، وشبكات التعاون بين الفاعلين ، وما إلى ذلك.

يشير تحليل الشبكة الاجتماعية المشار إليه في هذه المقالة تحديدًا إلى تحليل الشبكة الاجتماعية عبر الإنترنت (تحليل الشبكة الاجتماعية عبر الإنترنت) ، والذي نشأ مع ظهور خدمة الشبكة الاجتماعية عبر الإنترنت (SNS). هناك أربعة أنواع من الخدمات الاجتماعية عبر الإنترنت: تطبيقات المراسلة الفورية (QQ و WeChat و WhatsApp و Skype وما إلى ذلك) والتطبيقات الاجتماعية عبر الإنترنت (Qzone و Renren و Facebook و Google+ وما إلى ذلك) وتطبيقات المدونات الصغيرة (سينا ويبو وتينسنت ويبو ، Twitter ، وما إلى ذلك) ، وتطبيقات الفضاء المشتركة (المنتديات ، والمدونات ، ومشاركة الفيديو ، ومشاركة التقييم ، وما إلى ذلك).

للشبكات الاجتماعية عبر الإنترنت (يشار إليها فيما بعد باسم الشبكات الاجتماعية) أربع خصائص: السرعة ، والانتشار ، والمساواة ، والتنظيم الذاتي. بسبب هذه الخصائص ، فقد كان لديه بلايين من المستخدمين في غضون بضعة عقود فقط منذ ظهور الإنترنت وكان له تأثير على جميع جوانب المجتمع الحقيقي. في الانتخابات الرئاسية الأمريكية لعام 2016 ، استخدم الرئيس المنتخب ترامب موقع Twitter كأداة دعاية ؛ وفي الصين ، من حادثة Wei Zexi إلى حادثة فندق Yi Hotel إلى "طعن الأم المهينة حتى الموت" "الأحداث هي كل ذلك يتخمر بسرعة على الشبكات الاجتماعية ويؤثر في النهاية على المجتمع الحقيقي. وأصبح هذا الاتجاه المؤثر على الإنترنت أكثر وضوحًا.

بالإضافة إلى العديد من الآثار الاجتماعية والاقتصادية الإيجابية للشبكات الاجتماعية ، هناك أيضًا العديد من الآثار السلبية. من المعلومات العنيفة والإرهابية على Facebook و YouTube إلى عدد كبير من الشائعات والأخبار المزيفة على Weibo و WeChat ، تنتشر هذه المعلومات الضارة بسرعة وفي كثير من الأحيان مع عواقب لا يمكن السيطرة عليها من خلال خصائص الشبكات الاجتماعية.

من أجل الاستفادة الجيدة من خصائص الشبكات الاجتماعية ، وتوليد القيمة والقضاء على الضرر ، ولد علم تحليل الشبكات الاجتماعية. إنه علم متعدد التخصصات يعتمد على علوم مثل المعلوماتية والرياضيات وعلم الاجتماع والإدارة وعلم النفس. وفقًا لخصائص الشبكة الاجتماعية ، فإنها تدرس بشكل أساسي ثلاثة محتويات رئيسية: الهيكل والتطور ، والجماعة والتفاعل ، والمعلومات والتواصل.

توضح هذه المقالة بإيجاز اتجاهات البحث المختلفة في مجال تحليل الشبكات الاجتماعية. بالنسبة للمحتوى التفصيلي ، أقوم فقط بإدراج المراجع ، وتقديم بعض مصادر التعلم في نهاية المقالة. من المأمول أنه من خلال قراءة هذا المقال ، يمكن للقراء المهتمين بهذا المجال أن يكون لديهم فهم شامل لتحليل الشبكة الاجتماعية والعثور على اتجاه التعلم. كمبتدئ في تحليل الشبكات الاجتماعية ، سوف يرتكب المؤلف حتما أخطاء في تفسير وبيان بعض المفاهيم والحقائق.أتمنى أن يتمكن القراء من تصحيح لي في الوقت المناسب ، ويمكننا التواصل وإحراز تقدم معًا.

واحد. الخصائص الهيكلية وآلية تطور الشبكات الاجتماعية

1. تحليل ونمذجة بنية الشبكة الاجتماعية

1.1 الخصائص الإحصائية

نماذج الشبكات الاجتماعية تأتي العديد من المفاهيم من نظرية الرسم البياني ، لأن نموذج الشبكة الاجتماعية هو في الأساس رسم بياني يتكون من العقد (الأشخاص) والحواف (العلاقات الاجتماعية). سأقدم بإيجاز المفاهيم الإحصائية المستخدمة بشكل شائع في نماذج الشبكات الاجتماعية.

  • درجة: يتم تعريف درجة العقدة على أنها عدد الحواف المتصلة بتلك العقدة. في الرسم البياني الموجه ، يسمى عدد الحواف التي تشير إلى العقدة بالدرجة الداخلية للعقدة ، ويطلق على عدد الحواف التي تشير إلى العقد الأخرى من العقدة الدرجة الخارجية للعقدة. يعكس متوسط درجة الشبكة كثافة الشبكة ، ويمكن أن يصف توزيع الدرجات أهمية العقد المختلفة.

  • كثافة: يمكن استخدام كثافة الشبكة لوصف كثافة الحواف المترابطة بين العقد. ويتم تعريفها على أنها نسبة العدد الفعلي للحواف في الشبكة إلى الحد الأعلى لعدد الحواف التي يمكن استيعابها. وغالبًا ما تُستخدم للقياس اتجاه كثافة وتطور العلاقات الاجتماعية في الشبكات الاجتماعية.

  • معامل التجميع: يتم استخدامه لوصف الدرجة التي تكون بها العقد المتصلة بنفس العقدة في الشبكة متجاورة أيضًا مع بعضها البعض. يتم استخدامه لوصف احتمال أن يكون أصدقاء الشخص أيضًا أصدقاء مع بعضهم البعض في شبكة اجتماعية ، مما يعكس التجميع في الشبكة الاجتماعية.

  • بين (بيني): عدد جميع أقصر المسارات التي تحمل الرسم البياني الكامل لعقدة في الرسم البياني ، والذي يُستخدم عادةً لتقييم أهمية العقدة. على سبيل المثال ، سيكون التباعد بين العقد الوسيطة التي تربط المجتمعات المختلفة كبيرًا جدًا مقارنة بغيرها العقد ، والتي تعكس أيضًا أهميتها في رسائل الشبكات الاجتماعية.

1.2 ميزات الشبكة

  • ظاهرة العالم الصغير: تشير ظاهرة العالم الصغير إلى حقيقة أن الأشخاص البعيدين جغرافيًا قد يكون لديهم فترات علاقات اجتماعية أقصر. في وقت مبكر من عام 1967 ، اختتم أستاذ علم النفس بجامعة هارفارد ستانلي ميلجرام واقترح "درجات الفصل الست" من خلال تجربة تسليم الرسائل ، أي أن أي درجتين يمكن ربطهما بمتوسط خمسة معارف. في عام 1998 ، نشر دنكان واتس وستيفن ستروغاتز مقالًا بارزًا بعنوان "الديناميات الجماعية لشبكات" العالم الصغير "في مجلة نيتشر ، والذي اقترح رسميًا مفهوم شبكات العالم الصغير وأنشأ نموذجًا للعالم الصغير.

    تم التحقق من ظاهرة العالم الصغير بشكل جيد في الشبكات الاجتماعية عبر الإنترنت. وفقًا لتقرير مجموعة تحليل بيانات Facebook لعام 2011 ، يبلغ متوسط طول المسار بين أي مستخدمين من مستخدمي Facebook البالغ عددهم 720 مليون مستخدم 4.74 فقط ، وهذا المؤشر آخذ في الازدياد. 4.67 يمكن القول أنه في غضون خمس خطوات ، يمكن توصيل الأفراد على أي شبكتين ببعضهما البعض.

  • خصائص خالية من الحجم: تتمتع معظم الشبكات الاجتماعية الكبيرة الحقيقية بخصائص أن معظم العقد لديها عدد صغير من الحواف ، وعدد قليل من العقد لديها عدد كبير من الحواف. تفتقر الشبكة إلى مقياس قياس موحد وتقدم عدم التجانس. نفترض أن هذا النوع من درجة العقدة التوزيع غير موجود. تسمى خاصية القياس المحدود لنطاق التوزيع الخالي من المقياس. إن خاصية توزيع الدرجات للشبكة الخالية من المقاييس هي توزيع قانون الطاقة ، وهو خاصية خالية من المقاييس لهذا النوع من الشبكات.

1.3 نموذج الشبكة

  • نموذج WS: نموذج WS هو نموذج العالم الصغير ، وشبكة العالم الصغير التي تم إنشاؤها بواسطة نموذج العالم الصغير هي شكل وسيط للانتقال من شبكة عادية إلى شبكة عشوائية.

  • نموذج بكالوريوس: يأخذ نموذج BA في الاعتبار خصائص توزيع قانون الطاقة للعقد في الشبكات الحقيقية وينشئ شبكات خالية من المقاييس.

  • نماذج أخرى: نماذج حرائق الغابات ، نماذج Kronecker ، نماذج الإنتاج.

2. المجتمع الافتراضي (المجتمع) وتكنولوجيا الاكتشاف

2.1 التعاريف

يعتمد تعريف المجتمع الافتراضي على منطقة الرسم البياني الفرعي: يتكون هيكل المجتمع من عدة مجموعات فرعية من مجموعة عقدة شبكة معقدة ، والوصلات بين العقد داخل كل مجموعة فرعية ضيقة نسبيًا ، والوصلات بين العقد في مجموعات فرعية مختلفة متفرقة نسبيًا.

يعد اكتشاف المجتمعات الافتراضية في الشبكات الاجتماعية مفيدًا لفهم خصائص طوبولوجيا الشبكة ، والكشف عن الخصائص الوظيفية الجوهرية للأنظمة المعقدة ، وفهم العلاقات الفردية داخل المجتمعات. تقديم دعم قوي لاسترجاع المعلومات والتوصية بالمعلومات ومراقبة نشر المعلومات وإدارة الأحداث العامة والتحكم فيها. وجد المجتمع الافتراضي أن هناك العديد من الخوارزميات الكلاسيكية ، والتي تُستخدم لتعدين المجتمعات الافتراضية بمقاييس مختلفة. وتسعى الخوارزمية جاهدة لتحسين الكفاءة (تقليل التعقيد الزمني) مع السعي لتحقيق الدقة العالية.

2.2 مؤشرات تقييم خوارزميات اكتشاف المجتمع

يمكن لمؤشرات التقييم التالية الحصول على مقدمة مفصلة من خلال محركات البحث:

  • نمطية: من خلال مقارنة الاختلاف في كثافة الاتصال بين الشبكة الحالية والشبكة المعيارية ضمن نفس قسم المجتمع ، يتم قياس مزايا وعيوب مجتمع الشبكة.

  • NMI (معلومات متبادلة موحدة): تُستخدم إنتروبيا المعلومات لقياس الفرق بين هيكل المجتمع المتوقع وبنية المجتمع. وكلما كانت القيمة أكبر ، كان تقسيم بنية المجتمع أفضل. عندما تكون القيمة القصوى هي 1 ، فهذا يعني أن بنية المجتمع مقسومة على الخوارزمية يتوافق مع هيكل المجتمع ، والخوارزمية لها أفضل تأثير.

  • مؤشر راند: يمثل نسبة عدد أزواج العقد التي تنتمي إلى نفس المجتمع أو تنتمي إلى مجتمعات مختلفة في كلا القسمين.

  • مؤشر جاكارد: يتم استخدام معامل Jaccard لقياس الفرق بين العينات وهو مقياس كلاسيكي.

2.3 خوارزمية الاكتشاف الساكن للمجتمع

  • خوارزمية تحسين نمطية

اقترح مارك نيومان خوارزمية جشعة FN لتعظيم النمطية. المراجع: نيومان ، مارك إي جيه. "خوارزمية سريعة لاكتشاف شبكات بنية المجتمع." المراجعة المادية E 69.6 (2004): 066133.

  • خوارزمية التحسين متعددة الأهداف

Zhao، Yuxin، et al. "الخوارزمية القائمة على التعلم اللاخلوي للكشف عن الشبكات غير المعقدة لبنية المجتمع". Neurocomputing 151 (2015): 1216-1226.

Du و Jingfei و Jianyang Lai و Chuan Shi. "Multi-Objective Optimization for Overlapping Community Detection." المؤتمر الدولي حول التعدين والتطبيقات المتقدمة للبيانات. Springer ، Berlin ، Heidelberg ، 2013.

  • الخوارزميات على أساس النماذج الاحتمالية

Newman، Mark EJ، and Elizabeth A. Leicht. "نماذج مختلطة وشبكات التحليل الاستكشافي." وقائع الأكاديمية الوطنية للعلوم 104.23 (2007): 9564-9569.

Ren، Wei، et al. "خوارزمية احتمالية بسيطة للكشف عن بنية المجتمع." المراجعة المادية E 79.3 (2009): 036111.

  • خوارزمية ترميز المعلومات

روزفال ومارتن وكارل تي بيرجستروم. "خرائط المشي العشوائي على الشبكات المعقدة تكشف عن بنية المجتمع" وقائع الأكاديمية الوطنية للعلوم 105.4 (2008): 1118-1123.

Kim، Youngdo، and HawoongJeong. "Map Equation for link community." Physical Review E 84.2 (2011): 026110.

2.4 خوارزمية الاكتشاف الديناميكي للمجتمع

  • خوارزمية تصفية الفصائل

Palla، Gergely، et al. "الكشف عن البنية المجتمعية المتداخلة للشبكات المعقدة الفطرية والمجتمع". arXiv preprint physics / 0506133 (2005).

Kumpula، Jussi M.، et al. "الخوارزمية المتسلسلة للتقسيم السريع." مراجعة البدنية E 78.2 (2008): 026109.

  • خوارزميات التجميع القائمة على التشابه

Shen، Huawei، et al. "اكتشاف الشبكات المتداخلة والهرمية لهيكل المجتمع." فيزيكا أ: الميكانيكا الإحصائية وتطبيقاتها 388.8 (2009): 1706-1712.

Huang، Jianbin، et al. "الانكماش المعتمد على الكثافة للكشف عن بنية المجتمع الهرمية والمتداخلة في الشبكات." فيزيكا أ: الميكانيكا الإحصائية وتطبيقاتها 390.11 (2011): 2160-2171.

  • خوارزمية انتشار التسمية

راغافان ، أوشا نانديني ، ريكا ألبرت ، وسوندار كومارا. "خوارزمية الوقت الخطي القريب لاكتشاف الهياكل المجتمعية في الشبكات واسعة النطاق." المراجعة الفيزيائية E 76.3 (2007): 036106.

جريجوري ، ستيف. "البحث عن مجتمعات متداخلة في الشبكات عن طريق انتشار التسمية". New Journal of Physics 12.10 (2010): 103018.

  • خوارزمية تحسين التوسع المحلي

Lancichinetti و Andrea و Santo Fortunato. "معايير اختبار خوارزميات اكتشاف المجتمع على الرسوم البيانية الموجهة والمرجحة مع المجتمعات المتداخلة." مراجعة فيزيائية E 80.1 (2009): 016118.

Lee، Conrad، et al. "الكشف عن بنية المجتمع المتداخلة للغاية عن طريق التوسع greedyclique." arXiv preprint arXiv: 1002.1827 (2010).

3. تحليل تطور المجتمع الافتراضي

هناك عدد كبير من هياكل المجتمع الافتراضية الصريحة أو الضمنية في الشبكات الاجتماعية عبر الإنترنت. هذه الهياكل المجتمعية الافتراضية ليست دائمة. مع تغير الأحداث ، يتطور هيكل المجتمع أيضًا باستمرار. يعد تحليل التطور الديناميكي لهيكل المجتمع الافتراضي مفيدًا لفهم عملية تطور الشبكة الاجتماعية بأكملها ، لذلك فهي تتمتع بقيمة بحثية مهمة.

3.1 ظهور المجتمعات الافتراضية

إن ظهور المجتمع الافتراضي هو عملية المجتمع الافتراضي من البداية في الشبكة الاجتماعية ، وأهم ما يميزه هو ظاهرة تجميع الشبكات.

  • إغلاق الدورة: يشير ما يسمى بالإغلاق الدوري إلى الهيكل الذي تشكله عقد الشبكة التي تميل إلى إقامة علاقات اتصال مع جيرانها في الشبكة ، وهذه الآلية هي العامل الرئيسي المؤدي إلى تكوين مجتمعات افتراضية. تظهر التجارب أن احتمال حدوث الإغلاق الثلاثي يتناقص بشكل كبير مع زيادة أو نقصان المسافة الجيوديسية بين عقدتين. على العكس من ذلك ، فإن الإغلاق البؤري لا علاقة له بالمسافة الجيوديسية ، ويتم إنشاؤه لأن العقدتين تشتركان في مصلحة مشتركة أو تشاركان في نشاط مشترك.

  • الاتصال المفضل: في العديد من الشبكات الحقيقية ، لا يتم توصيل الحواف المضافة حديثًا بشكل عشوائي ، ولكنها تميل إلى الارتباط بدرجات أكبر.

3.2 تطور المجتمعات الافتراضية

تعتبر عملية تطور المجتمع الافتراضي للشبكات الاجتماعية عبر الإنترنت معقدة للغاية ، وهناك العديد من العوامل المؤثرة. أصبحت كيفية استخراج العوامل الرئيسية في تطور المجتمعات الافتراضية موضوعًا مهمًا وصعبًا في أبحاث الشبكات الاجتماعية. تؤثر العوامل الأساسية الثلاثة للتأثير التراكمي والتنوع الهيكلي والتوازن الهيكلي للمستخدمين الفرديين جميعًا على تطور المجتمعات الافتراضية .

3.3 اكتشاف المجتمعات الافتراضية التطورية

وجد المجتمع الافتراضي للتطور أن هناك الكثير من المواد البحثية ، والنماذج الخمسة التالية عبارة عن نماذج خوارزمية ناضجة نسبيًا ، ويمكن فهم التفاصيل والمراجع المحددة بشكل أكبر.

  • اكتشاف المجتمع الافتراضي التطوري استنادًا إلى المقارنة المباشرة لتشابه اللحظات المجاورة

Hopcroft، John، et al. "تتبع المجتمعات المتطورة في الشبكات الكبيرة المرتبطة" وقائع الأكاديمية الوطنية للعلوم 101.suppl 1 (2004): 5249-5253.

Greene و Derek و Donal Doyle و PadraigCunningham. "تتبع تطور المجتمعات في الشبكات الاجتماعية الديناميكية". التطورات في تحليل الشبكات الاجتماعية والتعدين (ASONAM) ، المؤتمر الدولي لعام 2010 ، IEEE ، 2010.

  • اكتشاف المجتمع الافتراضي التطوري على أساس تحليل الكتلة التطورية

تشاكرابارتي ، ديبايان ، رافي كومار ، وأندرو تومكينز. "المجموعات التطورية." وقائع المؤتمر الدولي الثاني عشر لـ ACM SIGKDD حول اكتشاف المعرفة وتجهيز البيانات. ACM ، 2006.

Lin، Yu-Ru، et al. "Facetnet: إطار عمل لتحليل المجتمعات وتطوراتها الشبكات غير الديناميكية." وقائع المؤتمر الدولي السابع عشر حول شبكة الويب العالمية. ACM ، 2008.

  • اكتشاف المجتمع الافتراضي التطوري على أساس ديناميكيات لابلاس

Lambiotte، Renaud، J-C. Delvenne، and Mauricio Barahona. "ديناميات Laplacian والبنية المعيارية المتعددة في الشبكات". arXiv preprint arXiv: 0812.1770 (2008).

  • اكتشاف المجتمع الافتراضي التطوري بناءً على خوارزمية تصفية الفصائل

بالا ، جيرجيلي ، ألبرت لازلو باراباسي ، وتاماس فيسيك. "قياس تطور المجموعة الاجتماعية" الطبيعة 446.arXiv: 0704.0744 (2007): 664.

  • اكتشاف المجتمع الافتراضي التطوري بناءً على تحليل اتجاه سلوك العقدة

Hopcroft، John، et al. "تتبع المجتمعات المتطورة في الشبكات الكبيرة المرتبطة" وقائع الأكاديمية الوطنية للعلوم 101.suppl 1 (2004): 5249-5253.

اثنين. تشكيل سلوك مجموعة الشبكات الاجتماعية وقواعد التفاعل

1. تحليل سلوك المستخدم

سلوك مستخدم الشبكة الاجتماعية هو رغبة المستخدم في استخدام خدمات الشبكة الاجتماعية بناءً على تقييم شامل لاحتياجاته الخاصة ، وتأثيره الاجتماعي وتكنولوجيا الشبكة الاجتماعية ، بالإضافة إلى مجموع أنشطة الاستخدام المختلفة الناتجة عن ذلك. يعد سلوك المستخدم جزءًا مهمًا من أبحاث الشبكات الاجتماعية عبر الإنترنت. يعتمد البحث الحالي بشكل أساسي على الفكرتين التاليتين: أحدهما هو اعتبار الشبكة الاجتماعية عبر الإنترنت بمثابة تقنية معلومات محددة لدراسة سلوك تبني المستخدمين وسلوك الرفض وولاء المستخدم لتكنولوجيا الشبكات الاجتماعية عبر الإنترنت ؛ والآخر هو اعتبار الشبكة الاجتماعية عبر الإنترنت على أنها تقنية معلومات محددة ، وهي منصة تقدم خدمات وتطبيقات متنوعة ، وتدرس خصائص وقوانين استخدام المستخدمين للخدمات والتطبيقات المختلفة.

1.1 اعتماد المستخدم والولاء

يشير اعتماد مستخدمي الشبكات الاجتماعية عبر الإنترنت إلى رغبة المستخدمين أو سلوكهم في استخدام خدمات الشبكة الاجتماعية عبر الإنترنت بناءً على تقييم شامل لاحتياجاتهم الخاصة وتأثيرهم الاجتماعي وتكنولوجيا الشبكات الاجتماعية عبر الإنترنت.يعتبر اعتماد المستخدمين المتعددين والتجارب أمرًا بالغ الأهمية لانتشارها اللاحق. تم استخدام نظريات مختلفة للكشف عن آلية سلوك التبني لمستخدمي الشبكات الاجتماعية عبر الإنترنت. من بينها ، نموذج قبول التكنولوجيا ونظرية السلوك المخطط هما النظريتان الأكثر استخدامًا من قبل الباحثين.

يشير ولاء مستخدمي الشبكات الاجتماعية عبر الإنترنت إلى العادة التي يمكن للمستخدمين الاستمرار في استخدامها بعد استخدام خدمات الشبكات الاجتماعية. تجعل الضغوط التنافسية الناتجة عن انتشار الخدمات الجديدة عبر الإنترنت من الصعب بشكل متزايد الحفاظ على ولاء المستخدمين لشبكات التواصل الاجتماعي عبر الإنترنت. حتى الآن ، تم استخدام مجموعة متنوعة من النظريات في دراسة ولاء المستخدم في الشبكات الاجتماعية عبر الإنترنت. من بينها ، يفضل العديد من الباحثين نظرية تأكيد التوقع ونظرية تجربة التدفق.

  • نموذج اعتماد المستخدم للشبكة الاجتماعية عبر الإنترنت بناءً على نموذج قبول التكنولوجيا

يعد نموذج قبول التكنولوجيا الذي اقترحه David Fred أحد أكثر النماذج كلاسيكية في مجال أبحاث نظم المعلومات. لمزيد من المعلومات حول النموذج ، يرجى الرجوع إلى:

ديفيس ، فريد د. "الفائدة المتصورة ، سهولة الاستخدام المتصورة ، وقبول المستخدم لتكنولوجيا المعلومات." MIS الفصلية (1989): 319-340.

  • نموذج اعتماد مستخدم الشبكة الاجتماعية عبر الإنترنت بناءً على نظرية السلوك المخطط

تم استخدام نظرية السلوك المخطط التي اقترحها Icek Ajzen على نطاق واسع في دراسة السلوك البشري. للحصول على فهم مفصل للنظرية ، يرجى الرجوع إلى:

آجزين ، آيسك. "من النوايا إلى الأفعال: نظرية السلوك المخطط". التحكم في العمل. سبرينغر برلين هايدلبرغ ، 1985. 11-39.

  • نموذج ولاء المستخدم للشبكة الاجتماعية عبر الإنترنت بناءً على نظرية تأكيد التوقع

نظرية تأكيد التوقع التي اقترحها أوليفر هي النظرية الأساسية لدراسة رضا المستهلك. طرح Anol Bhattacherjee وعلى أساس النظرية جنبًا إلى جنب مع خصائص أنظمة المعلومات نموذج التأكيد المتوقع للاستخدام المستمر لنظام المعلومات (ECM-ISC). لمزيد من المعلومات حول النموذج ، يرجى الرجوع إلى:

Bhattacherjee، Anol. "فهم استمرارية نظم المعلومات: نموذج تأكيد توقع" MIS ربع سنوي (2001): 351-370.

  • نموذج ولاء مستخدم الشبكة الاجتماعية عبر الإنترنت يعتمد على نظرية تجربة التدفق

نظرية تجربة التدفق التي اقترحها Mihaly Csikszentmihalyi et al. هي نظرية مهمة في أبحاث تجربة المستخدم الحالية. للحصول على فهم مفصل للنظرية ، يرجى الرجوع إلى: Csikszentmihalyi ، Mihaly ، ما وراء الملل والقلق ، Jossey-Bass ، 2000.

1.2 سلوك المستخدم الفردي

  • سلوك الاستخدام العام: يمكن للمستخدمين تنفيذ مجموعة متنوعة من الإجراءات على الشبكات الاجتماعية ، مثل التصفح والنقر والمشاركة والإعجاب والإشارة المرجعية والمزيد. للحصول على تصنيف محدد ، يرجى الرجوع إلى: Benevenuto F، Rodrigues T، Cha M، Almeida V. وصف سلوك المستخدم في الشبكات الاجتماعية عبر الإنترنت. New York، New York، USA: ACM؛ 2009: 49-62. doi: 10.1145 / 1644893.1644900.

  • سلوك إنشاء المحتوى: ينشئ المستخدمون محتوى في الشبكات الاجتماعية عن طريق كتابة المدونات والمدونات الصغيرة ونشر التعليقات والسلوكيات الأخرى.يدرس البحث حول سلوك إنشاء المحتوى بشكل أساسي الدافع لإنشاء المحتوى وتفضيل اختيار الموضوع عند إنشاء المحتوى والتعبير اللغوي عند إنشاء المحتوى. حول هذا الموضوع ، يمكن البحث في نماذج LDA من خلال محرك بحث.

  • سلوك استهلاك المحتوى: يلبي المستخدمون احتياجاتهم الاجتماعية من خلال التصفح والمشاركة والتعليق في الشبكات الاجتماعية ، ويمكن تقسيم استهلاك محتوى الشبكة الاجتماعية إلى استهلاك نشط واستهلاك سلبي. الاستهلاك السلبي هو "التصفح" ، وقد أظهرت الدراسات أن ما يصل إلى 92 من السلوكيات في الشبكات الاجتماعية هي سلوكيات تصفح. الاستهلاك النشط هو البحث الاجتماعي ، مثل البحث عن معلومات حول الأصدقاء وطرح الأسئلة على الأصدقاء في الدوائر الاجتماعية.

1.3 سلوك تفاعل مجموعة المستخدم

  • خيارات تفاعل المجموعة: إن البحث عن تفاعل المجموعة يهدف بشكل أساسي إلى تحديد العلاقة بين المستخدمين ، ودراسة قوة العلاقة بين المستخدمين من خلال صياغة مؤشرات قياس مختلفة.

  • اختيار المحتوى للتفاعل الجماعي: في الشبكات الاجتماعية ، لا يمكن فصل اختيار المستخدمين للمحتوى عن علاقاتهم الاجتماعية. على سبيل المثال ، أظهرت الدراسات أن تشابه التعديلات التي أنتجها اثنان من محرري ويكيبيديا قبل التفاعل وبعده يختلف.

  • القاعدة الزمنية للتفاعل الجماعي: يركز البحث حول الخصائص الزمنية للسلوك البشري في الشبكات الاجتماعية عبر الإنترنت بشكل أساسي على تحليل توزيع الفاصل الزمني لوقائع السلوك. وجدت الدراسة أن توزيع الفاصل الزمني لسلوك المستخدم في الشبكات الاجتماعية عبر الإنترنت يختلف عن التوزيع الأسي السلبي التقليدي ، ولكنه يقدم توزيعًا لقانون القوة ، أي له "تأثير طويل الأمد". يمكن تطبيق دراسة النمط الزمني للتفاعل الجماعي على سيناريوهات مثل الإدارة العامة واتخاذ القرار.

2. تحليل مشاعر الشبكة الاجتماعية

مع التطور السريع لتكنولوجيا الإنترنت ، أصبح الإنترنت الطريقة الرئيسية للأشخاص للحصول على المعلومات والتعبير عن الآراء. وفقًا لمحتوى النص ، يمكننا تقسيم النص في الإنترنت إلى نوعين. أحدهما هو وصف المعلومات بموضوعية ، بشكل أساسي للأحداث والمنتجات وما إلى ذلك. بالنسبة للوصف الموضوعي ، فإن الآخر هو معلومات ذاتية ، والتي تنتج بشكل أساسي أوصاف موضوعية للشخصيات والأحداث والمنتجات مع المستخدمين ؛ والآخر هو المعلومات الشخصية ، والتي يتم إنشاؤها بشكل أساسي من معلومات تقييم المستخدمين حول الشخصيات والأحداث والمنتجات. تعبر المعلومات الشخصية عن ألوان الأشخاص العاطفية المختلفة والميول العاطفية ، مثل "الدعم" و "المعارضة" و "الحيادية" وما إلى ذلك.

تحليل المشاعر ، الذي يكافئ التنقيب عن الرأي هنا ، هو عملية تحليل ومعالجة وتلخيص المعلومات الذاتية. نشأ تحليل المشاعر في الأصل في مجال معالجة اللغة الطبيعية ، والذي يدرس ويحكم بشكل أساسي على الاتجاه العاطفي للنصوص من منظور القواعد النحوية والدلالية. مع ظهور الشبكات الاجتماعية وتطورها ، شارك تحليل المشاعر تدريجيًا في العديد من مجالات البحث ، مثل التنقيب عن النصوص ، والتنقيب عن بيانات الويب ، وما إلى ذلك ، وتم توسيعه ليشمل الإدارة والعلوم الاجتماعية.لعب دورًا مهمًا في هذا المجال.

2.1 تقنية تحليل المشاعر النصية

  • تقنية تحليل المشاعر على أساس القواعد الدلالية: نحن نستخرج الصفات والظروف العاطفية في الجملة لتشكيل قاموس عاطفي ، ويمكن أن تمثل هذه الكلمات ميلًا معينًا للمستخدم. تقنية التحليل القائمة على القواعد الدلالية هي حساب المسافة بين كلمة التقييم وكلمات الاتجاه التي تم تمييزها في قاموس المشاعر ، وذلك لتحقيق الغرض من تصنيف المشاعر. الخوارزمية الأكثر كلاسيكية هي خوارزمية SO-PMI.

  • طرق تحليل المشاعر القائمة على التعلم الخاضع للإشراف: الطريقة القائمة على التعلم الخاضع للإشراف هي أولاً تسمية قطبية المشاعر للنص يدويًا ، ثم استخدام هذا كمجموعة تدريب لتصنيف شعور النص الهدف من خلال التعلم الآلي. الطرق الشائعة: بايز ساذجة ، دعم آلات المتجهات.

  • تقنية تحليل المشاعر بناءً على نموذج الموضوع: يوجد نموذجان للموضوع ، نموذج PLSA (التحليل الدلالي الكامن الاحتمالي) ونماذج LDA (تخصيص Dirichlet الكامن) ، وهناك الكثير من المواد التعليمية على الإنترنت للقراء لمعرفة المزيد عنها.

2.2 تقنية تحليل مشاعر الشبكة الاجتماعية

  • تقنيات تحليل المشاعر للنصوص القصيرة: تنشئ الشبكات الاجتماعية قدرًا كبيرًا من النصوص القصيرة ، مثل Weibo والتعليقات الإخبارية ومنشورات المنتدى وما إلى ذلك. تختلف هذه النصوص القصيرة عن التقارير الإخبارية ، قواعدها اللغوية غير منتظمة ومليئة بالكثير من الضجيج ، لذا فإن تحليل النصوص القصيرة هو مهم جدا.

  • تقنية تحليل المشاعر القائمة على ذكاء السرب: ستتأثر الآراء التي يعبر عنها المستخدمون في الشبكات الاجتماعية بعلاقاتهم الاجتماعية ، وسيتم نشر العواطف على طول العلاقات الاجتماعية ، لذلك يمكن تحسين دقة تحليل المشاعر من خلال دراسة العلاقات بين المستخدمين الاجتماعيين.

  • تقنيات التنقيب عن الآراء غير المرغوب فيها في الشبكات الاجتماعية: يمكن لآراء البريد العشوائي في الشبكات الاجتماعية ، بما في ذلك المعلومات مثل البحرية والإعلانات ، التمييز بشكل فعال بين المعلومات الصحيحة والمعلومات غير المرغوب فيها عن طريق التنقيب في آراء البريد العشوائي ، وبالتالي تحسين تجربة استخدام الشبكات الاجتماعية.

3. تحليل التأثير الفردي

يعد اكتشاف الأفراد المؤثرين في الشبكات الاجتماعية فرعًا مهمًا جدًا من الأبحاث في الشبكات الاجتماعية ، وله قيم تطبيقية مهمة. على سبيل المثال ، تسويق Weibo ، وكشف الشائعات ، وإدارة الرأي العام ، وما إلى ذلك.

1.1 حساب التأثير الفردي على أساس بنية الشبكة

بناءً على خصائص هيكل الرسم البياني للشبكات الاجتماعية ، هناك العديد من المؤشرات المستخدمة لقياس مركزية العقد في الشبكة ، أي تأثير العقد. بالإضافة إلى الثلاثة التالية ، هناك تدابير أخرى مثل مركزية PageRank.

  • مركزية الدرجة: تشير مركزية الدرجة إلى عدد العقد المتصلة مباشرة بتلك العقدة.

  • مركزية القرب: يشير إلى مجموع أقصر المسافات بين العقدة وجميع العقد الأخرى في الشبكة.

  • بينية (بين مركزية): يتم استخدام البينية لقياس تأثير الوساطة لعقدة في شبكة اجتماعية. عدد جميع أقصر المسارات بين عقدتين في الشبكة مقسومًا على عدد المسارات التي تمر عبر العقدة A في هذه المسارات هو المسافة بين العقدة A ، والمعروفة أيضًا باسم مركزية البينية.

1.2 الحساب القائم على السلوك للتأثير الفردي

يحدد سلوك المستخدمين في الشبكات الاجتماعية تأثير المستخدمين. بأخذ Weibo كمثال ، فإن السلوكيات الرئيسية للمستخدمين هي التعليقات ، وإعادة النشر ، والردود ، والإعجابات ، والنسخ ، والقراءة ، وما إلى ذلك بناءً على هذه الخصائص السلوكية ، تعد المخططات المختلفة لعلاقات الشبكة يمكن العثور على الأفراد المؤثرين في الشبكة من خلال طرق مثل المشي العشوائي.

1.3 حساب التأثير الفردي على أساس الموضوع

في الشبكات الاجتماعية ، يكون للمستخدمين تأثيرات مختلفة في مواضيع مختلفة ، ويمكن حساب تأثير المستخدم على كل موضوع وفقًا لشبكة المستخدم التالية وتشابه اهتمامات المستخدم.

4. تحليل تجميع المجموعة وآلية التأثير

يقدم هذا القسم بشكل أساسي مفهوم استقطاب المجموعة. يعني الاستقطاب الجماعي أنه في سياق صنع القرار الجماعي ، غالبًا ما تتأثر الآراء أو القرارات الفردية بالمناقشات المتبادلة بين المجموعات ، مما يؤدي إلى نتيجة على مستوى المجموعة. غالبًا ما يتجلى الاستقطاب الجماعي في حقيقة أن الأفراد داخل المجموعة يتفقون مع آراء الأغلبية دون انعكاس شخصي. الاستقطاب الجماعي هو مفهوم في علم النفس الاجتماعي ، والحالة النفسية للجماهير المذكورة في كتاب علم الاجتماع الشهير "الحشد" هي تجسيد للاستقطاب الجماعي.

يمكن تلخيص شروط استقطاب المجموعة في أربع نقاط: أولاً ، يجب أن يكون هناك حدث مثير ؛ ثانيًا ، يمكن للأفراد في المجموعة رؤية الاختيارات التي قام بها أسلافهم ؛ ثالثًا ، معلومات المجموعة غير متوفرة ؛ رابعًا ، المجموعة لديها تجانس معين .

في تحليل الشبكات الاجتماعية عبر الإنترنت ، يدرس الناس ظاهرة استقطاب المجموعة في الشبكات الاجتماعية عبر الإنترنت من خلال بناء نماذج تحليلية ومحاكاة. نماذج التحليل الرئيسية هي نموذج سلوك القطيع القائم على نظرية اللعبة ونظرية الوكيل الرئيسي ، ونموذج تناسق المجموعة القائم على شلال المعلومات ، وصنع القرار الجماعي ومحاكاة السلوك على أساس الأوتوماتا الخلوية.

استقطاب الرأي السياسي في تويتر

ثلاثة. نشر المعلومات وآلية تطور الشبكة الاجتماعية

1. استرجاع معلومات الشبكة الاجتماعية عبر الإنترنت

استرجاع المعلومات (استرداد المعلومات) هو عملية الحصول على المعلومات من البيانات غير المهيكلة على نطاق واسع ، على سبيل المثال محرك البحث هو تطبيق نموذجي لتقنية استرجاع المعلومات. تتميز بنية بيانات الشبكة الاجتماعية عبر الإنترنت بخصائصها. وبأخذ "الموضوع" (# اسم الموضوع #) من Weibo كمثال ، لا يتم تضمين هذا النوع الجديد من أسلوب تنظيم المعلومات في البحث التقليدي لاسترجاع المعلومات ، وبالتالي فإن استرداد الشبكة الاجتماعية تصبح المعلومات موضوع بحث.

1.1 بحث محتوى الشبكة الاجتماعية

يشير البحث في المحتوى إلى عملية إرجاع المعلومات ذات الصلة من مجموعة كبيرة من المعلومات التي يتم توفيرها للاستعلام. على سبيل المثال ، يمكن أن يؤدي البحث عن اسم حدث ساخن ذي صلة على Weibo إلى إرجاع Weibo حول الحدث الساخن. البحث في المحتوى هو أكثر أشكال استرجاع المعلومات كلاسيكية. تتضمن نماذج استرجاع المعلومات الكلاسيكية نموذج فضاء متجه (VSM) ونموذج احتمالية ومعادلة استرجاع BM25 ونموذج استرجاع يعتمد على النمذجة الإحصائية ونموذج احتمالية الاستعلام ونموذج الاسترجاع القائم على نمذجة اللغة الإحصائية وما إلى ذلك.

هناك طريقتان رئيسيتان لنمذجة استرجاع محتوى Weibo:

  • طريقة الوقت السابق: الوقت السابق هو طريقة استرداد تكون فيها المستندات الموجودة في مجموعة المستندات لها أهمية مختلفة ، ويتم تحديد صيغ حسابية مختلفة مع الأخذ في الاعتبار خلفية المجموعة ، ومن ثم يتم استخدام نتائج الحساب في نموذج الاسترجاع للحصول على تأثير استرجاع أفضل. في الوقت الحالي ، يمكن تقسيم العمل البحثي الذي يأخذ في الاعتبار معلومات الوقت لحساب المستند مسبقًا إلى نوعين: الأول هو تحديد العلاقة المتغيرة بمرور الوقت للمستند ؛ والآخر هو تعديل طريقة PageRank ، والتي تضيف علاقة الوقت . لمزيد من التفاصيل ، يرجى الرجوع إلى:

    Li، Xiaoyan، and W. Bruce Croft. "Time-Based Language Models." وقائع المؤتمر الدولي الثاني عشر لإدارة المعلومات والمعرفة ACM 2003.

    Yu، Philip S.، Xin Li، and Bing Liu. "حول البعد الزمني للبحث" وقائع المؤتمر الدولي الثالث عشر لشبكة الويب العالمية حول أوراق وملصقات المسار البديل ACM ، 2004.

  • طريقة الجمع بين ميزات متعددة: تعمل طريقة الدمج متعددة الميزات على استرداد محتوى المدونات الصغيرة من خلال الجمع بين ميزات المدونات الصغيرة المتعددة. خصائص Weibo المذكورة في المراجع التالية هي: عدد Weibo ، عدد المتابعين ، عدد المتابعين ، طول Weibo ، وما إذا كان Weibo يحتوي على روابط خارجية. لمزيد من التفاصيل ، يرجى الرجوع إلى:

    Li و Nagmoti و Rinkesh و Ankur Teredesai و Martine De Cock. "مقاربات الترتيب للبحث في المدونات الصغيرة". ذكاء الويب وتكنولوجيا الوكيل الذكي (WI-IAT) ، المؤتمر الدولي IEEE / WIC / ACM لعام 2010 في المجلد 1. IEEE، 2010.

1.2 تصنيف محتوى الشبكة الاجتماعية

يسمى التصنيف الموجه للنص تصنيف النص. يتكون التصنيف من مرحلتين: التدريب والاختبار ، وببساطة ، فإن التدريب هو عملية تعلم قواعد التصنيف أو الانتظام بناءً على مجموعة الفئات المصنفة. والاختبار هو عملية تطبيق مصنف مدرب على نص جديد. سواء كان ذلك تدريبًا أو اختبارًا ، يجب تمثيل كائن التصنيف بالميزات ، ثم يتم استخدام خوارزمية التصنيف للتعلم أو التصنيف. يمكن للقراء الرجوع إلى المراجع ذات الصلة لتصنيف موضوعات المحتوى في الشبكات الاجتماعية التالية.

Liu، Zitao، et al. "اختيار ميزة النص القصير لتعدين المدونات الصغيرة." الذكاء الحسابي وهندسة البرمجيات (CiSE) ، المؤتمر الدولي لعام 2010 في IEEE ، 2010.

Yuan و Quan و Gao Cong و Nadia Magnenat Thalmann. "تعزيز الحواف الساذجة باستخدام طرق تنعيم مختلفة لتصنيف النص القصير." وقائع المؤتمر الدولي الحادي والعشرين على شبكة الويب العالمية. ACM ، 2012.

Ling، Xiao، et al. "هل يمكن تصنيف صفحات الويب الصينية بمصدر بيانات باللغة الإنجليزية؟" وقائع المؤتمر الدولي السابع عشر حول شبكة الويب العالمية. ACM ، 2008.

Zhang، Dan، et al. "نقل التعلم الدلالي الكامن: تعدين المدونات الصغيرة مع إشراف أقل." AAAI. 2011.

1.3 توصيات الشبكة الاجتماعية

يسبق ظهور أنظمة التوصية الشبكات الاجتماعية وكان مزدهرًا منذ أن استخدمتها أمازون للتوصية بالمنتجات. التوصيات على الشبكات الاجتماعية ، نوصي غالبًا بالأصدقاء ، وهي توصية صريحة. التوصيات المستندة إلى العلاقات الاجتماعية والسلوكيات الاجتماعية هي توصيات ضمنية ، مثل التوصية بالإعلانات والمنتجات لك بناءً على محتوى Weibo الخاص بك أو سلوك أصدقائك. فيما يلي بعض الطرق الأساسية الموصى بها:

  • توصية التصفية التعاونية: يقوم التصفية التعاونية التقليدية ببناء مصفوفة بناءً على معلومات المستخدم والعنصر.المبدأ الأساسي هو أن المستخدمين المتشابهين لديهم خيارات متشابهة ، على سبيل المثال ، كل من a و b مثل m ، حيث يحب a أيضًا n ، ثم b قد يعجب m أيضًا. في توصية التصفية التعاونية الاجتماعية ، يمكننا استخدام العلاقة الاجتماعية بين المستخدمين للتعويض عن المحتوى المفقود في مصفوفة التصفية التعاونية ، بحيث تكون نتائج التصفية التعاونية أكثر دقة.

  • التوصيات المستندة إلى النموذج:

  • نموذج الجار:

Ma، Hao، et al. "Sorec: توصية اجتماعية باستخدام عامل المصفوفة الاحتمالية." وقائع المؤتمر السابع عشر لـ ACM حول إدارة المعلومات والمعرفة. ACM ، 2008.

  • نموذج عامل المصفوفة:

Funk ، Simon. "تحديث Netflix: جرب هذا في المنزل." (2006).

  • قم بتضمين معلومات الشبكة الاجتماعية:

جمالي ، محسن ، ومارتن إستر. "أسلوب عامل المصفوفة مع نشر الثقة للتوصية في الشبكات الاجتماعية." وقائع مؤتمر ACM الرابع حول أنظمة التوصية. ACM ، 2010.

2. قوانين نشر معلومات الشبكات الاجتماعية

نشر المعلومات هو نشاط الأشخاص من خلال الرموز والإشارات ونقل واستقبال المعلومات والتغذية الراجعة لها. يشير نشر معلومات الشبكة الاجتماعية إلى عملية نشر المعلومات من خلال الشبكات الاجتماعية. ستساعدنا دراسة قوانين نشر المعلومات في الشبكات الاجتماعية على تعميق فهمنا للأنظمة الاجتماعية وفهم الظواهر الاجتماعية. إنه مفيد أيضًا لاكتشاف النمط وتحديد العقدة عالية التأثير والتوصية الشخصية. يقدم ما يلي بشكل أساسي العديد من نماذج نشر معلومات الشبكات الاجتماعية.

2.1 نموذج الانتشار القائم على بنية الشبكة

  • نموذج العتبة الخطية:

مارك جرانوفيتر "نماذج عتبة السلوك الجماعي" المجلة الأمريكية لعلم الاجتماع 83.6 (1978): 1420-1443.

  • تتالي مستقل:

Goldenberg و Jacob و Barak Libai و Eitan Muller. "الحديث عن الشبكة: أنظمة معقدة تنظر إلى العملية الأساسية للكلام الشفهي." رسائل التسويق 12.3 (2001): 211-223.

2.2 نموذج الانتشار القائم على حالة المجموعة

نموذج الأمراض المعدية (SI ، SIS ، SIR) ، نموذج الأمراض المعدية هو نموذج كلاسيكي لنشر المعلومات ، وهناك مواد مرجعية غنية على الإنترنت.

  • نموذج التأثير الخطي:

Yang و Jaewon و Jure Leskovec. "نشر المعلومات في الشبكات الضمنية". تعدين البيانات (ICDM) ، 2010 المؤتمر الدولي العاشر لـ IEEE. IEEE ، 2010.

2.3 نموذج الانتشار القائم على خصائص المعلومات

تحمل المعلومات الموجودة في الشبكات الاجتماعية عبر الإنترنت جميع سجلات أنشطة المستخدمين عبر الإنترنت ، وتلعب دورًا مهمًا لا غنى عنه في تحليل نشر المعلومات. المعلومات نفسها لها أيضًا بعض الخصائص ، مثل حسن التوقيت ، وتنوع الموضوع ، والتحفيز متعدد المصادر ، والتعاون في مجال المعلومات ، والمنافسة ، وما إلى ذلك. بناءً على هذه الخصائص ، يمكن بناء نماذج مختلفة.

Myers و Seth A. و Chenguang Zhu و Jure Leskovec. "نشر المعلومات والتأثير الخارجي في الشبكات". وقائع المؤتمر الدولي الثامن عشر لـ ACM SIGKDD حول اكتشاف المعرفة واستخراج البيانات. ACM ، 2012.

Beutel، Alex، et al. "تفاعل الفيروسات في الشبكات: هل يمكن لكليهما البقاء على قيد الحياة؟" وقائع المؤتمر الدولي الثامن عشر لـ ACM SIGKDD حول اكتشاف المعرفة واستخراج البيانات. ACM ، 2012.

بالإضافة إلى ذلك ، يشمل البحث حول قوانين نشر معلومات الشبكات الاجتماعية أيضًا التنبؤ بالشعبية وإمكانية تتبع المعلومات. يمكن للقراء المهتمين التحقق من ذلك بأنفسهم.

3. اكتشاف الموضوع وتطوره

في معظم الدراسات حول اكتشاف الموضوع وتطوره ، يشير الموضوع إلى حدث أو نشاط يلفت الانتباه ، وجميع الأحداث والأنشطة ذات الصلة. من بينها ، يشير حدث أو نشاط إلى شيء يحدث في وقت ومكان محددين. تختلف البيانات الموجودة في مجموعة الشبكات الاجتماعية تمامًا عن البيانات الموجودة في مجموعة اكتشاف الموضوعات التقليدية ، لذلك يجب علينا استخدام طرق جديدة أو تحسين الأساليب التقليدية للتكيف مع خصائص بيانات الشبكة الاجتماعية.

تتميز بيانات الشبكات الاجتماعية العامة مثل Twitter بالخصائص التالية: مقياس بيانات كبير ، ومحتوى قصير ، وكثير من الضجيج ، وميزات بيانات غنية. تم وصف العديد من نماذج الاكتشاف والتطور الرئيسية أدناه.

3.1 اكتشاف الموضوع بناءً على نموذج الموضوع

  • نموذج اكتشاف الموضوع الأكثر تمثيلا - LDA

Blei ، David M. ، Andrew Y.Ng ، and Michael I. Jordan. "Latent dirichlet Specialty." Journal of Machine Learning Research 3. Jan (2003): 993-1022.

3.2 اكتشاف الموضوع بناءً على نموذج فضاء متجه

Salton، Gerard، Anita Wong، and Chung-Shu Yang. "نموذج فضاء متجه للفهرسة التلقائية." اتصالات ACM 18.11 (1975): 613-620.

بيكر ، هيلا ، مور نعمان ، ولويس جرافانو. "ما وراء الموضوعات الشائعة: تعريف الأحداث في العالم الحقيقي على Twitter." ICWSM 11.2011 (2011): 438-441.

3.3 اكتشاف الموضوع بناءً على الرسم البياني لعلاقة العنصر المعجمي

التواجد المشترك للمصطلح هو أحد التطبيقات الناجحة لتقنية معالجة اللغة الطبيعية في استرجاع المعلومات. فكرتها الأساسية هي أن تكرار التكرار بين المصطلحات يعكس الارتباط الدلالي للمصطلحات إلى حد ما. يستخدم معظم المبتدئين مصطلح التواجد المشترك لحساب تشابه المستندات ، ثم يستخدم العلماء هذه الطريقة لإكمال استخراج كلمة الموضوع واستخراج جملة الموضوع ومهام إنشاء الملخص.

سيادي ، حسن ، ماثيو هيرست ، وأليكسي مايكوف. "اكتشاف الأحداث وتتبعها في التدفقات الاجتماعية". Icwsm. 2009.

3.4 تطور الموضوع بناءً على نموذج الموضوع

Yin، Zhijun، et al. "LPTA: نموذج احتمالي لتحليل الموضوع الدوري الكامن." تعدين البيانات (ICDM) ، مؤتمر IEEE الحادي عشر الدولي لعام 2011 ، IEEE ، 2011.

Wang و Xiaolong و Chengxiang Zhai و Dan Roth. "فهم تطور موضوعات البحث: نموذج توليدي احتمالي للاستشهادات". وقائع المؤتمر الدولي التاسع عشر لـ ACM SIGKDD حول اكتشاف المعرفة واستخراج البيانات. ACM ، 2013.

3.5 تطور الموضوع بناءً على ارتباط الشرائح الزمنية المتجاورة

Lin، Cindy Xide، et al. "الاستدلال المشترك لنشر الموضوع وتطوره في المجتمعات الاجتماعية." تعدين البيانات (ICDM) ، 2011 المؤتمر الدولي الحادي عشر لـ IEEE في. IEEE ، 2011.

Saha و Ankan و Vikas Sindhwani. "تعلم الموضوعات المتطورة والناشئة في وسائل التواصل الاجتماعي: نهج nmf الديناميكي مع التنظيم الزمني." وقائع المؤتمر الدولي الخامس لـ ACM حول البحث على الويب والتنقيب في البيانات. ACM ، 2012.

4. تعظيم التأثير

يتمثل تعظيم التأثير في اختيار مستخدمي النشر الأولي للمعلومات في الشبكة الاجتماعية ، بحيث يمكن تعظيم نطاق نشر المعلومات ، أي يتم تعظيم التأثير. الغرض من خوارزمية تعظيم التأثير هو إيجاد عدد معين من المستخدمين كعقد أولية لانتشار التأثير. تعتمد نمذجة مشكلة تعظيم التأثير على نموذج نشر معلومات الشبكة الاجتماعية. من بين النماذج الأكثر كلاسيكية العتبة الخطية والنماذج المتتالية المستقلة.

ثبت أن خوارزمية تعظيم التأثير هي مشكلة NP-hard ، ويتم تقديم خوارزميتين نموذجيتين لتعظيم التأثير أدناه بشكل أساسي.

4.1 الخوارزمية الجشعة

تبدأ الخوارزمية الجشعة من عقدة واحدة ، وتحسب الفائدة الهامشية المقدمة لكل عقدة عن طريق اختيار عقدة جديدة كعقدة أولية ، وتختار النقطة التي يمكن أن تسبب أكبر فائدة هامشية تضاف إلى مجموعة العقدة الأولية. عيب الخوارزمية الجشعة هو أن تكلفة الوقت الحسابي كبيرة ، لكن الدقة الحسابية عالية.

Kempe و David و Jon Kleinberg و va Tardos. "تعظيم انتشار التأثير من خلال شبكة اجتماعية." وقائع المؤتمر الدولي التاسع لـ ACM SIGKDD حول اكتشاف المعرفة والتنقيب في البيانات. ACM ، 2003.

Chen و Wei و Yajun Wang و Siyu Yang. "تعظيم التأثير الفعال في الشبكات الاجتماعية." وقائع المؤتمر الدولي الخامس عشر لـ ACM SIGKDD حول اكتشاف المعرفة واستخراج البيانات. ACM ، 2009.

4.2 الخوارزميات الإرشادية

تختلف عن الخوارزمية الجشعة التي تحدد أي نقطة كعقدة أولية لبدء الحساب ، تحدد الخوارزمية الإرشادية أولاً عددًا معينًا من العقد الأولية من خلال إستراتيجية معينة ، ثم تحسب انتشار تأثيرها. الميزة هي السرعة العالية ، والعيب هو الدقة المنخفضة.

Chen و Wei و Yajun Wang و Siyu Yang. "تعظيم التأثير الفعال في الشبكات الاجتماعية." وقائع المؤتمر الدولي الخامس عشر لـ ACM SIGKDD حول اكتشاف المعرفة واستخراج البيانات. ACM ، 2009.

Chen و Wei و Yifei Yuan و Li Zhang. "تعظيم التأثير القابل للتطوير في الشبكات الاجتماعية وفقًا لنموذج العتبة الخطية". تعدين البيانات (ICDM) ، المؤتمر الدولي العاشر لـ IEEE 2010 بتاريخ. IEEE ، 2010.

تصف هذه المقالة بشكل أساسي الفصول الثلاثة الأولى من الكتالوج ومحتويات الفصول الأربعة الأخيرة. بالنسبة للمحتوى (تطبيق تحليل الشبكة الاجتماعية ، والبحث الحدودي على الشبكات الاجتماعية ، والمواد التعليمية والمواد المرجعية) ، يرجى الرجوع إلى الجزء التالي (مقالتان في 26 سبتمبر 2017).

لمزيد من الأخبار المثيرة ، يرجى الانتباه إلى حساب WeChat الرسمي لمعهد Tsinghua-Qingdao لعلوم البيانات "THU Data School"

مائة عام من انتصار الحرب | 14 عاملا وان لمجرفة بدلا من مدفع للصينيين للفوز بمركز المنتصرين

15 ثانية المضاد للضرب لا معنى لها تشيلسي! 5700 على غرار وان السيد المشي مرة أخرى لمطاردة، بل وأكثر مما كان الحكام

أحب التعرض! بعد سبع سنوات من الزواج، وعلى الفور نقع نجم برشلونة لعارضة مثير

حصريا | قراءة الزاحف رقة على شبكة الإنترنت

الإيطالي العرقي جمعية المصورين الصينية 2018 دولوميتي الخريف مزاد ختام ناجح

ضرب ترامب تقنية صفقة الضرائب TSMC، ستقوم إنتل مساعدة تأخذ مسبك قوي؟

لى وى، نائب رئيس تينسنت سحابة: كيفية التعامل مع الانفجار البيانات والحفاظ على أمن المعلومات؟

"مزدوجة 11" مطار تيانخه تسعين في المئة من تسليم جزء من الوقت من الطائرات، وأكثر من 500 طلعة

+7 تقاليد الفريق السابق خمسة أهداف! لعب بالوتيلي مهلا، نظرة المدرب السابق لإحراج على هامش

حصريا | تكنولوجيا AI وتطبيقات البيانات الكبيرة في التكنولوجيا المالية

2 H-3 الحقل هو موجة الرقم القياسي العالمي! قلل حارس مرمى مانشستر يونايتد إلى لوحة خلفية، وأشار بشكل حاد الحقيقة أسطورة

واسعة Yuanqing سيتشوان 36 قرى وبلدات لتحقيق التغطية الكاملة لمرافق النار