استدعاء آلهة الذكاء الاصطناعي لمكافحة الفيروسات! Kaggle تطلق مسابقة تعدين نص مجموعة بيانات CORD-19

[مقدمة في New Zhiyuan] كيف يمكن تقليل الذكاء الاصطناعي ضد فيروسات التاجية؟ في الآونة الأخيرة ، أصدرت مجموعات بحثية كبرى مثل معهد Allen AI مجموعة بيانات بحثية مفتوحة COVID-19 ، تغطي جميع مطبوعات أبحاث فيروسات التاجية الحالية. أطلقت Kaggle على الفور مجموعة بيانات CORD-19 المنافسة في استخراج النصوص وأثارت 10 مشاكل رئيسية ، استدعاء الباحثين في منظمة العفو الدولية لتطوير أدوات استخراج البيانات النصية لمساعدة المجتمع الطبي.

ووفقًا لأحدث الإحصاءات الصادرة عن منظمة الصحة العالمية ، حتى الآن ، يبلغ العدد العالمي للإصابات بفيروس التاجي 168019 على الأقل ، وبلغ عدد الوفيات 6610. قال ترامب في مؤتمر صحفي يوم الاثنين إن عدد حالات الإصابة بفيروس COVID-19 والوفيات في الولايات المتحدة مستمر في الارتفاع ، ويمكن السيطرة على فيروس التاجي الجديد في وقت مبكر في يوليو وأغسطس.

كيفية محاربة الفيروسات التاجية بدون مساعدة الذكاء الاصطناعي؟ اقترح مجتمع الذكاء الاصطناعي مؤخرًا تدابير جديدة للتعامل مع فيروس التاجية.

يصدر معهد Allen AI وآخرون مجموعة بيانات البحث COVID-19 المفتوحة

من أجل التعامل مع الالتهاب الرئوي الجديد الناجم عن COVID-19 ، قرر فريق البحث الذي يمثله معهد Allen AI إطلاق خطوة كبيرة لجمع الجميع للقضاء على ماضي وحاضر الفيروس التاجي.

في الآونة الأخيرة ، أصدرت مجموعات بحثية بارزة مثل معهد Allen AI ، و Microsoft Research ، والمكتبة الطبية الوطنية للمعاهد الوطنية للصحة (NIH) ، ومكتب البيت الأبيض للعلوم والتكنولوجيا (OSTP) مجموعة بيانات COVID-19 المفتوحة للأبحاث (COVID-19 Open مجموعة بيانات البحث ، CORD-19) ، توفر مجموعة البيانات هذه 29000 مقال أكاديمي يتعلق بأسرة فيروسات التاجية بالكامل مجانًا ، بما في ذلك أكثر من 13000 من النصوص الكاملة. أحدث الأبحاث المنشورة في المنشورات التي تمت مراجعتها من قبل الأقران والمحتوى الجديد في الأرشيفات مثل bioRxiv و medRxiv وما إلى ذلك. الأدبيات الحالية حتى 13 مارس.

بطبيعة الحال ، لم يتم نشر مجموعة البيانات للنشر ، ولكن للتعدين. بعد كل شيء ، في مواجهة الكم الهائل من البيانات والبحث السريع ، فإن دور الأدب محدود.

قال كبير علماء مايكروسوفت إريك هورفيتز: "إن هدفنا في إنشاء مجموعة البيانات المفتوحة هذه هو إلهام مجتمع الذكاء الاصطناعي لإنشاء أدوات يمكنها مساعدة العلماء على إتقان آلاف المقالات حتى يتمكن العلم والتكنولوجيا من تطوير الاستجابات طريقة COVID-19 ".

نرى:

https://pages.semanticscholar.org/coronavirus-research

Kaggle تطلق مسابقة تعدين نص مجموعة بيانات CORD-19

بعد إصدار مجموعة البيانات البحثية المفتوحة COVID-19 ، أطلقت Kaggle على الفور مسابقة تعدين نص مجموعة البيانات CORD-19 لاستدعاء إله الذكاء الاصطناعي!

"ندعو خبراء الذكاء الاصطناعي في جميع أنحاء العالم إلى تطوير أدوات استخراج النصوص والبيانات لمساعدة المجتمع الطبي في العثور على إجابات لبعض الأسئلة العلمية ذات الأولوية العالية. تمثل مجموعة بيانات CORD-19 أكثر عمليات استخراج البيانات المتاحة حتى الآن. تتيح المجموعة الواسعة من مطبوعات الفيروسات التاجية المقروءة آليًا لمجتمع أبحاث الذكاء الاصطناعي العالمي الفرصة لتطبيق طرق استخراج النصوص والبيانات للعثور على إجابات للأسئلة وتكوين رؤى بين أجزاء مختلفة من المحتوى لدعم استجابة CORD-19 المستمرة حول العالم العمل. الحاجة ملحة إلى أدوات استخراج البيانات ، لأن العدد المتزايد لأبحاث فيروسات التاجية جعل من الصعب على المجتمع الطبي التعامل معه. "

10 أسئلة رئيسية للاستفادة منها

من أجل مساعدة إله الذكاء الاصطناعي في تحديد اتجاه استخراج البيانات ، أعلن Kaggle عن 10 قضايا رئيسية في المرحلة الحالية على الموقع الرسمي:

  • ماذا تعرف عن انتقال الفيروس التاجي ، والكمون والاستقرار البيئي؟
  • كم تعرف عن عوامل الخطر في كوفيد 19؟
  • كم تعرف عن علم الوراثة وأصل وتطور الفيروس التاجي؟
  • تساعد المهام النموذجية التي تتطلب تقديم عينات على فهم كيفية تأثير الموقع الجغرافي على انتشار الفيروس
  • هل تم نشر المحتوى المتعلق بالرعاية الصحية حتى الآن؟
  • ما الذي يتم نشره حاليًا لاعتبارات العلوم الأخلاقية والاجتماعية؟
  • ما الذي تم نشره حول تبادل المعلومات والتعاون بين المصالح؟
  • ما هو معروف حاليا عن التدخلات غير الدوائية؟
  • كم تعرف عن اللقاحات والعلاجات؟
  • كم تعرف عن تشخيص الأمراض ومراقبتها؟
  • تأتي القضايا الرئيسية للقضايا العشر أعلاه من مواضيع البحث المتعلقة بالأمراض المعدية الناشئة ولجنة التهديدات الصحية للقرن الحادي والعشرين التي أنشأتها الأكاديمية الوطنية للعلوم والهندسة والعلوم الطبية ومخطط منظمة الصحة العالمية للبحث والتطوير الخاص بـ COVID-19.

    علاوة

    ستقدم Kaggle جائزة قدرها 1000 دولار للفائزين الذين يستوفون معايير التقييم في كل مهمة ، ويمكن توزيع المكافأة نقدًا أو التبرع بها إلى COVID-19 لأبحاث الإغاثة كتبرع خيري.

    سوف يساعد البرمجة اللغوية العصبية البشر على التغلب على المزيد من المشاكل الطبية

    قال خبراء التعلم العضوي أن توليد النص القائم على Transformer وتطوير البرمجة اللغوية العصبية هو أحد أهم التطورات في الذكاء الاصطناعي في عام 2019 ، وسيكون هناك تقدم أكبر في عام 2020.

    قال Oren Etzioni ، مدير معهد Allen AI Institute ، إن الذكاء الاصطناعي يمكن أن يسرع التقدم ويساعد في العثور على إجابات للأسئلة ، لكنه أكد أن الذكاء الاصطناعي سيعزز القدرات البشرية ، والذكاء الاصطناعي لا يمكنه حل المشاكل بمفرده.

    في الوقت الحاضر ، هناك العديد من المنظمات التي تستخدم البرمجة اللغوية العصبية لمكافحة الفيروسات التاجية:

    • يمكن لأداة البرمجة اللغوية العصبية التي طورتها كلية الطب بجامعة هارفارد مراجعة سجلات المرضى ووسائل التواصل الاجتماعي وبيانات الصحة العامة ؛
    • استخدمت شركة تدعى BlueDot البرمجة اللغوية العصبية لاسترداد الأخبار وبيانات الصحة العامة قبل أن تحذر منظمة الصحة العالمية من تفشي الفيروس التاجي ؛
    • تصدّر نموذج NLP StructBERT الذي أصدرته أكاديمية علي دارما أعلى قائمة التصنيف القياسي لتقييم فهم اللغة العامة (GLUE) ، كما استخدم علي تطبيق NLP هذا في مركز السيطرة على الأمراض لتحليل النص والتحري الوبائي.

    كل هذه ، الجهود المشتركة للمجتمع العلمي والتكنولوجي العالمي ، دعونا نعتقد أنه يمكننا التغلب على الصعوبات والفيروس التاجي.

    الموقع الرسمي للمسابقة:

    https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

    أبل قد أعلنت للتو الحية WWDC تغير على الانترنت، وهي المرة الأولى دعم أبل دفع Alipay

    أطلق ترامب 50 مليار دولار استجابة للتاج الجديد ، ويشارك موظفو Google البالغ عددهم 1700 موظف في الكشف عن الفيروسات

    معالم النموذج قد تصل مليارات الدولارات؟ MIT شقيق كمية صغيرة من بيانات كاملة ذات جودة عالية النص إلى كلام!

    ترامب تقرير التفتيش سلبية، ما يقرب من مليون شخص تلقوا في جميع أنحاء العالم الجديد الكشف عن الفيروسات التاج!

    الثقيلة | بيركلي "التعلم غير خاضعة للرقابة عميقة" دورات جديدة في الربيع 2020 الضربات!

    ملحمة Arm الرائعة

    فقط، أصدرت جوجل 24 نماذج من بيرت الصغير، قبل التدريب مباشرة من خلال فقدان الامتيازات

    عمل AutoML-Zero المنشئ الجديد لـ Google AutoML: إنشاء خوارزميات تعلم الآلة من البداية

    في اليوم التالي الأكبر في تاريخ ICLR 2020 إلغاء الخط، بحيث فقدت أفريقيا واندلاع AI الأول أعلى المنزل

    السحر قفزة حرق 2.6 مليار دولار لعبودية؟ وقال الفيسبوك أنها لم ترغب في الوصول إلى القرص مان

    كيف بعيدا عن الإجراء القرد العملاق مليون سنويا راتب AI خوارزمية مهندس؟

    معظم التاريخ الكامل من "خريطة المعرفة" ورقة المراجعة عام 2020، 18 من الكتاب، 130 قوات الدفاع الشعبي