اعتقل AI أوراق وهمية: أكثر من 40 ورقة على تعلم آلة للكشف عن الغش، وفقدان السنوية من 10 مليار دولار

المحرر: كريغ، ثلاثة الحجر

التشطيب: ثلاثة الحجر

[استعراض فاز جي الجديدة في الصحف في مجال الطب الحيوي، وقد AI البحث خارج الصورة المتكررة للغاية من 9، 0.59 من الورقة هو أن هناك اشتباه في الاحتيال. بسبب أوراق طبية كاذبة انسحاب صورة، لتضيع سنويا قد تكون على مقربة من 1000000000 $ في تكاليف التطوير.

"مكافحة أوراق الغش، والبحوث وصيانة العدالة". هذا ليس مجرد شعار الصراخ الكلمات.

في يونيو، وحلل جامعة ستانفورد الميكروبيولوجي 2009--2016 نشرت في البيولوجيا الجزيئية والخلوية (MCB) في 960 ورقة، ووجدت أن 59 (6.1) الواردة "غير مناسب" تكرار الصورة، حول 2 يستحق أن يذهب لتزييف صورة .

ومع ذلك، في علم الاحياء الدقيقة في جامعة ستانفورد تعمل كليا على دليل، خمسة عشر من قبل الباحثين من ما يقرب من 1000 جهة لخص في أوراق هذه النتيجة.

الآن، تدخل AI ذلك أن احتمال اكتشاف المشبوهة يعزز إلى حد كبير صورة ورقة، إنجازا استثنائيا، في ورقة في مجال الطب الحيوي، وكانت منظمة العفو الدولية من البحث 9 من الصور هي تكرار للغاية، 0.59 من الورقة أن هناك اشتباه في الاحتيال .

AI مكافحة الاحتيال مع صورة أوراق، لا يزال هناك أكثر من 4000 مواد الطب "ورقة القضية"

استخدام AI إلى صورة مكافحة الاحتيال ورقات العمل من قبل جامعة سيراكيوز في نيويورك (جامعة سيراكيوز) الباحثين قد وضعت آلة الخوارزميات والتعلم، وقاموا بتحليل جميع البيانات مجلات النفاذ المفتوح فرعية (PMOS) انتهت في عام 2015 نشرت، بما في ذلك 760036 المواد، أكثر من 2 مليون البيانات.

الباحثون بناء خط أنابيب للكشف عن الصورة تلقائيا ليست مناسبة للمرشحين إعادة الاستخدام، وبعد الاختبار الأولي، وحذف النص أو قد يتم تمثيل الصورة فقط كصورة المعادلة، وترك حوالي 2 مليون صورة.

بعد ذلك، وجد الباحثون أنه في المتوسط كل صورة لديها نحو 1K ارتفاع نقطة مفتاح الكون، مما يخلق مشكلة كشف تشابه كبيرة، استخدم الباحثون تقريبي خوارزمية أقرب جار على حل هذه المشكلة. بعد ذلك، خوارزمية التعلم الآلي لتقدير ما إذا كانت الصور البيولوجية.

الكشف عن نسخة - نقل إعادة استخدامها. A. أمثلة على الخلايا السرطانية والحد من الجزء الأصلي. B. والنقطة الأساسية (منطقة عالية الكون) الحوسبة C. أقرب مباراة الجار. D

وأخيرا، لتقييم استخدام إعادة الاستخدام غير السليم الاصطناعي.

إعادة استخدام خوارزمية للكشف عن صورة المنطقة، في حين قوية لتدوير، والمحاصيل، تغيير الحجم، والتغيرات التباين. وعموما، خلصت الدراسة إلى نتيجة مفادها: على مجلات المجال المفتوح، وسيتم الاتفاق حوالي 0.59 من المواد التي يمكن أن تكون خادعة. وبعبارة أخرى، 760036 المواد في الداخل، ما يقرب من 4484 المقالات يشتبه في الاحتيال .

أوراق الصورة العبث قد يؤدي إلى فقدان 1000000000 $ سنويا

ورقة بحثية في صورة آفة التزوير على نطاق واسع.

قبل أسبوعين، أصدر العلوم احظت التراجع مشتركة على "تراجع" التقرير العديد من أرقام مذهلة: عدد الأوراق في المجلات الأكاديمية على زيادة بنسبة 10 مرات بالانسحاب مدى السنوات ال 10 الماضية، وهو أعلى معدل للبلدان التراجع في المرتبة الصين 7 ، وشكلت التراجع حتى 10 من الكتاب في الصين لمدة سنتين.

10 التراجع من أعلى (بيانات من علوم)

التراجع الملحوظ في قاعدة البيانات، وهناك تم سحب 18000 ورقة بحثية (أقرب يعود تاريخها إلى في 1970s)، والذي تم سحب 317 ورقة تم العبث الصورة، وهو ما يمثل 1.7 من أطروحة الشاملة.

أستاذ مشارك في الهندسة البيولوجية، وأشار جامعة بنسلفانيا أرجون راج إلى أن في وقت مبكر من عام 2012، فإن متوسط تكلفة العلم وراء الأبحاث الطبية الحيوية حوالي 300،000 $ إلى 500000 $. ذكرت مجلة لانسيت أن الباحثين أمريكية نشرت في نفس العام ما يقرب من 152،000 الأوراق.

مثل هذه التوقعات، حتى لو كلف كل ورقة 300،000 $، وجميع الكائنات الحية ورقة علمية طبية نشرت من قبل الباحثين الولايات المتحدة في عام 2012 التكلفة ستكون قريبة من 50 مليار $ .

إذا 2 من ورقة لأن الحاجة صورة التزوير على الانسحاب، جبروت الولايات المتحدة الأمريكية في عام 2012 النفايات ما يقرب من 1000000000 $. مع الإنتاج العلمي العالمي يتضاعف كل تسع سنوات، يمكن أن نفس الحساب، منذ عام 2012، ويرجع ذلك إلى التراجع هوامش السلبية الناتجة تكون أكبر.

صورة العبث دائما سيئا للغاية؟

ويعتقد بعض الباحثين أن ذلك سنوات عديدة، والعبث مسألة صورة ورقة يتدهور.

بيانات من المكتب الأمريكي للسلامة البحوث (مكتب الولايات المتحدة للبحوث النزاهة، ORI) أنه بعد الإفراج فوتوشوب، نسبة الحالات التي تنطوي على معالجة الصور، وأنهم يتعاملون مع زاد.

التكنولوجيا في مكافحة الغش في ورقة، لقد كان "القط والفأر". بالإضافة إلى الكشف عن صورة المنطقة AI إعادة استخدامها، فقد أصبح أيضا سلاحا ضد فوتوشوب.

في سبتمبر، نشرت تقارير علمية ورقة، أشار المقال إلى أن التخفيف ذات الأصل النباتي السماق toxicondendron (اللبلاب السام) من المثلية عالية جدا، على الأقل كما دواء لتخفيف الآلام (جابابنتين) صالح.

ومع ذلك، سرعان ما هذا المثلية ورقة تمهيدية، وتستخدم من قبل علماء الأحياء إنريكو بوتشي وضع علامة خطأ البرنامج: في اثنين من تجارب مختلفة، وتركيز المخدرات تختلف أوصى على نطاق واسع، ولكن كان من المستغرب الرسم البياني متسقة.

وفي وقت لاحق، ردت المؤلفان أن فريقه قدم بعض الأخطاء غير المقصودة في إعداد المخطوط، مما أسفر عن الصور المكررة وبيانات مكررة.

يقول المؤلفان الفرق بين النص والأرقام هي نتيجة الأخطاء المطبعية. وسيطلب من مجموعة لتحديث المادة وإجراء التصحيحات تقارير العلمي. ولكن أيضا وقال: "هذا لا يغير من الاستنتاجات العلمية بأي شكل من الأشكال".

منظمة العفو الدولية من تلقائي لمكافحة الغش أوراق مدى؟

ومع ذلك، حتى لو تمت مناقشته على نطاق واسع النهج القائم على البرمجيات في السنوات الأخيرة، واستخدام هذه التطبيقات أو الشركات نادرا ما تنشر نتائجها في مجال البرمجيات.

النهج القائم على البرنامج لا يزال يتطلب إشراف البشرية والدعم. ومن المرجح أن زيادة عدد الممسوحة ضوئيا المجلات الصور معالجة الصور تطوير البرمجيات. علما، مع ذلك، أن استخدام البرنامج لا يلغي الحاجة إلى تدخل بشري. يجب تقييم البرامج الانتاج من قبل الشعب.

هي منطقة واحدة لتطوير البرمجيات من المحتمل أن يكون لها تأثير كبير على الكشف عن نسخة صورة قواعد بيانات المادة كبيرة، وذلك باستخدام تقنيات التفتيش البصرية المستحيل على مثل هذه المقارنة على نطاق واسع.

منظمة العفو الدولية لكشف التزوير في صورة أوراق هناك نوعان من الأشكال الممكنة للمستقبل . أولا، يمكن للشركة تقديم المحررين تطبيقات مخصصة مجلة، المحررين يمكن بعد ذلك استخدام هذه التطبيقات على ورقة المقبلة للتحليل، والتي قد تكون مشابهة لعمل برنامج مكافحة الانتحال.

والطريقة الأخرى هي وسلامة صورة شركة تحليل تملك الموارد البشرية والكمبيوتر المخصصة للمجلة لفحص سلامة الصورة.

مع الآلي برمجيات تحليل الصور تطورت الأعمال التجارية، وهؤلاء الباحثين الاحتيال قد تجد القياس من الصعب "التسلل". ثم، وربما ستكون هناك أدوات أكثر تطورا آخر لجعل الاحتيال أكثر صعوبة للكشف عن صورة، وهذا "القط والفأر" ستستمر أكثر من ذلك.

المراجع:

https://thenextweb.com/science/2018/11/06/meet-the-people-busting-scientists-who-fake-images-in-research-papers/

https://www.nature.com/articles/d41586-018-06967-0

https://www.biorxiv.org/content/biorxiv/early/2018/02/23/269415.full.pdf

الأكثر صعوبة للوصول الى المراكز الحدودية، لدينا "إنتاج" مكان غير آمن!

أصدرت مؤسسة جارتنر كانت أعلى عشر الاتجاهات في تكنولوجيا الشبكات ويحسب الذكاء الاصطناعي الكيلومتر الأخير حافة

ولد وانغ في الاكتتاب هونغ كونغ الاكتتاب تجاوز المعروض أكثر من 1178 مرة!

بين نماذج الانفجار وشخصية، هيديو جديد لماذا يمكنك العثور على أفضل توازن؟

تشو تشى هوا مقدمة! الطلبة المتفوقين وي شيوى كتاب مرجعي "لحل التعلم العميق" تحت المراقبة

وي لإطلاق أول سيارة جديدة: نموذج الأعمال التجارية أكثر من المنتج يستحق التأمل

علقت ويلز فارجو قراصنة حساب العميل مفتوحا، إلينوي، الولايات المتحدة 30 مليار $ الاستثمار

المؤسس العام تشن قنغ: كانت تعرف باسم "هوانغبو ثلاثة أبطال" واحد "قطعة من الورق على الزواج منه"، وخلص الزواج الثوري

مبيعات السيارات نوفمبر في أمريكا الشمالية المخزون العشرة الأوائل: سيفيك الساخنة، والشاحنات الصغيرة وسيارات الدفع الرباعي مبيعات عهد المدينة!

قبل الزواج أكثر صعوبة من الجنيه الاسترليني مقابل المشغل الأوروبي 10 هو عبارة عن طريق هونج كونج

دافئة الرجال جديدة للتأليف كاي تشن T70، والذي أظهر عدد قليل من بطاقات؟

المعروفة قسم 8 القديم بشرق الصين، والمعروفة باسم كم من له القليل النمر تشن يى تشن يى سى شيان الفشل الذريع تصبح أبدية الألم