ستانفورد AI مختبر: كيفية بناء ذكية رؤية الكمبيوتر في المستشفيات

مذكرة لى فنغ الشبكة: هذه المقالة مترجمة ستانفورد AI المختبر المدونة، من تأليف ألبرت انعام الحق وميشيل قوه. يصف هذه الورقة أساسا كيف ستانفورد AI مختبر لتحسين النظافة الصحية في المستشفى من خلال العمل نظافة اليدين في تقنيات رؤية الكمبيوتر الى المستشفى الشاشة.

عدد الأشخاص الذين يموتون سنويا من عدوى المستشفيات أكثر من حالة وفاة حادث سيارة، وهو ما يعني أنه عندما يتم قبولك إلى المستشفى، وهناك احتمال واحد الثلاثين من صحة سوءا، فمن المثير للقلق جدا.

لحسن الحظ، لا يمكن للمستشفى عكس هذا الوضع من خلال تحسين الظروف الصحية. سواء في المستشفيات العامة والمطارات والمطاعم وما شابه ذلك، نظافة اليدين هي خط الدفاع الأول لمنع انتشار الأمراض المعدية، وهو الحس السليم بسيط. المشكلة الرئيسية لا تكمن في أن الناس يجهلون، ولكن عدم وجود الحذر، فإنها تحتاج تكنولوجيا الكشف التلقائي للتحقق من نظافة اليد. في الواقع، يمكن أن العديد من التقنيات حل هذه المشكلة، وأبسط والأكثر شيوعا هو استخدام تكنولوجيا الرؤية الكمبيوتر للكشف عن الناس هناك دون غسل أيديهم.

ستانفورد PAC (الشراكة ستانفورد في منظمة العفو الدولية بمساعدة الرعاية) مراكز والعديد من الشركاء من مختلف أنحاء العالم لسنوات عديدة تم تطوير هذه التكنولوجيا، وعلى الرغم من أن هناك الكثير من العمل الذي يتعين القيام به، لكننا نأمل أن تكون هذه التكنولوجيا يمكن أن تساعد في خفض معدلات العدوى في المستشفيات وتحسين صحة المرضى.

لماذا تكنولوجيا الرؤية الكمبيوتر؟

وسوف تعزز المستشفى لالتثقيف الصحي اليد من خلال المناهج الدراسية الطبية، لوحات الإعلانات والملصقات الموظفين الأسبوع، وطرق أخرى. منظمة الصحة العالمية حتى طرح "خمسة لحظات من نظافة اليدين"، يحدد بوضوح وقت العاملين في مجال الرعاية الصحية يغسلون أيديهم. من أجل التحقق من تنفيذ نظافة اليدين، المستشفى باستخدام بطاقات RFID أو موظف شارات لتتبع جهة عمل النظافة. بطريقة ما، هذه الأدوات هي مفيدة حقا، ولكن أيضا تواجه حالات سير العمل الانقطاعات، مثل عندما يدخل موظف غرفة جديدة، سوف المنبر فرشاة بطاقة RFID. هذا هو في الواقع مشكلة فنية: تكنولوجيا RFID عامة تشمل على بعد مسافة قصيرة، والهوائيات محدودة "استباقية" المسافة RFID طويلة أيضا، والحاجة إلى بطارية. من الواضح، ليست هناك حاجة للتوصل إلى حل جديد لعيوب تقنية RFID.

الرؤية الكمبيوتر والمستشفيات

ونحن نعمل في جامعة ستانفورد ومستشفى وسيل باكارد للأطفال، وقد وضعت برنامج جديد متطور لتتبع نظافة اليدين: يستخدم أحدث تكنولوجيا الرؤية الكمبيوتر، والطبيب لا يحتاج إلى التدخل في عملهم اليومي. وعلى الرغم من رؤية الكمبيوتر قد تم استخدامها في مجال التصوير الطبي، ولكن في الفضاء المادي للمستشفى لم يكن عديم الفائدة من ذلك بكثير. لحسن الحظ، وقد استخدمت رؤية الكمبيوتر في مشكلة أخرى من الحيز المادي في: المركبات الذاتية، المركبات الذاتية استخدام عدد كبير من أجهزة الاستشعار لفهم البيئة، وهلم جرا، يمكننا استخدام هذه المجسات في المستشفيات إلى أفضل فهم البيئة الطبية ذلك؟

استشعار العمق

استشعار العمق (مثل إكس بوكس كينيكت) يشبه الكاميرا مشتركة، لكنه لا يسجل اللون، ولكن المسافة قياسية. في الصورة اللون الطبيعي، كل بكسل يمثل اللون، في صورة العمق، كل بكسل يمثل بكسل من العالم الحقيقي إلى "المسافة" بين أجهزة الاستشعار، فإنه عادة ما يكون تعويم، مثل 1.337 م.

الصور (يسار) لون المستشفى التي تم تصويرها بالهاتف. (يمين) على الصورة عمق استولت عليها السقف الاستشعار. وأكثر قتامة في اللون، واستشعار عمق الكائن أقرب.

في عمق الصورة أعلاه، على الرغم من أنك لا تستطيع رؤية وجوه الناس، لا يزال بإمكانك معرفة ما يقومون به. لأنه يحمي خصوصية مستخدمينا، وهو أمر مهم في المستشفى. من أجل إظهار وتطوير التكنولوجيا لدينا رؤية الكمبيوتر، قمنا مثبتة على سقف مستشفيين عمق الاستشعار، وجناح القلب والأوعية الدموية للأطفال، والآخر هو وحدة العناية المركزة للبالغين (ICU).

هي التي شنت لدينا استشعار العمق على سقف مستشفى للأطفال.

من خلال اثنين من مستشفيات مختلفة استشعار العمق تثبيت، يمكننا استخدام الأدوات رؤية الكمبيوتر 3D تلقائيا مراقبة تعمل جنبا النظافة. وهذا ينطوي على ثلاث خطوات:

1. مراقبة مقدمي الرعاية الصحية.

2. المشي تتبع الموظفين في جميع أنحاء الجناح.

ومن ناحية سلوك النظافة 3. تصنيف الموظفين.

رصد المشاة

تستمر في دفع تلقائيا القياس سيارة: من أجل فهم البيئة، وأول شيء فعله هو الكشف عن الناس. هناك العديد من طريقة الكشف عن وجوه، ولكن معظمها للتنمية لون RGB صورة. بدلا من ذلك، اخترنا لاستخدام أسلوب أكثر القديم، والتي يمكن تشغيلها من خلال معالجة قضيتين على أي نوع من صورة: عادة، سوى كمية صغيرة من المساحة التي تحتلها في صورة معينة في الغرفة؛ و، في الصورة العمق، والناس غالبا ما تبدو وكأنها "قطرة ماء"، اختلافات واضحة بين الخلفية والأرض.

دخول القاموس. يحتوي كل إدخال القاموس صورة مركبة، مثل عندما يكون الشخص واقفا في رد فعل على الموقع.

يتم تحديد طريقة للكشف عن خريطة الإشغال الشبكة الإنسان على أرض الواقع، وهو مصفوفة ثنائية تحتل تعريشة الرسم البياني، وتستخدم للإشارة إلى ما إذا كان الشخص تحتل موقعا خاصا على الأرض. قبل الأرض (على سبيل المثال، أرضية الغرفة) وتحويلها إلى شبكة منفصلة، يمكننا تقريبا من قبل كل شخص مع قطرات الماء عالية "تخيل" ضمن شبكة من شخص في هذا الموقف. يمكننا جميعا أن إنشاء القاموس الذي يحتوي على قطرات الماء في كل نقطة على الأرض (تذكر: لأننا توليفها هذه القطرات، ونحن نعلم أن تكون دقيقة 2D و 3D موقف). لسيناريوهات متعددة، ونحن يمكن أن تجعل قطرات متعددة في مكان الحادث. أثناء الاختبار، ما نحتاج إليه هو صور "قطرة ماء"، والتي يمكن استخدامها في أي الصدارة / خلفية الطرح أو تجزئة الكائن خوارزمية كاملة. الآن، عندما تعطى قطرات صورة اختبار، فإننا يمكن أن تؤدي K-أقرب البحث في القاموس للعثور على موقف كل قطرة.

مسار عبر جناح

من أجل إنشاء مستشفى ذكي حقا، نحن بحاجة إلى أجهزة الاستشعار في جميع أنحاء استخدام جناح المستشفى. لأن ليس كل الأشياء التي تحدث أمام جهاز استشعار، لذلك نحن بحاجة أيضا لتتبع الناس أمام خوارزميات أجهزة استشعار مختلفة. هذا ليس فقط يوفر تفاصيل تنفيذ نظافة اليدين، فإنه يمكن أيضا أن تستخدم لتحسين سير العمل والمكاني التحليل. بشكل عام، نود أن العثور على مجموعة من سلسلة من المسار X، حيث كل مسار من xX يمثل x مجموعة من متواليات تم الكشف، L_x = (l_x ^ {(1)}، ...، l_x ^ {(ن) })، الإحداثيات ممثلة للمشاة الكشف عنها. ويمكن أن يعزى المشكلة إلى مشكلة تقدير لاحقة بحد أقصى (MAP).

المقبل، ونحن نفترض أن نموذج سلسلة ماركوف، وسوف تتبع كل كشف وسيط X l_x ^ {(ط)} ولاحق كشف احتمال l_x ^ {(ط + 1)} لإعطاء P (l_x ^ {(ط + 1)} | l_x ^ {ذلك}) متصل. ونحن الآن يمكن أن يكون مهمة MAP كما البرمجة الخطية عدد صحيح يمكن حلها من خلال النظر إلى تقليل تكلفة تدفق C و:

الذي، f_i المناسب لاكتشاف ما إذا كان المعرض هو متغير التدفق الحقيقي، f_ij يشير إلى أن المقابلة اكتشاف ما إذا كان الارتباط معا. يمثل _ij متغير وlogP | نقل الكشف عن تكلفة l_i، l_jL التي قدمها (l_i l_j). _i التكاليف المحلية هو احتمال وسيطة من الكشف هو في الحقيقة عدد. للبساطة، ونحن نفترض أن جميع لديهم نفس احتمال الكشف. هذا هو ما يعادل مشاكل عملية التحسين يمكن حلها مع ك أقصر المسارات في الوقت الحقيقي.

ومن ناحية تصنيف السلوك الحرس

حتى الآن، حددنا مكان من جميع مشاة جناح (على سبيل المثال، وضع في الطابق جناح المستشفى العالمي). الخطوة الأخيرة هي لكشف سلوك نظافة اليدين وربطه إلى مسار معين. عندما يكون الشخص باستخدام المطهر جهة، ويعرف السلوك نظافة اليدين بأنها إيجابية، فإننا مسار مرة أخرى كل من المشاة أو وضع علامة على أنها نظيفة وغير نظيفة.

في البيئة الفعلية، فإنها غالبا ما تكون عرضة لقيود تركيب نشر أجهزة الاستشعار. سواء عن قصد أو عن غير قصد، بناء وصيانة فنيين لتركيب زاوية الاستشعار وموقف مختلفة، مما يعني أن لدينا نموذج يجب أن تكون قوية لهذه التغيرات بحيث يمكن أن تعمل مع أي زاوية الاستشعار عرض. لأن الشبكة العصبية التلافيف التقليدية (CNN) عموما ليست وجهة نظر نفسه، لذلك نستخدم تحول الفضاء الشبكة (STN) بدلا من ذلك.

. (يسار) هيئة تنقسم مرحلة التوسع البيانات (يمين) ناحية النظافة تصنيف السلوك: تحول الفضاء إلى جانب وجود الشبكة العصبية التفاف كثيفة.

إدخال STN هو صورة عشوائية، صورة مشوهة هو الإخراج. لمساعدتنا على التعلم بشكل أسرع نموذج، ونحن نقدم أيضا جسم الإنسان مثل تجزئة، ويلف الجسم) إلى STN. هذا الفيلم يمكن استخدام المقدمة الكلاسيكية - الخلفية أو عمق تعلم طريقة لاستخراج. STN صورة الملتوية في تعلم شكل "تغيير المنظور". من هذه النقطة صورة مشوهة للعرض، ونحن نستخدم CNN القياسية (على سبيل المثال، DenseNet) لأداء ثنائي تصنيف هل المطهر استخدام أي شخص اليد.

تطابق الزمان والمكان

في هذه المرحلة، ما زلنا بحاجة لتتبع مجموعاتنا والأفراد اختبار صحة مجموعة من اليدين معا، والذي يدخل اثنين من المتغيرات الجديدة: المكان والزمان. لكل المصنف للكشف عن نظافة اليدين (على سبيل المثال، المطهر اليد المستخدمة)، لدينا لتتناسب مع هذا لمسار واحد. عندما T يرضي المسار شرطين، تحدث مباراة بين تصنيف وتعقب:

1. في مستوى التسامح معين، ومسارات T تحتوي على (س، ص)، يتم الكشف عن نقطة P ونظافة اليدين الحدث E في وقت واحد.

ويعرف نقطة 2. واحد على الأقل pP القرب المادي استشعار المسؤولية للكشف عن الأحداث على E هذه العتبة بالقرب من المدخل.

إذا كان هناك مسارات متعددة لتلبية هذه الاحتياجات عن طريق اختيار لكسر اتصال مع أقرب باب (س، ص) الموقف. لدينا نموذج لائحة الناتج النهائي من مسار واحد T، حيث كل أثر للمجموعة عنصر قائمة مرتبة (ر، س، ص، A)، حيث t يمثل الطابع الزمني، س، ص يمثل إحداثيات الطائرة على الأرض 2D، وتمثل أحدث عمل أو حدث العلامات. بواسطة T، يمكننا حساب معدلات الامتثال أو معيار الذهب من تقييم للمقارنة.

مقارنة بين المدققين الإنسان وRFID

الآن، العديد من المستشفيات يقاس "المتسوق السري" تنفيذ نظافة اليدين والأفراد المدربين تدريبا جيدا يتجول في جناح المستشفى، لمراقبة ما إذا كان الموظفون غسل أيديهم بشكل خاص. هذا "الضيف سر" قد تكون ممرضة، طبيب، أو حتى زائر. نحن نسميها مراقبة سرية، على عكس جمهور لمراجعة تنفيذها. مراقبة الغرض الخفي هو تقليل تأثير هوثورن (على سبيل المثال، لشخص يراقبك، قمت بتغيير سلوكك). كما نوقشت أعلاه، رؤية الكمبيوتر سوف يقيم في موقف ثابت وافر من مدققي الحسابات وارد، يتجول في جناح باستخدام علامة RFID واحدة ومدققي الحسابات وتمت مقارنة.

نتيجة

تظهر النتائج المقارنة، وتتفاعل ولدت الكثير من ايجابيات كاذبة، 18 فقط من الوقت بشكل صحيح وتوقع مسار نظيفة أو قذرة.

تأثير مراجعي الحسابات الإنسان معدل دقة أفضل بكثير من 63 في تأثير الشخص الثالث هو أفضل، ومعدل دقة يمكن أن تصل إلى 72. ومع ذلك، خوارزمية لدينا أكثر من مدقق الحسابات البشرية، مع 75 من الدقة. وهذا ليس مستغربا، لأن المراجعين تتنافس مع نظام الرؤية الحاسوبية لديه "رؤية عالمية" ل. منذ تم وضع علامة على التسمية الحقيقية الإنسانية، لماذا المراقب الإنسان هو أسوأ من أداء الخوارزمية؟ والسبب هو أن لدينا التسمية الحقيقية فقط يتم وضع علامة بعد، وليس علامة في الوقت الحقيقي. تميزت الوصول عن بعد إلى جميع أجهزة الاستشعار، ويمكن تشغيل الفيديو إلى الأمام في الوقت المناسب لضمان تعليقاتهم صحيحة. في الموقع لا يمكن المدقق "الوصول" لجميع أجهزة الاستشعار، وأنها لا يمكن تشغيل الأحداث في الوقت المناسب.

الصحة الكشف عن صور من فترة جهة مختلفة. وتشير الساحات الزرقاء شخص يستخدم المطهر اليد. يشير الأزرق الداكن هناك المزيد من الفعاليات في وقت واحد. في عروض أسفل التسمية الحقيقية. بشكل عام، كلما فارغة، وأسوأ النتائج.

وبالإضافة إلى أرقام، والنتيجة هي تأثيرات بصرية أكثر إثارة للاهتمام. الصورة أعلاه يظهر المراجعين مشهد نادرا ما يكشف السلوك نظافة اليدين. علما بأن كل جزء فارغ من ذلك؟ إذا كنت تبحث عن الشعار الحقيقي الذي عادة ليس فارغة. يعني ذلك أن المراقبين غاب عن الكثير من الأحداث نظافة اليدين. هذا هو عادة بسبب المراقبين الهاء: أنها قد غفو، انظر الأنشطة ذات الصلة في أي مكان آخر في جناح، أو لا أرى وقوع أحداث نظافة اليدين.

موظفو وحدة العناية المركزة للتنقل داخل الخريطة الحرارة الزمكان، / وسائل أحمر أصفر أكثر الناس هناك الوقوف / المشي.

وأخيرا، كنا نفعل استنتاج المتحركة. ويبين الرسوم المتحركة أعلاه وجهة نظر خطة منظور جناح المستشفى. لأننا لا نستطيع تتبع الناس في جميع أنحاء المستشفى، لذلك علينا أن نفهم خاصة بهم (س، ص، ض) الموقف. نحن تآمر كل نقطة وإنشاء خريطة الحرارة مع مرور الوقت. هذا النوع من التحليل المكاني هو فعالة جدا لتحديد وتتبع أنماط حركة المرور من احتمال انتقال المرض. هذه هي دائما الصفراء / وتمثل المنطقة الحمراء الفضاء مزدحم. هذه المساحات وعادة ما تكون التقاطعات في الممر أو على السطح الخارجي للجناح المريض. اذا نظرتم بعناية، وسوف تجد بقية المراجع يتم وضع علامة حمراء.

الاتجاهات المستقبل

وتبين لنا كيفية استخدام الكمبيوتر الرؤية وعمق تعلم لمراقبة عمل نظافة اليدين في المستشفى تلقائيا. ستانفورد PAC، نظافة اليدين هي حالة الطلبات رؤية الكمبيوتر في الصناعة الطبية فقط. ونحن أيضا تطوير نظام الرؤية الحاسوبية لرصد حركة المرضى، وتحليل نوعية الجراحة، وكذلك فحص محتويات الوضع الشاذ مثل كبار السن.

ونحن نأمل ان يكون هذا العمل يمكن أن تحفز إمكانيات الذكاء الاصطناعي الطبي وتوسيع نفوذها.

مراجع

وجهة نظر قسما ثابتا شبكات التلافيف لتحديد محفوفة بالمخاطر سيناريوهات نظافة اليدين. M. قوه، A. الحق، S. يونغ، J. Jopling، L. داونينج، A. Alahi، B. كامبل، K. Deru، W. Beninati، A. ميلشتاين ، L. في في ورشة عمل حول آلة التعلم من أجل الصحة (ML4H)، العصبية أنظمة معالجة المعلومات (NIPS)، لونغ بيتش، كاليفورنيا، ديسمبر 2017.

نحو رؤية المستندة الذكية المستشفيات :. نظام لتتبع ومراقبة نظافة اليدين الامتثال A. الحق، M. قوه، A. Alahi، S. يونغ، Z. لوه، A. ريج، A. سينغ، J. Jopling، L . داونينج، W. Beninati، T. Platchek، A. ميلشتاين، L. في في. آلة التعلم في مؤتمر الرعاية الصحية (MLHC)، بوسطن، MA، الولايات المتحدة الأمريكية، أغسطس 2017.

الرؤية القائمة على نظافة اليدين الرصد في المستشفيات. S. يونغ، A. Alahi، Z. لوه، B. بنغ، A. الحق، A. سينغ، T. Platchek، A. ميلشتاين، L. في في. أمريكا المعلوماتية الطبية جمعية (AMIA) الندوة السنوية، واشنطن، DC، الولايات المتحدة الأمريكية، نوفمبر 2016. لى لى شبكة النت

اللاعبين اليابانيين IOS السفر اليد تهمة أكبر قدر من المال، في المرتبة الأولى في العالم! ما الألعاب التي تلعب معظم الذهب الكريبتون؟

10 أسئلة تقيس لم تكن شخص مؤهل الإنترنت

توازن جديد سوبر عبر الحدود! الرسوم المتحركة على مستوى OG مع التخطيط توسع مشتركة "EVA"!

يوبي سوفت الرئيس التنفيذي لحضور شنغهاي CJ، وجلب اللعبة التي كنت الأكثر نتطلع إلى؟

Houming هاو بنغ يو تشانغ بناء قوة "في عنبر الماضي لكم مرة أخرى،" نظم الخيال الشباب سينيور يير

تجمع جدار | الخنصر كنت حصادة الذكور على التوالي على الاطلاق

"البوابة فارس" اجتاحت السوق الموحدة، زعيم اللعب الأقران مبتكرة، مليون شخص يتنافسون لتحميل

مع تجربة VR "الطيور الغاضبة" تتحقق! أمي، أريد شراء HTC فيف

وى الشمالية لEP9 لإنتاج أسرع سيارة في نيوزيلندا 6 دقائق و 45 ثانية 90

"القوطية الخط" تشاو يينغ كبير! "هيل بوي" استعادة ملحمة عالم الخيال

الآن، يجب أن يكون حتى الحيوانات الأليفة يكفي للتغلب؟ OFF-WHITE الحيوانات الأليفة نسخة من حزام يتوسع بما فيه الكفاية!

تحت الوجه الكامل الكونغ فو تشانغ CS95 من اثنين الجديدة الأمامية وجه كيت