العملي: إصلاح مجموعة بيانات الصور الطبية مع عمق التعلم

 الأنفس جي تجميع جديد

المصدر: وورد

ترجمة: القلم

[استعراض فاز جي الجديدة بيانات الصور الطبية من الصعب التعامل معها، وغالبا ما تشمل صورة دوران انقلاب. توضح هذه المقالة كيفية استخدام عمق التعلم مع الحد الأدنى من الجهد لإصلاح مجموعة البيانات التصوير الطبي، وتخفيف بناء نظم AI الحالية كبيرة لجمع البيانات الطبية وتكاليف التنظيف.

في التصوير الطبي يتم تخزين ملفات البيانات على أساس الافتراضات السريرية. للأسف، يعني ذلك أنه عندما تريد استخراج صورة، مثل إيجابية الصدر بالأشعة السينية، وكنت عادة تحصل على الكثير من الملفات المخزنة في مجلد الصور الأخرى، وليس هناك طريقة سهلة للتمييز بينهما.

الشكل 1: هذه الصور من نفس المجلد منطقي، لأنه في الأشعة، صورة سجلنا ليست هي القضية. هذا هو بعد إصابة كل أجزاء الجسم المرضى، في حين أن المسح.

اعتمادا على المنظمة، قد تحصل أفقية أو عمودية صور الوجه. أنها قد تحتوي على قيم بكسل مقلوب. ويمكن أن تدوير. المشكلة هي، عند معالجة مجموعة كبيرة من البيانات، مثل 50000-100000 الصورة، كيف يمكنك أن تجد هذه التشوهات دون وضع توجيهات الطبيب؟

يمكنك محاولة لكتابة بعض أنيقة حلول ، على سبيل المثال: ارتفاع لأن معظم الارتفاع أشعة X الصدر من العرض، مما حد أسود على كلا الجانبين من الأشعة السينية، لذلك إذا كان هناك بكسل سوداء أكثر من 50 صفوف من القاع، قد تكون استدارة من قبل 90 درجة.

ولكن كالعادة، فشلت تجربتنا.

الشكل 2: لا يوجد سوى منتصف الصورة هناك الكلاسيكية "أسود الحدود"

هذه القاعدة الهشة لا يحل المشاكل المذكورة أعلاه.

أدخل 2.0 البرمجيات نحن نستخدم آلة التعلم لم نتمكن من البناء على الترميز الخاصة بهم حلول . مثل دوران صورة مشكلة قابلة للتعلم محرج . وهذا يعني أن الجهاز يمكن تحقيق هذه المهام على أكمل وجه، مثل البشر.

ولذلك، فإن الحل الواضح هو استخدام التعلم العميق لمجموعات البيانات إصلاح بالنسبة لنا. في هذه المقالة، سوف تظهر لك مجالات تطبيق هذه التقنيات، وكيفية القيام بذلك مع أقل جهد وتظهر بعض الأمثلة على استخدام هذه الطريقة. على سبيل المثال، وسوف تستخدم في تطوير وانغ وآخرون. مجموعة البيانات CXR14 ويبدو أن يخطط لها بعناية، ولكن في بعض الأحيان أنه لا يزال يحتوي على بعض الصور السيئة. إذا كنت تستخدم مجموعات البيانات CXR14، حتى نتمكن من إعطائك احتواء 430 مجموعة البيانات تسمية جديدة لذلك لم يكن لديك ما يدعو للقلق صورة سيئة!

أسئلة محرجة ذلك

السؤال الأول نحتاج حقا أن يسأل هو السؤال المطروح الآن هو قابلة للتعلم محرج لماذا؟

وبالنظر إلى أن معظم الدراسات طبيعية، كنت في حاجة الى جدا دقة عالية لمنع استبعاد تلك الأبحاث "جيدة". ينبغي أن نسعى 99.9 أهداف.

الشيء بارد هو، ليمكن تحديد المشكلة بصريا، فهي بسيطة جدا، ونحن يمكن أن يكون حلا جيدا. والسؤال هو جيد، "هل يمكن أن تتخيل قواعد بصرية واحدة لحل هذه المشكلة؟" " ImageNet والغرض الرئيسي هو للتمييز بين مجموعات البيانات التمييز بين الكلاب والقطط، ولكن الحل هو بالتأكيد ليس هو الحال.

هناك الكثير من التغييرات، والكثير من أوجه التشابه. أنا غالبا ما تستخدم هذا المثال في كلمته: لا أستطيع حتى أن أتخيل كيف لقواعد الكتابة إلى بصريا تمييزه نوعين من الحيوان . هذه ليست قابلة للتعلم جدا محرج.

ومع ذلك، البيانات الطبية، وكثير من المشكلة هو بسيط جدا. لأن الصور الطبية تغيير صغير. علم التشريح، وزاوية والضوء والمسافة وخلفية مستقرة جدا. ولتوضيح هذه النقطة، دعونا ننظر في مثال بسيط من CXR14. في مجموعة بيانات عادية الصدر بالأشعة السينية، بعض التناوب (التي لا يعترف بها في العلامة، لذلك نحن لا نعرف أي واحد). أنها يمكن أن تكون استدارة 90 درجة معلومات، أو 180 أسفل رأسا على عقب.

هذا هو قابلة للتعلم أنه محرج؟

الشكل (3): الاختلافات الصدر بالأشعة السينية وعمودي على التناوب حقا بسيطة

الجواب هو نعم. بصريا، والبحث غير طبيعي والبحوث طبيعي مختلفة تماما. يمكنك استخدام قاعدة بصرية بسيطة، مثل "الكتف ينبغي أن يكون أعلى من القلب،" ستحصل على التحقق على جميع العينات. ونظرا لعلم التشريح أنها مستقرة جدا، وجميع الناس لديهم الكتفين والقلب، والتي ينبغي أن تكون الشبكة العصبية الإلتواء يمكن أن يتعلم القواعد.

"تجويع" البيانات

علينا أن نسأل السؤال الثاني هو: أنا لدينا ما يكفي من بيانات التدريب ؟

في الحالة التي يكون فيها دوران الصورة، بالطبع، لدينا ما يكفي من البيانات، يمكننا توليد البيانات. نحن فقط بحاجة الآلاف من العاديين أشعة الصدر السينية، وتناوب عشوائي. على سبيل المثال، إذا كنت تستخدم صفائف نمباي، قد تستخدم هذه الدالة:

تدوير صفر (الصورة):

rotated_image = np.rot90 (صورة، ك = np.random.choice (المدى (1،4)) والفؤوس = (1،2))

عودة rotated_image

هذا هو فقط 90 بالتناوب في اتجاه عقارب الساعة، و 180 درجة مئوية أو 270 درجة. عادة حول محاور الثانية والثالثة من التناوب في هذه الحالة، لأن عدد من المحور الأول (البعد وفقا للمتفق عليه theano المصفوفة) مرور.

ملاحظة: في هذه الحالة، CXR14 بيانات الصور بالكاد تناوب، لذلك يجب الحرص على عدم وقد تناوب "الصحيحة" صورة وهناك احتمالات ضئيلة جدا. يمكننا أن نفترض أن البيانات لا تدوير الصورة، بل هو نموذج التعلم جيدة. إذا كان عدد كبير من الصور غير عادية، ثم كنت أفضل اختيار كل من الصور العادية وغير العادية. بسبب مشاكل مثل هذا التناوب يمكن بسهولة المعترف بها، وجدت أنني يمكن أن تعطي الآلاف من العلامات في ساعة، وذلك لأنها لا تأخذ الكثير من الجهد. وبسبب هذه المشاكل هو بسيط جدا، وكثيرا ما تجد أن أحتاج سوى بضع مئات من الأمثلة على "حل" هذا التحدي.

لذلك، أنشأنا مجموعة بيانات الصور العادية، حيث النصف التناوب، ووضع علامة عليها وفقا لذلك. في حالتي، وأنا اختار الحالات التدريب 4000، حيث يتم تدوير 2000، 2000 الحالات يكون التحقق من صحة مجموعة 1000 هو نتيجة لعملية التناوب. ويبدو أن هذا قدرا كبيرا من البيانات (تذكر، كقاعدة عامة، عند النظر في سياق الخطأ، يمكن أن يكون 1000 مثال جيد، وانها مناسبة لذاكرة الوصول العشوائي، لذلك فمن السهل أن القطار على جهاز منزلي .

من أجل أن يكون هناك تغيير للاهتمام في تعلم الآلة، وأنا لست بحاجة إلى مجموعة منفصلة من الاختبارات. الدليل على ذلك واضح في الحلوى: سأخوض هذا النموذج على مجموعة البيانات بأكملها، ونتائج الاختبار التي حصل عليها البيانات إلى أن يتم التحقق.

بشكل عام، ويمكن تنفيذ مثل هذا العمل جعل حياتنا خففت . أنا خفض الصورة ل 256 256 بكسل، لأن الكشف عن دوران لا يتطلب عالية الدقة نظرة، يمكنني استخدام بعد resnet50 المدربين قبل، فإنه keras كأساس للشبكة. لاستخدام شبكة المدربين قبل، ودون سبب واضح، وذلك لأن ما يقرب من جميع ستحصل على استخدام CONVERGES الشبكة على حل بسيط، ولكنها بسيطة جدا ولن يسبب أي تباطؤ سرعة، لأنه في أي حال وقت التدريب سريع. اعتدت مجموعة من المعلمات الافتراضية، لأنني لست بحاجة للقيام بهذه المهمة بسيطة أي ضبط.

يمكنك استخدام أي جهة شبكة والترميز . A VGG صافي على خط المرمى. A densenet وهي متاحة أيضا. في الواقع، يمكن لأي شبكة كل تتحقق هذه المهمة.

في عشرات جولات من التكرار بعد أن حصلت على النتائج المتوقعة بلدي على مجموعة التحقق من الصحة:

FIG 4: AUC = 0.999، ACC = 0.996، PREC = 0.998، REC = 0.994

حسنا، إذا كان هذا هو مهمة قابلة للتعلم محرج، وجدت بالضبط ما كنت أتوقع.

نتائج التفتيش

كما قلت من قبل، في تحليل الصور الطبية، ونحن بحاجة دائما للتحقق نتائجنا. من خلال مقارنة الصور، تأكد من أن نموذج أو عملية لتحقيق أهدافك.

ولذلك، فإن الخطوة الأخيرة هي على مجموعة البيانات بالكامل تشغيل نموذج نفذت توقعات الدورية ثم استبعادها. لأن تقريبا أي دوران البيانات البحثية، على الرغم من أنني أعرف ذلك، فإن معدل نذكر أن تكون عالية جدا، ويمكنني أن ينظروا إلى جميع من المتوقع تناوب الصور.

إذا كانت هذه هي مشكلة الكثير من الصور غير طبيعية، على سبيل المثال، من بينهم أكثر من 5 من البيانات غير طبيعية، ثم مجموعة عشوائية من مئات الحالات ويدويا علامة على مجموعة الاختبار سيكون أكثر كفاءة، ثم يمكنك تتبع النموذج الخاص بك بدقة على مؤشر المناسب.

أنا لا سيما المعنية حول يعتبر أن تكون استدارة إلى أي من الدراسات عادي (ايجابيات كاذبة) لأنني لا أريد أن يكون لتفقد قيمة الحالات التدريب . هذا هو في الواقع مصدر قلق أبعد من الخيال الخاص بك، لأن هذا النموذج هو المرجح أن يكون مبالغا فيه للدعوة الى نوع معين من الحالات (قد يتم تسجيل هذه الحالات في المريض كسول ويميل)، إذا استثنينا هذه القواعد، وسوف نقدم بيانات التحيز، لم يعد هناك " العالم الحقيقي "ممثل مجموعة البيانات، وهذا هو الواضح البيانات الطبية ومن المهم، لأن هدفنا هو بناء نظام قادر على العمل في عيادة الحقيقية.

فإن نموذج يكون ما مجموعه 171 اعترف القضية بأنها "التناوب" صورة. ومن المثير للاهتمام، هو في الواقع "استثناء" التحقيق، لتحديد فعلت الكثير يست في الواقع الشذوذ تناوب. وهذا أمر منطقي، لأنه يمكن أن يكون علامة فارقة في دراسة علم التشريح. وقد وصفت أي أشياء غير عادية، مثل دوران أفلام الأشعة السينية أو أجزاء أخرى من الجسم، مقارنة هذا النموذج مع تسميات مختلفة. ولذلك، نتائجنا لم تجد صورة من التناوب العادي أكثر من ذلك بكثير.

171 المحدد في التنبؤ، واستدارة الصدر بالأشعة السينية 51 من خلال ورقة. ونظرا لانخفاض معدل انتشار غير طبيعي (120،000 في 51 شهرا)، وهذا هو معدل منخفض جدا من ايجابيات كاذبة.

الشكل 5: مثال دوران الصدر

في 120 حالة المتبقية، 56 لم تكن إيجابية الصدر بالأشعة السينية. فمن جانب، وأساسا البطن الأشعة السينية. على أي حال، ما زلت أريد إزالتها جميعا.

بقية من ذلك؟ هناك بحث مختلط إنه صورة تحتوي على عدد كبير من الحدود السوداء أو البيضاء من الدراسات، وهذا هو صورة كلها رمادية والبحوث مستوى بكسل العكس، وهلم جرا.

وعموما، هناك حوالي 10 دراسات، والذي أسميه " إيجابية كاذبة "(معنى أن أتمكن من انتقاء الصورة التي تريد أن تبقي إيجابية الأشعة السينية). والخبر السار هو، حتى إذا كنت تريد لهم معا مرة أخرى، فقط 171 التنبؤ سهلة ل إدارة العمل .

يبدو وكأنه كشف عن الدوران حل جزئيا مشكلات أخرى (مثل قيمة انعكاس بكسل). أنت تعرف جيدا كيف هو، ونحن بحاجة للتحقق مما إذا كان مفقودا حالات سيئة أخرى. يمكننا اختبار هذا، لأن القيم مقلوب البيانات بكسل وبسهولة ولدت (الصورة في س، س = ماكس-خ).

هنا نحن بحاجة أن أذكر مرة أخرى مشكلة قابلة للتعلم محرج. في هذه الحالة، في غياب الوضع التعلم الآلي، قد يكون هناك بعض الطرق للقيام بذلك (شريط الرسم البياني يجب أن تبدو مختلفة جدا)، وإنما هو أيضا في غاية البساطة.

حسنا، تم العثور على هذا كاشف معين أكثر من كاشف دوران عكسي تفعل؟ نعم. الدورية التحقيق وجدت في البيانات مجموعة كاملة 4، وجد انعكاس للكشف عن 38 بحث عكسي. وجد الباب للكشف عن التناوب البحث فقط فرقا.

كتاب قصة حقيقية: تدريب نموذج واحد من أجل حل كل مشكلة هو النهج الصحيح.

لذلك، نحن بحاجة إلى نموذج محددة لمهام إضافية كاملة تنظيف البيانات.

Dishuichuanshi

من أجل إثبات أن كمية صغيرة من بطاقة البيانات هو مفيد، وأنا استخدم تناوب كاشف (N = 56) تصوير فيلم والمناطق الجانبية السيئة، ويتم تدريب نموذجا جديدا عليها. وبما أنني لم يكن لديك الكثير من البيانات، وقرر استخدام HOG البرية، وعدم استخدام مجموعة التحقق من الصحة. لأن هذه المهام هي قابلة للتعلم محرج، مرة واحدة أنها قريبة من 100، وسوف يكون لها أداء جيد التعميم. من الواضح أن هناك مخاطر بإفراط، ولكن أنا لا تزال تختار لتحمل المخاطر.

وتبين التجارب أن النتائج جيدة جدا! كما أنني وجدت آخر الصور جانب مئات من الصور، وبعض من الحوض والبطن صورة.

من الواضح، إذا كنت قد بدأت من الصفر مجموعة البيانات هذه، سيكون من الأسهل لحل هذه المشكلة، لأنني لا أستطيع الحصول على الكثير من الصور الثدي غير إيجابية ذات الصلة. بالنسبة لي، أفضل مما هو عليه الآن، ولست بحاجة لاستخراج الملفات من مستشفى محلي بلدي في سلسلة من الصور، وهي خارج نطاق هذا المقال. لذلك أنا لست على يقين من أنني جعلت معظم الإنجازات، ولكن من مثل مجموعة بيانات صغير، وهو جهد جيد جدا.

بالإضافة إلى البيانات على CXR14، لقد لاحظت شيئا واحدا، بلدي الفقراء نموذج الأداء على الصورة للطفل. طب الأطفال والكبار في الصور مظهر وصور مختلفة، والتي هي التناوب كاشف، وكاشف bad- مقلوب جزء من لجنة التحقيق التي تعرف بأنها "غير طبيعية". واقترحت أنه ينبغي تجاهلها، ولكن مع عمر المريض ليتم تضمينها في التسمية، بحيث يمكنك إكمال في غياب التعلم في العمق. مع الأخذ بعين الاعتبار البيانات دون سن الخامسة من المركزة، والمرضى فقط 286، وأنا شخصيا من شأنه أن يستبعد جميع المرضى، إلا إذا أريد خصيصا لمرضى الدراسة أن العمر وأعرف حقا ما أقوم به، من حيث التصوير الطبي ل تنظر. في الواقع، كنت أود أن يكون جميع الناس دون سن 10 عاما مستبعدة، لأن هذا هو سن معقول، ونحن يمكن أن تأخذ في الاعتبار حجم وخصائص مرضية أكثر "تنضج". في عدد السكان 10 سنة من العمر، حوالي 1400 حالة، وهو ما يمثل حوالي 1.

كتاب قصة حقيقية:

الصدر بالأشعة السينية في الأطفال والبالغين هي مختلفة جدا. مع الأخذ في الاعتبار بيانات الحساب أقل من 10 سنة لحوالي 1 فقط من البيانات، ما لم يكن هناك سبب وجيه، وإلا فإنها ينبغي استبعادها.

سيئة استهداف والتضخيم الصورة قد يكون هناك مشكلة، ولكن ذلك يعتمد على المهمة، وتحديد تعسفي "صورة سيئة" لجميع المهام التي من المستحيل، ليس هذا ما أريد. أكثر شيء واحد هو محددة لهذه المهمة.

بشكل عام، واستخدام التعلم العميق لحل مشكلة بسيطة تنظيف البيانات يعمل بشكل جيد. بعد نحو ساعة، وكنت قد تنظيف أكثر من مجموعة البيانات وتدوير الصور مقلوب. ربما أكون قد حددت جزء كبير من الصورة الجانبية وأجزاء أخرى من الجسم، على الرغم من أنني متأكد من حاجة لي لإنشاء مسبار محددة لهم. إذا لم يكن هناك البيانات الخام، وهي فترة طويلة جدا لهذا بلوق بسيطة.

من منظور أوسع البيانات CXR14 فإنه ليس من الكثير القطع الأثرية . المعاهد الوطنية الأميركية للفريق الصحة وضعت بشكل جيد معا البيانات الخاصة بهم. ومع ذلك، في مجموعة البيانات الطبية، وليس هو الحال دائما، إذا كنت ترغب في بناء عالية الأداء نظام ذكاء اصطناعي الطبي ، وسوف نحتاج للتعامل مع الضوضاء من استخدام البنية التحتية السريرية بعثة بحثية.

مزيد من الدراسة

وحتى الآن، لدينا حل بعض التحديات بسيط جدا، ولكن ليست كل المشاكل التي واجهناها في التصوير الطبي هي في غاية البساطة.

فريقنا تطبيق هذه التقنيات عند بناء مجموعات كبيرة من البيانات من كسر الورك. نحن استبعاد الصور من مناطق أخرى من الجسم، استبعدنا الحالات من المعدن المزروع، مثل استبدال مفصل الورك، ونحن أيضا توسيع منطقة الأرداف، حذف صورة المنطقة لديها ما تفعله مع مشاكلنا، مثل كسور الورك شيء يحدث في الورك الوضع.

نحن هنا لتحقيق مشكلة الاستبعاد من المعدن من خلال عملية التعدين النص التلقائي، تم العثور على هذه الأطراف الاصطناعية دائما أن يحدث في نفس الوقت، لذلك وجدت الكلمات الرئيسية المرتبطة يزرع. هذه التسميات هي في حوالي 10 دقيقة المراد إنشاؤه.

في جزء من الجسم مربع إحاطة للكشف خطأ التنبؤ والخطأ في ظل هذه الظروف، ليس لدينا أي وسيلة لتوليد التسميات تلقائيا. ولذلك، توجيه المعالجة اليدوية. حتى مربع إحاطة يتوقع مثل هذا الشيء المعقد (وهذا هو في الواقع علامة بارزة في مهمة لتحديد التشريح)، نحن بحاجة فقط حول 750 حالة كل مجموعة بيانات استغرق فقط حوالي ساعة.

في هذه الحالة، ونحن نستخدم اليدوي مجموعة علامات من الاختبارات لقياس النتائج. من ورقتنا في:

وبالنظر إلى علامات استفهام على كسر يتطلب عدة أشهر، والإنفاق إضافي واحدة أو ساعتين للحصول على مجموعة بيانات نظيفة هو ثمن قليل لدفع. ويمكن للنظام نقبل الآن أي صور السريرية، ويمكن أن تستبعد غير ذات صلة أو ذات جودة منخفضة صورة تلقائيا من خلال الاستفادة من معرفتنا. هذا هو نظام الذكاء الاصطناعي الطبي جميع الصور في حالة كيف يمكن للتطبيقات في العالم الحقيقي، إلا إذا كنت ترغب في استئجار شخص للتعامل مع النموذج الخاص بك وتحليلها.

ملخص

ونحن نعتقد أن عمق الشبكة العصبية الإنسان وحل المشاكل البصرية كذلك، طالما هناك بيانات كافية. ومع ذلك، "بيانات كافية "يعتمد إلى حد كبير على المهمة صعوبة.

إلى تحليل الصور الطبية فرع من المشكلة، هو عندما نبني مجموعات البيانات الطبية غالبا ما تحتاج إلى حل المشكلة، فإن مهمة بسيطة جدا، مما يجعل من مشكلة سهلة جدا لحل مع كمية صغيرة من البيانات. عادة، وهي المرة نموذج فقط أقل من ساعة واحدة لتحديد الصورة، ولكن الطبيب يستغرق عدة ساعات لكل مجموعة البيانات ل المعالجة اليدوية .

كقارئ واقية للأسلوب وشكرا لقراءة بلدي بلوق، لقد قدمت مجموعة من حوالي 430 صورة سيئة عن التسمية، لاستبعاد مجموعات البيانات CXR14، واقترح أن استبعاد الأطفال دون سن 10 سنة من العمر حوالي 1400، إلا إذا كنت تعرف حقا لماذا كنت تريد أن تبقي هذه البيانات. هذا لا يغير من نتائج أي ورقة، ولكن وضوح البيانات صورة مضبوط على أعلى مستوى ممكن.

وفي الختام قدمت هنا لم يكن لديك أي الابتكار التكنولوجي، والذي هو السبب في أنني لا أكتب أوراق رسمية الأسباب ذات الصلة. لكن بالنسبة لأولئك منا الذين يقومون ببناء مجموعة بيانات جديدة، ولا سيما الأطباء لا تجربة التعلم العمق، وآمل أن يكون هذا قد يثير بعض الأفكار حول البرنامج 2.0 كيف يمكن حل المشاكل البيانات الخاصة بك مع النظام من الطريق، لأنه من دليل هذه الطريقة أكثر لتوفير العمالة. في الوقت الحاضر هو العقبة الرئيسية لنظام AI الطبي المدهش هو التكاليف الباهظة لتنظيف والبيانات جمع، في هذه الحالة، وعمق الشبكات العصبية هو في الواقع لا تستخدم كثيرا.

راجعت جميع ملفات الصور بلدي في مستكشف ويندوز!

ويعلق عنوان بريدي في نهاية هذا بلوق وظيفة، أتوقع كاشف تناوب في الفضاء بلدي.

أنا فقط أريد أن أرى حالتي نقله إلى مجلد جديد، ثم قم بفتح مجلد (باستخدام "رمز كبير" وضع العرض). هذا هو حوالي ربع حجم ارتفاع الصورة من الشاشة، ولكن في معظم شاشات كبيرة بما فيه الكفاية ليتم الكشف عن والدورية الكبيرة الأخرى استثناء. عندما كنت مع كبير علامة غير طبيعية صورة، جميع الأمثلة أنا فقط اضغط على السيطرة مزدوجا فوق المجلد، ثم قطعوا / صقه في مجلد جديد. كيف لي ان تفعل ذلك كل ساعة 1000 معالجة البيانات سر.

وينبغي أن النظام Janky مثل هذا، مثل ذلك من اتفاقيات إعادة الشراء الإنترنت أو معظم ما يكتب يكون أفضل مني بكثير.

كود الثعبان يستخدم لنقل الملفات بسيط جدا، ولكن عندما أقوم ببناء البيانات هو رمز الأكثر شيوعا، حتى ظننت أنني يجب أن تتضمن ما يلي:

نقاط البيع = rotation_labs

في هذه الحالة، rotationlabs هو dataframe الباندا، فإنه يخزن اسم مؤشر صورة / ملف وقضية تنبؤات النموذج. أنا وضعت في مجموعة فرعية من dataframe فقط أمثلة إيجابية.

لأنني في نقاط البيع :

fname = "F: / cxr8 / الصدر الاشعات السينيه / صور /" + ط

shutil.copy (fname، "F: / cxr8 / بناء البيانات / تناوب /")

ترتبط كل من هذه لنسخ صورة إلى ملف دعوت "التناوب" مجلد القيام به.

ثم يمكنني أن أذهب إلى هذا المجلد لنرى. إذا فعلت بعض إدارة اليدوية، كنت ترغب في إعادة قراءة هذه الصور خارج، ثم أنها بسيطة جدا:

new_list = os.listdir ( "F: / cxr8 / بناء البيانات / تناوب /")

وليام غيل من بلدي حاليا المؤلف المشارك في هذا الصدد. ونجح في الحصول على وظيفة أبحاث ما بعد التخرج وتركز ML مايكروسوفت الآن على قضايا اللغة. انه يستحق الاهتمام.

وأنا أعلم أنني عدت لإصلاح هذه التسميات لبعض الوقت، ولكن فقط بسبب بلدي الدكتوراه وكان على الرف. في الواقع لقد تم دراسة إعادة تعريف البيانات، لذا يرجى الالتفات إلى هذا بلوق.

[] تاريخ المجتمع

جي وون AI صناعة التكنولوجيا + تجنيد المجتمع الجديد، رحب هبطت طلاب + AI صناعة تكنولوجيا الفائدة، بالإضافة إلى ليتل مساعد مايكرو إشارة: aiera2015_1 في المجموعة، وإذا سيدعى في المجموعة المعتمدة، تأكد من تعديل المجموعة بعد الانضمام إلى المجتمع الملاحظات (الاسم - الشركة - فرص العمل، مجموعة المهنية للمراجعة أكثر صرامة، يرجى فهم).

SHHH، انها مجرد حلم

"جلوبل AI قائمة رقاقة" غاب عن شركات البر الرئيسى العشرة الأوائل، هواوي، الكمبري، الأفق الاختراق

أنا على وظيفة | قمت بجمع "خمسة" حتى الآن؟ الشرطة ترسل لك "خمسة"، لم تتخذ أي بفضل!

LAZADA: طعم أول من جنوب شرق آسيا علي جعلت الرياح و

"2 الصورة الرمزية" العودة! الثابتة والعتاد في عام 2020، تشانغجياجيه أن النار!

سريع المفضلة! مهرجان الربيع جيانغشى تجنب حجب شرطة المرور يعلمك هذا التفاف! هناك معلومات هامة ......

الرعد وانغ هاى فنغ، شي ياو يون وغيرها من الذكرى ال120 من على الطريق، وفرع شمال الرسالة طليعة

عرض الفضائل التقليدية للأخلاق حضارية يناير - مركز بلدية هانتشونان للسيطرة على الأمراض والوقاية منها 2018 محاضرة أخلاقية

جاء Dilly ريبا لكمة! جيانغسو وتشجيانغ رائع B & B Top8، مجنون القلب!

المنطقة ينغيوان نيوزيلندا الرحيق لتزايد اثنين من تكنولوجيا الإنتاج الرئيسية

الولايات المتحدة قصف من PDA، فأنت تستحق أن ترتيب رحلة لهما

I حامض، ونفس الشيء للذهاب الى اليابان لرؤية أزهار الكرز، والفرق هو قليلا كبيرة؟