حصريا | بيانات حركة صحة الشعوب من أول صيني يفوز تجربة منافسات الفرق للسهم (عنوان مشترك سباق نموذج مفصل

تسينغهوا كبير البيانات "البطولة تبادل الخبرات" سلسلة محاضرات الفريق الفائز هو تبادل الأحداث الهامة والتاريخ الشخصي للحقول إدخال البيانات الكبيرة في الداخل والخارج وكسب تجربة هذه المسألة، نحن مدعوون ل مسابقة تحدي PHM البيانات في تاريخ العقد الأول من الصين البيانات المحلية تتألف بالكامل من الفريق بطولة النخبة - فريق كونلون البيانات K2 القائد الذي كونلون البيانات كبير العلماء بيانات تيان تشون هوا ممثلين الدكتور وأعضاء الفريق يوجيا يانغ ، وجرى تقاسم الضيوف اثنين معك تحليل البيانات الكبيرة الصناعية لكيفية نموذج آلية التكامل العضوية ونماذج التعلم الإحصائية، و 2017 PHM التحدي بيانات لقب البطولة مفصلة.

الأحداث القادمة المقبلة: 29 نوفمبر، فإننا ندعو إلى CIKM AnalytiCup2017 الدور ربع النهائي بفضل "التنبؤ بالمستقبل استنادا إلى صور رادارية لهطول الأمطار" النموذج، بأغلبية ساحقة على عدد فريق واحد تسينغهوا الغرير ( ياو تشن يى، لي تشونغ جيه )، وسوف سلوك مفصل تفسير وحصة الجمهور ومن حيث ملامح اللعبة، والهندسة المعمارية الخوارزمية، والتدريب نموذج. فتح باب التسجيل للحصول على معلومات الحدث وصلات: تسجيل | 2017- استنادا CIKM AnalytiCup الصور هطول الأمطار الرادار للتنبؤ بالمستقبل تبادل الخبرات المنافسة.

وقد جمعت البيانات التالية من THU المدرسة:

رئيس بيانات كونلون البيانات عالم تيان تشون هوا

أولا، كبيرة خلفية صناعة البيانات والخلفية مباراة اللقب

تيان تشون هوا: المسابقة هو آلية لتشجيع البحث وتبادل الناس، وتركيز مختلف من كل حدث. في المسابقة KDD-CUP، والموضوع هو شائع نسبيا، وانخفاض الحواجز أمام دخول الموظفين، لذلك سيكون هناك الكثير من الفرق للمشاركة في قمة النهائي قليل هي أساسا اثنين أو ثلاثة منازل عشرية من المنافسة. ويركز PHM على القطاع الصناعي، وعادة ما وصف محدد نسبيا للمشكلة، والحاجة المشاركين من فهم آلية من الصناعات منها.

اعتبارا من عام 2008 وحتى الوقت الحاضر، ويركز بشكل كبير على حركة صحة الشعوب موضوع بعض من المكونات الرئيسية لهذه الصناعة. الطيران المحركات التوربينية، علبة التروس، وأدوات الآلات ومراكز، وقياس أكواب على طاقة الرياح داخل الصواري، واضعة تضم جهاز فشل التشخيص وفقا لبعض النباتات، مثل لقب الماضي رقاقة الكيميائية الميكانيكية لplanarization أشباه الموصلات عملية الإنتاج تصنيف غير طبيعي، بما في ذلك أيضا لقب هذا العام في السيارة السكك الحديدية التخميد (تعليق) نظام تشخيص الأخطاء.

هذا التركيز على صناعة الأحداث، ولا سيما خطأ معدات التشخيص، وتصنيع المعدات المتطورة. المتنافسين الماضي ينقسم أساسا إلى فصيلين، هو واحد الجامعات، بما في ذلك جامعة ميريلاند، جامعة سينسيناتي، وما إلى ذلك، في السنوات الأخيرة، وأداء أكثر بروزا هو جامعة سيول الوطنية، جعلت هذا العام أيضا المركز الثالث. وبالإضافة إلى ذلك، هناك العديد من المؤسسات العسكرية، مثل لوك مارتن، NASA، الخ، ولكن أيضا مضنية في حد ذاته SAS وغيرها من شركات تطوير البرمجيات. وعموما، PHM المشاركين في الحدث من الجامعات هو نصف أساسا ونصف من الصناعة.

لماذا نحن تشعر بالقلق إزاء هذا السباق ذلك؟ هذه الأهداف الوطنية المتصلة الصناعات التحويلية عام 2025. تصنيع في الصين في عام 2025، فإنه يحمل هذا المنصب المهم في نهاية عالية صناعة تصنيع المعدات. بلد تصنيع قوية، لا سيما في المعدات عالية نهاية صناعة تصنيع أعلاه، بما في ذلك أدوات الدقة آلة، المعدات البحرية، النقل بالسكك الحديدية، وكذلك الأقمار الصناعية والطائرات الطيران والجوانب الأخرى، بما في ذلك كونلون الأصدقاء من كل وقت في الاهتمام والمساعدة مع الصناعة التنمية.

قلق آخر هو الغرض من هذه المسابقة هو ما نريد أن يمارس فريق شاب وتحليل البيانات، وتركنا لهم التعلم وتبادل بعض المنافسة في هذه الصناعة. من التجربة، يمكن للصناعة حل تحليلات البيانات الكبيرة أساسا ثلاث فئات من المشاكل. الطبقة الأولى من المعدات عالية نهاية الصناعة التحويلية، ويمكن ان ينقض مشكلة الى الفئات التالية، والعمر المتبقي للآلة يمكن أن تعقد منذ فترة طويلة، ثم كم من الوقت في حاجة إلى إصلاح، تحذير فشل لم قبل لا تفشل، والاكتشاف المبكر لل والتنبيه، وجهاز الكشف عن شذوذ تضم، والتشخيص خطأ من الشذوذ، وجهاز تحديد المواقع، عملية تحسين وصيانة، من خلال تحليل البيانات، وتحسين الخدمات اللوجستية، وبعض الطريق، لتعزيز كفاءة العمل لإرسال التشغيل الفعلي والصيانة.

ورشة العمل الداخلية، ونحن نأمل في زيادة الإنتاجية وجودة الإنتاج. كما هو الحال في صناعة الكيميائية التي، كيف يمكننا تحسين الإنتاجية من خلال تحليل البيانات الفعال للغاز، وكيفية تحسين الكفاءة التشغيلية للنظام بأكمله من خلال تحسين المعلمة.

كتلة الثالث هو صناعة الإنترنت، مع كلمات للحكومة أن الإنترنت +. مفهوم صناعة الإنترنت، بما في ذلك الإنترنت أكثر لتغيير نموذج الأعمال التجارية، بما في ذلك التغيرات في العمليات التجارية، وتحليل البيانات تلعب دورا داعما في الخلف. هنا لا تمثل نفس البيانات في حل المشاكل وتحسين العمليات في الدور القيادي أنها لعبت دورا كبيرا بدعم والطاقة المساعدة على التنبؤ بشكل أفضل جيل الإنترنت والاستهلاكية الطاقة الجديدة، وتحسين جدولة الأمثل، الخ .

وفيما يلي بعض الحالات الخاصة:

الحالة الأولى من طاقة الرياح، هو موضوع مسابقة كبيرة الصينية الصناعية بيانات هذا العام - مع تحذير والعتاد مكسورة. جير مع ثلاث شفرات متصلا التوربينات، عندما تكون الرياح، شفرة لا يمكن أن يكون الرياح تماما، يتجاوز وإلا فإن قوة المولد تصنيفا، ومولد مزيد من حرق أو خط، هو الملعب اللازم. هو الدافع وراء عملية الملعب بواسطة محرك متغير مع العتاد وثم دفع أكملت شفرة، إذا والعتاد مع حرية حركة شفرة كسر، قد يؤدي إلى الأبراج وحرق، وتسبب كوارث ثانوية. لذلك نشعر بالقلق المصنعين المشجعين آلة وأصحاب حول تحذير لا يمكن كسرها قبل حزام العتاد.

السبب الجذري للضرر التعب مع والعتاد، أو الشيخوخة من المطاط. ونحن قد تعتقد أن هذا هو ما تبقى من عمر المشكلة، على أن تفعل مع مبادئ التعب الميكانيكا، ولكن للأسف جدا، ومصنعي توربينات الرياح في البلاد حوالي مليوني وحدة من المروحة، تنشأ المشاكل الرئيسية مروحة في غضون عام قد يكون قليلا عدد، في حين أن كل مروحة لا يمكن أن يكون البيانات من البداية إلى النهاية، لذلك أريد دورة حياة البيانات، والآن غير قادر على القيام به.

وهناك اعتبار آخر هو أن لا تظهر الأعراض، قبل الذهاب إلى قطيعة مع والعتاد، وغالبا ما يكون هناك ظاهرة فضفاضة، يمكننا تخمين على أساس هذه الظاهرة إلى حد ما من خطر ما إذا كان سيتم كسرها. ولكن في منتصف هذه العملية هناك وضعا معقدا جدا: الرياح ومنطق السيطرة والمروحة العامل الأكثر أهمية، ولكن الرياح هو متغير خارجي، المتغيرات الخارجية هي أهم العوامل في هذه القضية، كيف لنا أن لا نحكم ببساطة؟ أن نقول إن المؤشر الأكبر هو غير طبيعي. سرعة الرياح مؤشر كبير جدا قد يكون سبب، ويمكن أيضا أن يكون سببه منطق السيطرة الفقراء، لذلك يجب علينا ان نضع مجموعة متنوعة من الظروف بصورة منفصلة، من أجل القيام ببعض تحذير.

في هذه الحالة، يمكننا تحقيق أخيرا الإنذار المبكر ثلاثة أيام مقدما. في الرسم البياني المقدمة، المحور الأفقي هو الوقت، والمحور الرأسي هو خطر. من الناحية النظرية، بعد تزايد خطر، ينبغي أن يكون اتجاه مستقر نسبيا من مخاطر عالية، في حين أن الجزء الأوسط من منحنى الفعلي ما زال ينخفض، وإنما هو بسبب الرياح الصغيرة عندما يكون السبب من العتاد مع القليل من العمل. على الرغم من أننا النظر فيها قبل وبعد تأثير التنعيم، لكننا ما زلنا لم نخرج من التمييز، لتشمل هذه التغييرات أيضا بعض العوامل الأخرى. فعلا القيام المشروع، وهناك عينات إيجابية وسلبية مشكلة الخلل الخطيرة. الخلل وإلى أي مدى؟ عشرات الآلاف من توربينات الرياح، والتي تراكمت لديها ثلاث إلى خمس سنوات، فقط 10 يمكن العثور عليها ضمن المشاكل البيانات المطابقة. وذلك على الرغم من كمية البيانات في هذه الصناعة، ورأينا كبير جدا، ولكن في الواقع تفعل استخراج البيانات، وليس ذلك بكثير سهلة الاستخدام عينات إيجابية. وهناك عدد كبير من البيانات العادية، مما أدى إلى اختلال خطير العينات الإيجابية والسلبية، التي تشمل حتى إنذار كاذب.

والثاني هو مثال على حقل نفطي. نريد أن نحل المشكلة هي: خط أنابيب مدفونة في الأرض، وإذا حدث منتصف هذا التسرب النفطي خط أنابيب، ونحن لا يمكن الكشف عنها في الوقت المناسب. إذا كان خط أنابيب الغاز الطبيعي، وتسرب بل قد يسبب انفجار، فإننا لا يمكن الكشف عن وانتقل إلى هذا المكان في الوقت المناسب. طريقة واحدة لمعالجة هذه المشكلة هي تطبيق مبادئ موجة ضغط سلبي، بالطبع، يمكننا أيضا استخدام الألياف البصرية أو غيرها من الوسائل. عندما مشغلي النفط الكورية الجنوبية لا تريد تثبيت أجهزة استشعار، بالإضافة إلى ذلك لأن أجهزة الاستشعار لديه من القماش الجيد، وأنه من المستحيل أن وضع حفر الخنادق الألياف، ويمكننا القيام به فقط مع الضغوط الحالية استشعار تسرب الكشف، واستخدام مبدأ موجة الضغط السلبي.

المبدأ هو أن موجة ضغط سلبي، عند حدوث تسرب هبوط الضغط لحظية، في حين أن انخفاض الضغط سوف تشكل موجة ضغط سلبي (نوع من القص)، وبسرعة نحو 1.2 كيلومتر في انتشار الثاني نحو كلا الجانبين. على فترات من 10 كيلو مترا من أجهزة الاستشعار اثنين، ثم انتشرت أكثر من عشر ثواني. إذا تسرب ليس بين أجهزة الاستشعار اثنين، ثم قيم القياس من أجهزة الاستشعار اثنين سينخفض الفارق الزمني ثابتة نسبيا، لأن سرعة انتشار في منتصف نفس المتوسطة، مثل الكيروسين في نفس سيطة، هو نسبيا مستقرة. لذلك، طالما أننا نعرف الفاصل الزمني بين أجهزة الاستشعار في استجابة لانخفاض الضغط على موضع نقطة تسرب ويمكن حساب.

بالطبع، لديها هذه المشكلة أيضا اثنين من الصعوبات. A دقة تحديد المواقع، ونحن في الواقع الحصول على بعض من إشارة البيانات الأصلية، وحصلنا على إشارة أولا تصفيتها، إذا كان المرشح من الصعب جدا، وتفقد دقة تحديد المواقع؛ مرشح وخفيفة جدا، والذي مجرور معلومات كاذبة عن أكثر من ذلك. في النهاية كم وتيرة تصفية وضع مناسب؟ متطلبات تحديد المواقع، وكان تردد المتوسطة الخلفي 0.4 هرتز، وضعنا مجموعة مرشح إلى 0.8 هرتز. وقد اكتشف أنه طالما هذه النقطة وصلنا إلى اليمين، مع وجود تأثير فلتر الخطي سوف تكون جيدة جدا، بالمقارنة مع المويجات هو أيضا نفس الشيء تقريبا. مع الأخذ بعين الاعتبار استخدام الموقع، وأخيرا باستخدام فلتر الخطي. في المركز الصناعي، طالما القبض على التناقض الرئيسي، دقة الخوارزمية لن تكون سيئة.

والسؤال الثاني هو أكثر صعوبة للتعامل مع إنذار كاذب. يتأثر عيب واحد من استخدام موجة ضغط سلبي بواسطة ضغط الزيت والديزل نقل والبنزين ووقود الطائرات، في حد ذاته في ظل هذه الظروف ليست هي نفسها ضغط الزيت، والنفط وسيطة تحتوي على بعض من هذه الأنواع من فقاعات، وانفجار فقاعة، و وسوف تؤثر على ضغط العائمة، وهذا تعويم نفسها أمر طبيعي. وبالإضافة إلى ذلك، سيكون هناك بعض الوقت إلى أسفل ظاهرة دبابات، عندما جرة واحدة كاملة، لجرة فارغة ستنخفض على الفور في الضغط، مثل التغيرات في حالة طبيعية، وانخفاض الضغط الناجم عن تسرب تسبب أكثر بكثير انخفاض الضغط بشكل كبير، الأمر الذي سيؤدي في وضع مزعج للغاية - ناقوس الخطر كل يوم. إذا كان هذا النظام للموظفين في الموقع مع واحد على الاطلاق لا يجرؤ الاستخدام.

الطاقة القصوى من الأكاذيب مشروعنا في كيفية قضاء استراحة انذار كاذب بها، طريقة واحدة هي لتثبيت المزيد من أجهزة الاستشعار في نفس الوقت لأن احتمال تدخل إشارة ضوئية وإشارة الضغط هو صغير جدا، لذلك سيتم حلها، ولكن في مثل هذه الطريقة العميل أمر غير مقبول. ثم تحليل البيانات ماذا يمكننا أن نفعل؟ في الواقع، انخفاض ضغط مختلفة يسبب فإن شكل إشارة تكون مختلفة قليلا، ومطابقة نمط والتعدين، ويمكن أن تقلل من انذار كاذب إلى حد ما. في الواقع، وتحليل البيانات، إذا كنت ترغب في نموذج المتاحة فعلا لنا المطالبة في أكثر الأحيان هذه الخوارزميات كشف، خوارزميات التنبؤ، خوارزميات التنقيب عن خطأ، ولكن كيف لتصفية إنذار كاذب، وإذا كان بعض من إشارات البيانات لا نستطيع لا حلها عن طريق وسائل بديلة.

تحليل البيانات من أجل حل المشكلة بشكل عام، هناك نوعان من الأفكار، واحد هو محض الطرق التي تعتمد على البيانات، واحد هو البيانات وآلية مع الطريقة التي نستخدمها في المقام الأول في القطاع الصناعي هو الفكرة الثانية.

إذا كانت العينة عادة ما تكون كافية بما فيه الكفاية كاملة، يمكننا وضع البيانات رمى التعلم العميق، نستمدها من الدقة لدينا الأساس، ومن ثم ميزات معالجة-إعادة لمزيد من الاستكشاف. لأنه إذا كمية أكبر من مشكلة عينة البيانات، وأنه من الأسهل لوصف والتعلم العميق بطريقة بسيطة نسبيا، في النموذج سوف تحصل على نتائج، في حين أن النتائج ستكون سريعة نسبيا.

على سبيل المثال، وهي مادة كيميائية في مجال الفحم. نضع الأكسجين والرماد (الفحم أو الطين)، التي أطلقت في درجات الحرارة العالية فرن تغويز، وأول أكسيد الكربون والهيدروجين يمكن أن تتولد لإنتاج غاز الميثان فعالة أو الغازات الصناعية الأخرى. تقريبا كل الفحم كمادة أولية (وليس الوقود) صناعة الكيميائية يحتاج مثل هذه العملية تغويز تمهيدا لهذه العملية. ثم أصبح المعلمات عملية لتحسين عملية تغويز الجميع البحوث حريصة جدا.

عملية تغويز هي الآلية، مثل المعادلات الحرارية، بما في ذلك معادلات التفاعلات الكيميائية، وما شابه ذلك. ولكن لماذا لديهم الآلية الفعلية ولكن لم يكن لديك الوصول؟ بسبب هذه الآلية على واحد من ناحية تبسيط أكثر، وحتى بعد التبسيط، بعض المعاملات التي هي في الواقع جدا، نادرة جدا. لذلك أبدا على استعداد للقيام بأعمال تجارية آليات المكافحة الكيميائية الطريق. في مثل هذه المشكلة استخراج البيانات، يمكننا أن عملية فقط على شكل مربع أسود، لكننا سوف ترتيب هذا الامر من العوامل الهامة التي الآلية، من خلال المدخلات والمخرجات، من عمق التعلم، من خلال عدد من التعدين نمط، لخصت بعض المعرفة. ثبت، وبهذه الطريقة سيكون قادرا على زيادة فعالية معدل إنتاج الغاز من نحو 1.4 أو 2. ماذا يعني ذلك 1.4؟ انها ما يقرب من 10 في المائة سنويا من الفحم أرباح الصناعة الكيميائية أو حتى 20.

تحدثنا عن المجال البيولوجي أكثر مشكلة، ونحن نعلم فقط أن هذا سوف تنمو الفطريات الخيطية داخل أو تنمو لتصبح ريدات، والآن للدراسة في س س س س درجة الحرارة والرطوبة اللاهوائية أو رد فعل الهوائية. ونحن نفعل تحليل البيانات، وبتمشيط الشيء الأكثر أهمية عدة عوامل، التي العوامل هي عوامل لا يمكن السيطرة عليها، والتي هي العوامل المتغيرات الخارجية (أي، يمكن لهذه المتغيرات تؤثر بشكل كبير على رد الفعل، ولكن لا يمكن السيطرة). إذا كانت العوامل الرئيسية في الأساس يمكن قياسها، ودقة يمكن أن تكون، ثم هذه المشكلة قد يذهب الحل. قبل أن تلمس بيانات الصناعة، فمن الصعب أن نقول لن يكون هناك تأثير أو حلا كاملا، ولكن إذا لم يكن كذلك، لا تعرف أبدا ما نعم الحد. ذلك الشيء الوحيد الذي فعله هو لاستكشاف البيانات، من خلال فهم آلية، للاستيلاء على المتغيرات الرئيسية وتمشيط.

الآن تتركز استخراج البيانات التقليدية عموما في مجالات الأعمال التجارية، مثل تحليل المبيعات، صور العملاء، أو بعض المشاكل اليقين. إعطاء هنا مثال على التنبؤ بالطلب قطع الغيار، وهي الشركة المصنعة من المشاكل الميكانيكية التي تواجه المشروع. من أجل تحسين جودة الخدمة، والمصنعين بتخزين حولها، ثم المكاتب الإقليمية تميل إلى بنشاط Yahuo، والضغط على نحو أفضل، على أي حال، فقد شراء كميات كبيرة أيضا لتقديم الأفضل لك. وقال الصانع آلات البناء مقر العمل المعنية لا يمكن التنبؤ بدقة كل شهر في مكاتب أو المبيعات الإقليمية في الأيام العشرة المقبلة عن مدى، وترك العامل المضاعف من 1.5، ومن ثم النظر في تقييم الفرع الإقليمي العام ، يمكنك منحه أفضل الشحنات، وعلى الرغم من انه يطبق ذلك بكثير، وأنا لا تمنح بالضرورة.

في الواقع، في دراسة مشكلة الصناعية الحقيقية، فمن المهم عدم جعل نموذج سهلة الاستخدام في 80 من الحالات، ولكن لفهم هذا النموذج لدينا لا يمكن أن تستخدم تحت أي ظرف من الظروف؟ في هذه المشكلة، وهناك العديد من العوامل، أولا وقبل كل والمشكلة الحقيقية تكمن في تأثير عطلة، عيد الربيع من العوامل مثل كيفية التعامل معها. وأكثر صعوبة للتعامل مع بعض الحالات غير معروف، مثل Yahuo. تأثير هذه العوامل، لا يمكننا تصفية شاملة، لكنها تبقي المتضررين. وإذا كان هذا الوضع بأنه حالة طبيعية، والتنبؤ المقبل، فإننا سوف تزيد من توقعات كمية، وهذه المرة ليس بسبب خوارزمية لدينا يتطلب قيمة تقلبات طفيفة يصبح لا يمكن السيطرة عليها.

مسألة صعبة أخرى هي كيفية تحسين التنبؤ مبكرا، هل من المتوقع الكثير من خوارزميات التنبؤ على أساس الاتجاهات السابقة، لكن في بعض الأحيان في تاريخ البيانات لا تعكس اتجاهات هامة. بالطبع، يجب أن يكون خوارزمية أيضا عملية التكيف، ولكن المشكلة هي التي يمكن أن تقدم قليلا، وليس بعد شهرين أو ثلاثة أشهر قبل نقطة في الوقت المناسب لنسبيا تعديل بدقة بتكيف، وهذا يعني أنه على توقع يستهان بها.

وبالإضافة إلى ذلك، لم يتم تعريف الكثير من الزبائن على سؤالك، ولكن تعريف كلا الطرفين معا، مثل وصول المتوقعة للحاوية، في نهاية المطاف ما يتوقع أن توقع ما هو حجم وهذين الجانبين قابلة للتفاوض. اذا كنا نستطيع التنبؤ أوقات وصول كل جولة متتالية هو عدد الشحنات، أساسا يمكن ترتيب لساحة الأمثل (سفينة الشحن التي صف واحد، كيف صف). هذا يعتمد جولات شحنة دقة التوقعات، ما اذا كنا نستطيع تحقيق 90، يمكنك أن تفعل ساحة الأمثل، واذا كنا يمكن أن يكون 80، لتوجيه الناس ويمكن ترتيب الفناء، إذا كان يمكن القيام به 60، أنه بهذه الطريقة لن يكون النظر، لأنه في الممارسة العملية الأساسية غير متوفرة.

تفعل محللي الأعمال في الواقع، وأحيانا بسيط جدا، طالما اغتنام التناقض الرئيسي، لعلاج المريض، وأحيانا الكثير من المتاعب، سواء بالنسبة للالساحة التجارية، في حين أن حجم الهدف. الآن هذه الصناعة تتقدم وتتطور البيانات الكبيرة من مختلف الجوانب، ولكن الوضع ليس كما كنا نظن أنه سيكون مثاليا. عندما يجري أيضا توصف الكثير من التكنولوجيا البيانات الكبيرة مثل الشركات التجارية بشكل مفرط، بحيث نتوقع الكثير منه، غير عملي.

تظهر واحدة من أداة لدينا التنمية الداخلية، هذه الأداة الآن، كنا نفعل يمكن تجميع عدد من الحالات، ونحن يمكن أن يكون نقطة عالية نسبيا بدءا بسرعة عندما تواجه مشاكل مماثلة. بما في ذلك البحوث والتكرار تطوير كيفية تشكيل، كيف كيف لتوجيه التنمية من الملاحظات الفعلية والبحث والتطوير النتائج إلى التحقق من صحة، وارتفاع في نهاية تشغيل المعدات في وقت متأخر والصيانة، وجدولة في بيانات حقيقية، بعض التحسينات المستقبل الصناعية، بما في ذلك جودة المنتج، الخ، الخ. وهلم جرا.

هل صناعة البيانات الكبيرة، من جهة أن يكون موضع تقدير أن الجانب الثاني هو جعل تحليل بيانات عن موقع مناسب، وليس كل القضايا هي مناسبة لتحليل البيانات، والموقف لا تضع منخفضة جدا، ونحن لا يمكن التشكيك في الحل، موقف وضع مرتفع جدا، وعلى الرغم من دقة عالية، ولكن ليس هناك قيمة الأعمال بدلا من ذلك.

اثنين، PHM عملية حل المشكلات والتفكير

رئيس مجلس النواب: أعضاء الفريق كونلون البيانات K2 تمثل يوجيا يانغ.

حسن: ارشادي النمذجة الرياضية، وتحسين الخدمات اللوجستية، وخوارزميات تعلم الآلة، لغة البرمجة R

حاليا المسؤول عن البيانات كونلون: منصة البيانات الكبيرة لمكتبة خوارزمية تحليل الصناعة وإطار لتطوير تحليل مواز، (اللوجستية) مشروع التحليل الطبقي الأمثل.

البطولة لقب الخلفية:

ينقسم سيارة السكك الحديدية إلى ثلاث، الطبقة الأولى هي الرباعي، طبقتين عربات الثانية والطبقة الثالثة هي جسم السيارة. في نظام تعليق السيارة السكك الحديدية المعروفة باسم تعليق، ويتكون من لفائف الربيع والتخميد بين التصويب وجسم السيارة يسمى نظام التعليق الثاني، بين الينابيع الهواء اثنين، وعجلات على التصويب والتخميد المكونات. النظام بأكمله في نقاط مختلفة وضعت ما مجموعه 18 الاهتزاز الاستشعار. في الصفحات التالية، فإننا ندعو مكان يسمى الربيع موقف التخميد، والنظام برمته هناك 12 وظيفة؛ والمثبط أو الربيع يسمى جزء من النظام برمته ما مجموعه 22 المكونات (ملاحظة: كل التصويب فقط الجزء العلوي من الربيع الهواء).

موضوعات المسابقة:

المنظمون منح بالتتابع ثلاث مجموعات البيانات: تمارين والاختبار والتحقق من الصحة. وهنا ترتيب اسم مجموعة البيانات من اسم مجموعة البيانات ونحن نفعل عادة عندما تم عكس استخراج البيانات، ولكن لا يؤثر على فهمنا للموضوع.

في مجموعة بيانات السجل بيانات التدريب 200 التجارب. أداء كل تجربة في المركبات المختلفة (1-200) ومسارات مختلفة (track1 / track2) وسرعات مختلفة (0.71 / 0.79 / 0.87 / 0.94 / 1.02 / 1.1 / 1.18 / 1.26) وتحت ظروف الحمل المختلفة (قيم مستمر) . للتجربة، وسجل بيانات المؤلف من 388 أو 216 (عدد السجلات التي قد تعتمد على كم طول المسار). كل سجل المقابلة ل(قطع المداري إلى أقسام صغيرة 388/216)، وسلسلة زمنية الاهتزاز التي سجلها كل أجهزة الاستشعار بعد القيم التحول مجال التردد في قسم مسار المقابلة في خمس العصابات، أي ما مجموعه 18 * 5 = 90 الميزات الأصلية. لذلك، في مجموعة التدريب البيانات، لدينا شكل 200 أو 216388 * 90 * 90 المواصفات. لكل جدول (كل تجربة، كل مركبة)، نحصل على "الصحة" / "غير صحية" التسمية.

لمجموعة اختبار البيانات، لدينا أيضا 200 البيانات التجريبية، يمكننا أن نعرف كل تجربة من السرعة والحمولة و50 سجل بيانات مدار التوالي، لكننا لا نعرف أي 50 سجل من خلالها تتبع منها الفترة. نحن بحاجة إلى إكمال التحدي يكمن في تحديد حالة استنفار كل تجربة (صحية أو غير صحية)، إذا صحية، لتحديد العنصر الخاطئ (1-2). ويمكن تقديم نتائج مرة واحدة في اليوم.

فإن دقة النموذج النهائي سيكون على مجموعة التحقق من صحة البيانات (واختبار ما شابه ذلك، ولكن يمكن أن تقدم فقط ما مجموعه ثلاث مرات النتيجة) من التجارب نموذجنا لتحديد الوضع المحسوبة.

الصعوبة الموضوع:

1. تأثير المتغيرات الخارجية: نظرا لمسارات مختلفة، والسرعة والحمولة، ويمكن اعتبار كل تجربة سيئة المقارنة بين مختلف عموما من التجربة.

2. سجل الاستشعار هو عملية ديناميكية. لعام مسألة استخراج البيانات، وحالة واحدة فقط من كل قيمة كل ميزة على قيمته في كل ميزة يشكل رقما قياسيا. ومع ذلك، في كل يتوافق المثال لهذه المشكلة هو جدول ثنائي الأبعاد، تضم عدد وافر من المزايا وعدد وافر من السجلات (تسلسل). نحن في مواجهة مثل هذه المشاكل، عموما كيفية التعامل معها؟

  • إذا لم يكن هناك اتجاه واضح بين كل وقت قياسي (من نفس السكان يمكن اعتبار)، يمكننا حساب إحصاءات عن التسلسل المباشر، بدلا من التسلسل الأصلي.

  • إذا كان هناك بين كل اتجاه وقتا كبيرا قياسي ولكن هذه المرة مع أي اتجاه بالنسبة لنا، وبعد ذلك يمكننا الخروج وإزالتها الاتجاه مرة الأولى، بعد إحصاءات إعادة حساب بدلا من سلسلة الأصلي، أو مباشرة إلى العمودي توسيع تسجيل تقسم إلى المزيد من الميزات، ممدود في سجل (لم تستخدم).

  • الحالة الثالثة هي الاتجاهات الزمنية واضحة ومفيدة، وبعد ذلك يمكننا وضع الاتجاه الوقت المستخرج، ثم بعد أي وقت من الأوقات مجموعات البيانات اتجاه للقيام ببعض من نفس العملية (التوسع، ...)، وأخيرا بعض الاتجاهات الوقت القيام به وحدها المعالجة.

    في هذه المشكلة، ونحن لم تستخدم تجسيد المبين أعلاه، ولكن تطبيق مبادئ وظيفة النقل التي شيدت من قبل النسبة بين الوقت المميز من ميل ضعيف الجديد (المسار الداخلي درجة التفاوت من عدم انتظام أي الاتجاهات الوقت هنا) ميزات تخدم غرضين، وأخيرا، لتبسيط هيكل البيانات عن طريق الإحصاءات.

3. نظام التعليق الترابط الداخلي القوي. حالة كل استجابة جهاز استشعار ليست سوى مكان واحد أو فرد أو أفراد الموقع نفسه لا يؤثر فقط على مراقبة أجهزة الاستشعار واحدة.

4. الخلل عينة إلى أقصى الحدود. بيانات التدريب مجموعة من التجارب كلها سليمة، وهو ما يعني أننا يمكن أن يتم إلا من خلال طريقة صف واحد (الشذوذ الكشف).

الحل:

1. لاختبار مجموعة التحقق من صحة البيانات أو تجربة، لم نكن نعرف أنها في المسار والبدء والمواقف نهاية. سوف تتأثر البيانات المتوفرة لدينا من درجة عدم انتظام المسار، ولذا فإننا المباراة الأولى على أساس تشابه المواقع المدارية.

  • لاختبار أو التحقق من صحة التجارب، على أساس افتراض "بيانات الاستشعار عجلة يمكن تسجيلها مباشرة درجة المسار مخالفة من رد الفعل،" نحن مطابقة على أساس التشابه مع البيانات موقف المسار الأصلي.

  • بعد تبين أن المسار يقع وبداية ونهاية التجربة، وشروط المفصل تجربة سرعة (فقط ثمانية سرعات، على كل تدريب عينة سرعة موحدة التوزيع)، ونحن مقطعة إلى تدريب مجموعة البيانات للبيانات التدريب لهذه التجربة مجموعة.

2. بعد دخولنا الكشف عن عملية الشذوذ.

  • أولا، نحن بناء النموذج المادي على أساس تحليل سلسلة استنادا إلى خصائص التشابه والارتباط (31).

  • بعد ذلك، ونحن الانحراف إحصائية بالنسبة لبيانات التدريب المقابلة لها مجموعة من التجارب من خلال تقييم صحة من التجارب لتحديد ما إذا كان اختبار تشغيل في حالة خطأ.

3. بعد خطوة الكشف عن شذوذ، نبدأ عملية المكان الخطأ.

  • أولا، النموذج المادي على أساس التحليل، يمكننا بناء علاقة مراسلات من الميزات والمواقع.

  • بعد إنشاء مشروع مشترك باستخدام نموذج قرار المراسلات والأمثل المعلمة الداخلية باستخدام المحاكاة العشوائية جدا (مونتي كارلو الطريقة).

  • يحكم على الشذوذ التجارب كشف يشتبه خلل، واستخدام نموذج صنع قرار مشترك نحصل على موقعين وفقا لأعلى خطر الفشل.

  • ثم نستخدم معيار أكثر استهدافا آخر لمراجعة ما إذا كنا انتقاء المكان الخطأ خطأ حقا (لاستبعاد انذار كاذب).

4. الحصول على موقع خطأ وخطأ التجارب النهائية، قمنا بتحليل النموذج المادي (وظيفة نقل) لتحديد مكان وجود خطأ عن طريق الخطأ "الربيع خطأ"، "التخميد خطأ" أو "خطأ هي" الرصاص.

المباراة الأخيرة، وحصلنا على دقة وحساسية 0.53930.885 في مجموعة اختبار البيانات. عند تطبيق النموذج على مجموعة التحقق من صحة البيانات، وجدنا تعميم قدرة قوية للنموذج، بمعدل دقيقة وصلت 0.825 في حساسية بلغت 0.525.

الاستنتاجات والخبرة:

1. المشكلة: تحتوي هذه المشكلة فقط الآلية الداخلية للهيئة جامدة ديناميات، ولا تتعلق بالآلية الكيميائية لمعرفة أكثر تعقيدا، لذلك هذا الموضوع في هذه الصناعة تعتبر بسيطة نسبيا.

2. آلية: الآن أيضا بحث وتطوير خوارزميات للبحث تلقائيا وميزات معالجة القولية، ولكن على حساب من الوقت المميز تعلم آلية معقدة عالية جدا، ومن المرجح أن تعلم لا يخرج، حتى لو كان ذلك يتطلب وجود مزيج من آلية لشرح التعلم. لذلك إذا أردنا أن نفهم بعض الآليات المعرفة ذات الصلة مقدما، فإنه يمكن انتزاع ميزات فعالة بطريقة هادفة، ويمكن أن تتراكم في الخبرة في مجال صناعة خاصة بها.

3. طرق: نظرا لأنواع مختلفة من أنظمة التعليق مركبة لديها بعض أوجه التشابه، بما في ذلك الربط الداخلي القوي هذا، لدينا وسيلة يمكن أن توفر فكرة جيدة يشبه الى مكان الحادث.

4. النتائج: هناك أعضاء من مناطق مختلفة من التشغيل الآلي، والرياضيات، والإحصاء، والكمبيوتر الخ فريقنا، كنا قادرين على يكمل كل منهما الآخر، لخلق نماذج أكثر شاملة ومبتكرة.

كلمات خلفية رد "1114" تحميل اثنين من المتكلمين نسخة PPT الكامل .

[قسم المالية] أسبوع واحد: 5 سهم المسؤول عن التمويل، حرب وشيكة

انتقلت! C لوه إنشاء عودة معجزة من الليل، جورجينا هامش الدموع!

فرشاة الثناء، انتقل إلى السجن؟ إيطاليا الحكم من العالم أول شبكة من الاستعراضات وهمية حالة

عمالقة التكنولوجيا 2016: يبدو أن سامسونج هي حقا أسوأ

الإصلاح قصة رائد 21: "90 عاما من جياو يولو" هونغ "

حصريا | مجال البيانات الكبيرة أدلة الذكاء الاصطناعي من الصاعد للتأهل لأعلى اللاعبين

C-لو الحرس البالغة من العمر 34 عاما محاربة الناس يؤدي إلى العبادة! انتقلت صديقته في البكاء، وهو ابن الصرخة

انتصار حرب المائة عام | الصيني العمال الترجمة القلم: دوما تعيين بغض النظر عن المدافع العدو، أعتبر أن من السهل

تحديثات ووهان سوق العقارات! الثلاثة المعروفة الاندماج وسيط، والمشترين لديهم خيار جديد وهان صباح

قراءة المقال التعلم العميق (مصادر التعلم المرفقة) | الحصرية

أول شجرة عيد الميلاد تشنغدو مركز الاسبوع الماضي الإضاءة تصل

وسانشو المقبل؟ خطوة عبقرية البالغ من العمر 18 عاما الى مانشستر سيتي شالكه يتطلع لمواجهة فريقه السابق في دوري أبطال أوروبا!