جرد من 10 أنواع من الانحدار: هناك دائما فاز قلبك

النص الكامل 2507 الكلمات، وعندما يكون التعلم مدى المتوقع 5 دقيقة

بالإضافة إلى عدد من النماذج الإحصائية وخوارزميات أخرى، الانحدار هو العناصر المكونة الهامة من آلة التعلم عملية ناجحة. عودة الأساسية هي إيجاد العلاقة بين المتغيرات، وآلة التعلم الحاجة إلى التكهن بنتائج بناء على هذه العلاقة.

من الواضح، أن أي مهندس مختص إيلاء الاهتمام لتعلم آلة الانحدار، ولكن هناك الكثير. الانحدار الخطي وخوارزمية الانحدار اللوجستي عادة ما يكون أول الناس للتعلم، ولكن هناك أنواع عديدة من الانحدار. كل نوع له أهميته الخاصة، وهناك أكثر سياق التطبيق المناسب. ذلك الذي الاستخدام هو؟

توضح هذه المقالة معظم نوع شائع من عودة مع الطريقة سهلة الاستخدام، ومواجهة المهام المحددة سوف تعرف أي واحد لاستخدام هذا.

1. الانحدار الخطي الانحدار الخطي

الانحدار الخطي هو الأكثر نوع نموذجي من العودة، ظهر منذ حوالي 250 سنة، وكما هو معروف المربعات الصغرى العادية (شريان الحياة) الانحدار الخطي وطريقة المربعات الصغرى. ويمكن استخدامه لحساب مجموعة بيانات صغيرة، حتى يدويا ويمكن حساب. تستخدم حاليا في الانحدار الخطي، ولكن ليس للمبادرة التنبؤ والتحليل الفعلية.

وبالإضافة إلى ذلك، بنية البيانات الحديثة في كثير من الأحيان من الفوضى، الانحدار الخطي سهلة "متخلفة": الانحدار الخطي الدقيق جدا. اذا كان النموذج تحسب بدقة لمجموعة من البيانات، ومجموعة أخرى من البيانات غير دقيقة للغاية، في حين ينبغي وصف نموذج الانحدار الخطي عام، وسوف تكون دقة غير مستقرة جدا في جميع الحالات تقريبا.

2. ريدج الانحدار ريدج الانحدار

حدود ريدج الانحدار هو الانحدار الخطي هو تحسنا هاما، وزيادة التسامح الخطأ، وكانت معاملات الانحدار لتعطي نتائج أكثر واقعية، وأسهل لتفسير النتائج. يتم استخدام الأسلوب تكرار البيانات من أجل حل مشكلة الارتباط المتبادل بين المتغيرات المستقلة (الخطية المتعددة).

سوف ريدج الانحدار استخدام الصيغة التالية لتقييم المعلمات:

3. لاسو لاسو عودة الانحدار

لاسو الانحدار والتلال الانحدار مشابه، ولكن معامل الانحدار (نموذج باستثناء بعض الرموز) هو 0.

4. المربعات الصغرى الجزئية الانحدار المربعات الصغرى الجزئية (PLS)

مقارنة بعدد من الحجج والملاحظات عندما المتغيرات صغيرة أو مستقلة عندما يرتبط بعلاقة متبادلة، PLS سيكون مفيدا. PLS حجة يمكن الحد، وأنها ليست ذات الصلة، على غرار تحليل المكون الرئيسي. ثم، هذه الحجج بدلا من البيانات الخام الانحدار الخطي.

PLS مع التشديد على تطوير نماذج التنبؤ، وليس لفحص المتغيرات. وتختلف عملية شريان الحياة، PLS قد تشمل عدد وافر من المتغيرات التابعة المتعاقبة. PLS الآثار المرتبطة اعتراف هيكل أصغر، والنمذجة المتغير التابع في نماذج متعددة المتغيرات.

المصدر: Pexels

الانحدار اللوجستي لوجستية الانحدار

ويستخدم على نطاق واسع الانحدار اللوجستي في التجارب السريرية لتحديد، أو تحليل الاحتيال - عندما المخدرات اختبار أو معاملة بطاقة الائتمان يمكن أن يكون شكل ثنائي (نعم / لا) متوفرة. الانحدار الخطي كما أن لديها عيوب المتأصلة، مثل التسامح مع الخطأ منخفضة، مجموعة بيانات الاعتماد، ولكن في العام الانحدار، أفضل اللوجستي، الانحدار الخطي يمكن تبسيط تبسيط نوع الحساب. بعض الإصدارات، مثل انحدار بواسون قد تحسنت، بحيث يحتاج في بعض الأحيان إلى أن تكون الإجابات غير الثنائية، مثل التصنيف، والفئة العمرية، أو حتى شجرة الانحدار.

6. البيئية الانحدار البيئي الانحدار

(تم تطبيق الانحدار إلى كل طبقة أو مجموعة) حالة تم استخدام الانحدار البيئي لتقسيم البيانات إلى طبقة كبيرة أو مجموعة، على سبيل المثال، في مقابل العلوم السياسية في السلوك الجماعي التقييم البيئي للناخبين على أساس البيانات المجمعة.

ومع ذلك، ينبغي أن نكون حذرين من "لعنة البيانات الكبيرة": إذا كانت عودة ملايين الإحصاءات، وبعض النماذج قد لا تكون دقيقة تماما، فإن نموذج يكون ناجحة للغاية (واصطناعية) نموذج صاخبة ثابت "هزم". لذلك، هذا النوع من العودة ليست مناسبة للأحداث التنبؤ المتطرف (الزلازل) ودراسة العلاقة السببية (الاحتباس الحراري).

7. النظرية الافتراضية الانحدار الخطي النظرية الافتراضية الانحدار الخطي

النظرية الافتراضية الانحدار الخطي والتلال الانحدار مشابه، ولكن ترتكز على توزيع جميع الأخطاء المحتملة عادة. وهكذا، على افتراض فهم أساسي من هياكل البيانات، فمن الممكن الحصول على نموذج أكثر دقة (لا سيما بالمقارنة مع الانحدار الخطي).

ومع ذلك، من الناحية العملية، عندما البيانات الكبيرة والمعرفة من البيانات الأولية لا يضمن دقة، بحيث يقوم هذا الافتراض على قيمة المترافقة، أي أساسا من صنع الإنسان، والتي هي من هذا النوع من الانحدار الكبير العيوب.

حساب المتغيرات الملحوظة:

أخطاء تتبع التوزيع الطبيعي:

8. quantile الانحدار Quantile الانحدار

تم استخدام Quantile الانحدار إلى الأحداث المتطرفة، بما في ذلك إدخال المتعمد للتحيز في النتائج، لتحسين دقة هذا النموذج.

9. الحد الأدنى من الانحراف المطلقة أقل الانحرافات المطلقة (LAD)

يشار الانحراف المطلق الحد الأدنى أيضا كحد أدنى الخطأ المطلق (LAE)، أصغر القيمة المطلقة (LAV)، والحد الأدنى المطلق المتبقية (LAR)، أو مجموع الانحراف المطلق L1 القاعدة حالة وأساليب معامل هو الحد الأدنى. وتضم لتقييم أخطاء عشوائية من القيم المقاسة القيم المجهول، وتقدير التمثيل ظيفة معينة (التقريب). الحد الأدنى لتبدو الانحراف المطلقة مثل الانحدار الخطي، ولكن بدلا من استخدام القيمة المطلقة من الساحة. لذلك، زادت دقة النموذج، وليست معقدة حساب.

10. المطواة اختزال المطواة اختزال (طريقة المطواة)

المطواة اختزال هو تجميع وتنقيح بيانات جديدة عن الانحدار. لم يكن هذا الأسلوب عيوب نموذجية من نوع العودة، ولكن يمكن أن توفر دقيقة للغاية مشكلة تقريب الانحدار، محلول مانع للخطأ، والحجج ذات الصلة، أو "الموضوع" يمكن استخدامها عند التوزيع الطبيعي.

هذا النوع هو مناسبة لأسود نوع خرطوشة خوارزمية التنبؤ الانحدار، التي هي قريبة جدا من الانحدار الخطي، ليس هناك فقدان الدقة، حتى لو كانت الافتراضات الانحدار التقليدية (متغيرات غير مترابطة، البيانات الموزعة بشكل طبيعي، والتباين المشروط هو ثابت) لأن طبيعة البيانات غير مقبول، فإنه لا يزال ويمكن استخدامه.

على افتراض أن العينات هي كما يلي:

في الاحتمالات والإحصاء النظرية، على افتراض هذا هو مجموعة من المتغيرات العشوائية المستقلة وتوزيعها مماثل، والبيانات التالية إلى الدراسة:

جون توكي (جون توكي) النقاط التي وردت في عام 1949 (أي "قانون المطواة") هي عينة تفعل الكثير من البحث، باستثناء ملاحظة واحدة (قبل وتعرض له النتائج التي سيتم استبعادها). العينة القوائم التالية تم الحصول عليها من البيانات الخام:

كل واحد له عينات ن الجديدة، وحجم العينة n-1، ويمكن استخدامه لحساب بيانات القيمة الإحصائية الاقتصاد القياسي الفائدة (حجم العينة ناقص 1):

الحصول على القيمة من خلال العد، ويمكن وصفها توزيعها على فهم التوزيع، كما هو مطلوب، متوسط، quantile، مبعثر والانحراف المعياري.

لذلك، وهو واحد لاستخدام الانحدار؟

إذا كان النموذج يتطلب المتغير التابع المستمر:

الانحدار الخطي هو الأكثر شيوعا والأكثر نوع المباشر للاستخدام. إذا كان هناك المتغير التابع المستمر، قد ترغب في النظر في أول نموذج الانحدار الخطي. ملاحظة، ومع ذلك، فإن الانحدار الخطي من مساوئ عديدة، مثل حساسة جدا إلى القيم المتطرفة والخطية المتعددة. في هذه الحالة، فمن الأفضل استخدام البديل أكثر تقدما الانحدار الخطي، ريدج الانحدار، مثل الانحدار لاسو والجزئي أقل الانحدار المربعات (PLS).

إذا كان النموذج يتطلب المتغير التابع القاطع:

يجب أن تكون باستخدام الانحدار اللوجستي. هذا النموذج هو الأنسب لثنائي المتغير التابع. قبل تنفيذ نموذج تصنيف أكثر تعقيدا، فمن الأفضل لاستخدام هذا النموذج. يمكن وضع بعض قيم المتغيرات الفئوية إلى مجموعات مختلفة وفقا لعدد الميزة. الانحدار اللوجستي لتحويل المتغير التابع، وبعد ذلك باستخدام أقصى طريقة تقدير احتمال وليس طريقة المربعات الصغرى لتقدير المعلمات.

إذا كان النموذج يحتاج إلى الاعتماد على المتغير التابع:

يجب أن تستخدم انحدار بواسون. تميل عدد البيانات لمتابعة توزيع بواسون، انحدار بواسون، وبالتالي مناسبة جدا. يمكن حسابها باستخدام متغير بواسون وتقييم الإصابة.

انتباه رسالة الابهام

معا نحن نشارك في التعلم وتطوير AI الجاف

ترحب منظمة العفو الدولية انتباه منصة الشنق كله من الطبقة سائل الإعلام "قراءة التقنية الأساسية"

ونظام لماذا iOS13 ترتفع؟ هذه الأسباب الثلاثة تجعل مسحوق الفواكه لا يمكن أن يرفض

AI وجه زرع الجديد "السحر"؟ وكشف الثاني للثقافة والتعليم استخدام FaceNet

شبه أشرف ثورة التعلم: ليأخذك للخروج من مستنقع البيانات الخالي من الملصقات

اليوم صوت الأساسية | الصناعة: من المتوقع أن يحدث العام المقبل آلة 5G ألف يوان

بايدو خسر امام علي؟ لى هاى فنغ، خسارة كل منهما في أول استعراض أكاديمي جولة

إذا نظرنا إلى الوراء على موظفي الصين AI تدريب: بدأت المعلمين يطالب بايدو "مجداف الطائرة" التدريب

آلة تعلم هذه القضايا الأساسية، يمكن أن الرياضيات لا تحصل

اليوم صوت الأساسية | اليوم؟ 5G الرخص التجارية الصادرة يوم 6 يونيو

السماح المتعلمين على تقدير! تايلاند التدفئة الدراسة، فرص العمل غير مؤكدة

إطلاق هواوي FusionData، نقطة الألم البيانات الكبيرة تختفي

آخر التايلاندية مكشطة الإعلانية، والآباء والأطفال الأصلي تريد أن تفعل

فهو 19 سنة طالبة جامعة تشجيانغ، وثلاثة أشهر من المكاسب WWDC 19 منحة دراسية