حصريا | شيدت باستخدام السيارات عالية الأداء ARIMA الوقت نموذج سلسلة (مع رمز بيثون)

الكاتب: ايشواريا SINGH

الترجمة: تشن يان

تصحيح التجارب المطبعية: دينغ NANYA

3400 كلمة المادة هي القراءة الموصى بها 10+ دقيقة.

تقدم هذه الورقة مفهوم ARIMA، ومع مجموعة من البيانات التي تنفذ في بيثون والتدريب R.

مقدمة موجزة

تشمل استنادا إلى البيانات التاريخية القائمة على التنبؤ الجيل القادم سعر آي فون، وميزات يمكن استخدام مبيعات فصلية، والنفقات الشهرية، فضلا عن مجموعة واسعة من المحتوى على الميزانية العمومية أبل: تخيل أن لديك الآن مهمة. كعالم البيانات، وكنت وضعت وتصنف هذه المسألة أي نوع من المشكلة؟ وبطبيعة الحال، السلاسل الزمنية النمذجة.

من التنبؤ بالمبيعات المنتج لاستهلاك الأسر التقدير والتنبؤ السلسلة الزمنية أي عالم البيانات يجب أن يعرف - حتى إذا لم يكن سيد - واحدة من المهارات الأساسية. يمكنك استخدام عدة أساليب مختلفة للتنبؤ السلاسل الزمنية، وسوف نناقش في هذه المقالة ARIMA السيارات أنها واحدة من أكثر الطرق الفعالة.

أولا، دعونا ننظر في في مفهوم ARIMA، ومن ثم الحصول على --Auto ARIMA. من أجل ترسيخ مفهوم، سوف نستخدم مجموعة من البيانات، وتنفيذ ذلك في بيثون وR.

دليل

أولا، ما هو السلاسل الزمنية؟

الثاني، وهي المرة طريقة التنبؤ سلسلة

ثلاثة، ARIMA الملف الشخصي

أربع خطوات تنفيذ ARIMA

V. لماذا ARIMA السيارات؟

ست حالات مع السيارات ARIMA تحقيق (طيران مجموعات بيانات المسافرين)

سبعة، السيارات ARIMA كيفية اختيار المعلمات؟

إذا كنت معتادا على طريقة شائعة والسلاسل الزمنية (على سبيل المثال، المتوسط المتحرك، تجانس الأسي وARIMA)، يمكنك تخطي مباشرة إلى القسم 4. للمبتدئين، وتبدأ مع القسم التالي، بما في ذلك وصف موجز لمختلف أساليب السلاسل الزمنية والتنبؤ.

أولا، ما هو السلاسل الزمنية؟

قبل أن نتعلم كيفية التعامل مع بيانات السلاسل الزمنية، يجب علينا أولا أن نفهم ما هو الوقت السلسلة، وكيف يختلف عن أنواع أخرى من البيانات. التعريف الرسمي للسلسلة الزمنية كما يلي: تم قياسها في سلسلة من نقاط البيانات الفاصلة الزمنية نفسها .

لفترة وجيزة، والتسلسل الزمني يشير إلى قيمة محددة في فترات زمنية ثابتة تحت التسجيل، يمكن أن الفاصل الزمني يكون ساعة، يوميا، أسبوعيا، كل 10 يوما، وما شابه ذلك. خصوصية التسلسل الزمني: ترتبط كل نقطة البيانات في التسلسل مع نقطة البيانات السابقة. دعونا تكون مفهومة أكثر وضوحا من الأمثلة التالية من هذا.

  • مثال 1:
لنفترض تحصل على قرض موظف من مجموعة البيانات (الجدول المبين أدناه) من شركة. هل تعتقد أن خط المرتبطة بكل صف أمامك؟ بالطبع لا! يعتمد مبلغ القرض على الوضع الاقتصادي الشخص وحاجته (قد يكون هناك عوامل أخرى مثل حجم الأسرة، الخ، ولكن بالنسبة البساطة، ونحن ننظر فقط إلى الدخل ونوع القرض). وبالإضافة إلى ذلك، لا يتم جمع هذه البيانات في غضون فترة زمنية محددة، ما هي الا عندما تلقت الشركة طلبات القروض ذات الصلة.

  • مثال 2:
نأخذ مثالا آخر. افترض أن لديك مجموعة من البيانات التي تحتوي على المستوى اليومي من ثاني أكسيد الكربون في الهواء (الصورة ادناه). ثم في اليوم التالي، ومستويات ثاني أكسيد الكربون يمكن التنبؤ بها من قبل العددية لم الأيام القليلة الماضية؟ بالطبع. إذا نظرتم يتم تسجيل كل يوم البيانات، ثم، بل هو الفاصل الزمني المستمر (24 ساعة).

الآن أن لديك الحدس، المثال الأول هو وجود مشكلة الانحدار بسيطة، والمثال الثاني هو قضية السلاسل الزمنية. على الرغم من أن السلسلة الزمنية تصدر هنا يمكن أن تستخدم أيضا في حل الانحدار الخطي، ولكن ليس هذا هو أفضل وسيلة، لأنه يتجاهل العلاقة بين هذه القيم، والقيم النسبية للالماضي. أدناه، ونحن نلقي نظرة على بعض الطرق الشائعة لإيجاد حل لمشكلة السلاسل الزمنية.

الثاني، وهي المرة طريقة التنبؤ سلسلة

هناك العديد من الطرق لأداء سلسلة التنبؤ الوقت، ونحن سوف تفعل مقدمة موجزة لهم في هذا القسم. المذكورة أدناه صفا مفصلا كود بايثون وفي جميع طرق يمكن العثور عليها في ما يلي:

سبعة أنواع من الوقت طريقة التنبؤ سلسلة (مع رمز بيثون): https://www.analyticsvidhya.com/blog/2018/02/time-series-forecasting-methods/

1. التنبؤ بسيط: في هذه الطريقة للتنبؤ، والقيمة المتوقعة تساوي تشير البيانات الجديدة قيمة النقطة البيانات السابقة. وستكون النتيجة خط مواز، حيث يتم توقع كل القيم الجديدة باستخدام القيم السابقة.

2. متوسط طريقة بسيطة: وأقل عرض متوسط قيمة كل القيم السابقة. هذا التوقع هو أفضل من أسلوب "توقعات بسيطة"، لأنها ليست نتيجة لخط مواز. ولكن في طريقة المتوسط البسيط، وتؤخذ جميع قيم الماضي في الاعتبار، وهذه القيم قد لا يكون مفيدا. على سبيل المثال، عندما طلب منه التنبؤ درجات الحرارة اليوم، ما عليك سوى أن تنظر في درجات الحرارة في الأيام السبعة الأولى، بدلا من درجة حرارة قبل شهر.

3. المتوسط المتحرك الطريقة: هذا هو تحسنا طريقتين الأولى. جميع النقاط السابقة لم متوسط، ولكن متوسط ن النقطة السابقة حيث بلغت قيمة المتوقعة.

4. المتوسط المتحرك الموزون الأسلوب: المتوسط المتحرك الموزون هو المتوسط المتحرك مع الأوزان، يتم تعيين قيم ن السابقة أوزان مختلفة.

تجانس الأسي بسيط: في هذه الطريقة، يتم تعيين وزن أكبر لملاحظات أكثر حداثة، وقدمت ملاحظات من الماضي البعيد أقل وزنا.

6. هولت (هولت) الخطية نموذج الاتجاه: وتأخذ هذه الطريقة في الاعتبار الاتجاهات في مجموعة البيانات. ما يسمى الاتجاه، مشيرا إلى زيادة أو خفض طبيعة البيانات. على افتراض أن عدد حجز الفنادق في تزايد كل عام، وبعد ذلك يمكننا القول أن عدد من البرامج تحفظات اتجاه متزايد. وظيفة التنبؤ هي وظيفة من قيمة والاتجاهات العملية.

7. هولت - وينترز (هولت وينترز) الأسلوب: تأخذ الخوارزمية في الاعتبار الاتجاه والبيانات الموسمية. على سبيل المثال، هناك عدد من الحجوزات الفندقية على ارتفاع في نهاية الأسبوع، وانخفاض خلال الأسبوع، ويتزايد كل عام، وبالتالي الاتجاهات الموسمية أسبوعيا والوجود النمو.

8. ARIMA: ARIMA تحظى بشعبية كبيرة النمذجة السلاسل الزمنية. ويصف العلاقة بين نقاط البيانات وأخذ الفرق بين القيم. ARIMA نسخة محسنة هو SARIMA (أو ARIMA الموسمية). ARIMA سوف نناقش بمزيد من التفصيل في القسم التالي.

ثلاثة، ARIMA الملف الشخصي

في هذا القسم، سوف نقدم لفترة وجيزة ARIMA، والتي سوف تساعد على فهم اريما السيارات. "دوام كامل سلسلة دروس" زوج من ARIMA الورق، (ص، س، د) معلمات، ACF، والتي تتجسد PACF التين وشرحا مفصلا.

ARIMA هي طريقة التنبؤ السلسلة الزمنية شعبية جدا، والتي تتكامل المتحركة (المتوسطات السيارات الرجعية المتكاملة نقل) متوسط اختصار autoregression. نموذج ARIMA على أساس الافتراضات التالية:

  • سلسلة بيانات متوقفة وهذا يعني أنه ينبغي للالحسابي والتباين لا تختلف مع مرور الوقت. أو عن طريق التحول لوغاريتمي التفاضلية يمكن بسلاسة التسلسل.
  • يجب أن يكون تسلسل إدخال البيانات وحيد المتغير لأن قيم ARIMA التنبؤ بمستقبل الماضي العددي.

ARIMA من ثلاثة عناصر: AR (الانحدار)، I (التفاضلي المدى) وMA (المتوسط المتحرك البند). دعونا نفعل بعض شرح كل مكون:

  • يشير AR المصطلح إلى القيمة الأخيرة استخدامها للتنبؤ قيمة. ويعرف AR بشروط المعلمة ARIMA 'ع'. يتم تحديد قيمة "ص" من قبل PACF FIG.
  • يحدد دخول MA عدد الأخطاء التوقعات السابقة عند التنبؤ قيمة المستقبل. المعلمات ARIMA 'ف' البند ممثلي MA. FIG ACF لتحديد "ف" القيمة الصحيحة،
  • يوفر تسلسل فرق لتنفيذ عملية التفاضلية من الرقم المتسلسل، كائن البيانات هو جعل ظلت عملية التفاضلية مستقرة. ADF وKPSS مثل يمكن أن تستخدم لتحديد ما إذا كان اختبار سلسلة متوقفة، والمساعدة في تحديد قيمة د.
أربع خطوات تنفيذ ARIMA

نموذج ARIMA لتحقيق الإجراء العام هو كما يلي:

1. تحميل البيانات: الخطوة الأولى في بناء نموذج من هذه الدورة هو لتحميل مجموعة البيانات. 2. ما قبل المعالجة: مجموعة البيانات المحددة في خطوة المعالجة. بما في ذلك إنشاء الطابع الزمني، العمود وقت / زمن لنوع د، أحادي المتغير تسلسل الخ .. تسلسل 3. تمهيد: من أجل تلبية الافتراضات، ينبغي ضمان تسلسل سلس. وهذا يشمل تحويل الاستقرار المنشود وإجراء تسلسل الاختيار. 4. تحديد قيمة d: من أجل جعل تسلسل سلس، ويتحدد بالفرق قيمة د إجراء عدد من العمليات. 5. إنشاء خريطة ACF وPACF: هذا هو تنفيذ ARIMA من أهم خطوة. FIG ACF PACF تحددها معلمات الإدخال للنموذج ARIMA. 6. تحديد قيمة من القيم ص و q: قراءة قيمة ف وفاء من الخطوة السابقة وACF PACF FIG. 7. تركيب ARIMA نموذج: مع البيانات المحسوبة لدينا من الخطوة السابقة وقيمة المعلمة، وتركيب نموذج ARIMA. 8. التنبؤ على مجموعة التحقق من الصحة: التنبؤ قيم المستقبل. 9. حساب RMSE: للتحقق من أداء نموذج عن طريق التحقق من RMSE مع الشيكات التحقق توقع والقيم الفعلية للقيم مجموعة RMSE. خامسا، لماذا نحن بحاجة ARIMA السيارات؟

على الرغم من أن نموذج ARIMA يشكل مؤشرا قويا جدا من بيانات السلاسل الزمنية، ولكن إعداد البيانات وعملية التكيف المعلمة تستغرق وقتا طويلا جدا. قبل تنفيذ ARIMA، يحتاج البيانات إلى أن استقر، وناقش استخدام ACF وPACF FIG سبق تحديدها قيم p و q. السيارات ARIMA المهمة برمتها بسيطة جدا لتنفيذ ، لأنه يقضي على خطوة ذكرنا في القسم السابق 3-6. وهنا هي الخطوات التي يجب اتباعها لتحقيق AUTO ARIMA:

1. تحميل البيانات: هذه الخطوة هو نفس الخطوة 1 تحقق ARIMA. تحميل البيانات إلى جهاز كمبيوتر محمول. 2. المعالجة المسبقة البيانات: يجب أن تكون مدخلا المتغيرات واحدة، لذلك إزالة الأعمدة الأخرى. 3. صالح ARIMA السيارات: في أحادي المتغير تسلسل النموذج المناسب. 4. التنبؤ على مجموعة التحقق من الصحة: للتنبؤ مجموعة التحقق من الصحة. 5. حساب RMSE: A الشيكات التحقق توقعت والقيم الفعلية للقيم RMSE تعيين.

كما ترون، نحن تماما تجاوز الخطوات لتحديد p و ف. آه! أنا أستطيع التنفس من السهل! في المقطع التالي، سوف نستخدم مجموعة بيانات افتراضية حققت ARIMA السيارات.

إعمال بيثون، وR

وسوف تستخدم مجموعات بيانات ركاب الطائرات الدولية، ومجموعة البيانات يحتوي على عدد الركاب في الشهر (بالآلاف)، فقد اثنين من أعمدة - الشهر وعدد الركاب. يمكنك الحصول على مجموعات البيانات من الرابط التالي:

https://datamarket.com/data/set/22u3/international-airline-passengers-monthly-totals-in-thousands-jan-49-dec-60#!ds=22u3&display=line

ما يلي هو رمز R لنفس المشكلة:

سبعة، السيارات ARIMA كيفية اختيار أفضل معلمة

في رمز أعلاه، ونحن نستخدم فقط .efit () الأوامر لتناسب النموذج، دون الحاجة إلى تحديد ص، س، د الجمع، ولكن هذا النموذج هو كيفية تحديد أفضل مزيج من هذه المعايير كذلك؟ السيارات ARIMA توليد AIC والقيم BIC (كما ترون في رمز أعلاه)، لتحديد أفضل مزيج من المعلمات. يتم استخدام AIC (معيار أكايكي للمعلومة) وBIC (النظرية الافتراضية معلومات الفرقان) لتقييم القيمة النسبية للنموذج. وانخفاض قيمة، وأفضل نموذج.

إذا كنت مهتما في الرياضيات وراء AIC وBIC، يرجى زيارة الرابط التالي:

  • AIC:
  • BIC:
ثمانية، الحواشي، ومزيد من القراءة

لقد وجدت ARIMA السيارات هو أسهل طريقة لأداء التنبؤ السلاسل الزمنية. أنا أعرف طريقا مختصرا هو شيء جيد، ولكن على دراية الرياضيات وراء ذلك هو أيضا نفس القدر من الأهمية. في هذه المقالة، وسوف القفز على تفاصيل كيفية عمل ARIMA، ولكن تأكد من قراءة توفر هذه المقالة على ارتباطات إلى مقالات. لراحتك، وهنا مرة أخرى على الرابط مرة أخرى:

  • الوقت سلسلة التنبؤ دليل شامل للمبتدئين (بايثون)
  • https://www.analyticsvidhya.com/blog/2016/02/time-series-forecasting-codes-python/
  • سلسلة دورة كاملة الوقت (R)
  • https://www.analyticsvidhya.com/blog/2015/12/complete-tutorial-time-series-modeling/
  • أساليب سبعة (رمز الثعبان المرفقة) التنبؤ السلاسل الزمنية
  • https://www.analyticsvidhya.com/blog/2018/02/time-series-forecasting-methods/

أقترح عليك القيام ببعض التمارين في هذه الدورة: "إن سلسلة زمنية من القتال." يمكنك أيضا المشاركة في الدورات التدريبية لدينا، والمشاركة في القتال الفعلي، يوفر برنامج "الوقت سلسلة التنبؤ" نقطة البدء الرائدة بالنسبة لك.

حظا سعيدا لكم، يرجى تقديم ملاحظاتك في قسم التعليقات أدناه وطرح الأسئلة.

العنوان الأصلي:

بناء نماذج عالية الأداء السلاسل الزمنية باستخدام ARIMA السيارات في بيثون وR

الرابط الأصلي:

https://www.analyticsvidhya.com/blog/2018/08/auto-arima-time-series-modeling-python-r/

مقدمة المترجم

تشن يان، جامعة جياوتونغ بكين، الاتصالات والدراسات العليا هندسة التحكم، ودرجة الماجستير في الهندسة، وشغل منصب والبرمجيات ونظم المهندس سور الصين العظيم الحاسوب، داتانغ الدقيقة مهندس، وترجم الحالي متفوقة بكين والتكنولوجيا المحدودة تشارك حاليا في تدريس تشغيل نظام الترجمة ذكية والصيانة، والتي تراكمت لديها بعض الخبرة في دراسة متعمقة من الذكاء الاصطناعي وشروط معالجة اللغة الطبيعية (NLP). الترجمة وقت الفراغ خلق المفضلة، وتشمل أعمال الترجمة: IEC-ISO 7816، ومشاريع النفط العراقية، والضرائب الجديدة البيان وغيرها، حيث تم نشر الترجمة الإنجليزية العمل "نيو الضرائب البيان" في GLOBAL TIMES. يمكن ترجمة تدخر الوقت للانضمام مجموعة من المتطوعين THU منصة البيانات الإرسال، ونأمل أن حصة مع تبادل التقدم المشترك

- انتهى -

تسينغهوا الانتباه - بيانات أكاديمية تشينغداو للعلوم قناة الصغرى الرسمية منصة الجمهور " بيانات الإرسال THU "أيتها الأخوات ولا". إرسال البيانات THU "لرعاية المزيد من المحاضرات ونوعية المحتوى.

لا هوادة فيها! وكانت الصين اندلع مراسل اعتذر الاسباني، وجيا تيانينج الغضب إلى الكراهية

AI 2018 مسح الشعب الصيني: 14 الرسم البياني كيفية تفسير ما يذهبون؟

فشل 120 مليون يورو لتنفيذه، حتى لمدة 3 مدرب لا طائل منه! هذا الفريق من الهبوط في الدوري الممتاز مقدما

حققت لى يونيو وقبل عام من الموعد المقرر من العلم، ومقر مستقبل الدخن ووهان لتجنيد الآلاف من الناس

أكاديمي تشانغ بو: شايونين لانج من رجل يبلغ من العمر أبيض الشعر، تسينغهوا 60 الواردة، حياة ذكية الفصل الطيف

ايتو من الطعام أول متحف من التشغيل التجريبي حسابات يعيشون اليوم لمدة خمسة في المئة من المواد الغذائية المستوردة

ميسي صنع المعجزات +1 سجل 12 عاما وراء C رونالدو الدوري الاسباني يلة معجزة انه حصاد أخبار جيدة

Yoshua: التعلم العميق AI التحدي نحو المستوى الإنساني (PPT تنزيل)

وو لي درجة أدنى الفريق بعد المباراة! وانتقد اثنان بمفرده ركلة غاب عن تقاليد فقدت + 1 ضعف

استمر مائتي العلماء في العالم خمس سنوات، أشكال الحياة حقيقية النواة مصنوعة من اختراق تاريخي الاصطناعية

الدوري الاسباني لعب الله! برشلونة خسر الأهداف الأربعة المقبلة انقلب تقريبا، تعاونت النجوم ليصل إلى خلق الكلاسيكية آخر

الثقيلة | دنغ وليو يانغ تشينغهوا القوة شارك في تأليف كتاب "ديب التعلم في البرمجة اللغوية العصبية" (تحميل مرفق بصورة)