الكاتب: ايشواريا SINGH
الترجمة: تشن يان
تصحيح التجارب المطبعية: دينغ NANYA
3400 كلمة المادة هي القراءة الموصى بها 10+ دقيقة.
تقدم هذه الورقة مفهوم ARIMA، ومع مجموعة من البيانات التي تنفذ في بيثون والتدريب R.
مقدمة موجزةتشمل استنادا إلى البيانات التاريخية القائمة على التنبؤ الجيل القادم سعر آي فون، وميزات يمكن استخدام مبيعات فصلية، والنفقات الشهرية، فضلا عن مجموعة واسعة من المحتوى على الميزانية العمومية أبل: تخيل أن لديك الآن مهمة. كعالم البيانات، وكنت وضعت وتصنف هذه المسألة أي نوع من المشكلة؟ وبطبيعة الحال، السلاسل الزمنية النمذجة.
من التنبؤ بالمبيعات المنتج لاستهلاك الأسر التقدير والتنبؤ السلسلة الزمنية أي عالم البيانات يجب أن يعرف - حتى إذا لم يكن سيد - واحدة من المهارات الأساسية. يمكنك استخدام عدة أساليب مختلفة للتنبؤ السلاسل الزمنية، وسوف نناقش في هذه المقالة ARIMA السيارات أنها واحدة من أكثر الطرق الفعالة.
أولا، دعونا ننظر في في مفهوم ARIMA، ومن ثم الحصول على --Auto ARIMA. من أجل ترسيخ مفهوم، سوف نستخدم مجموعة من البيانات، وتنفيذ ذلك في بيثون وR.
دليلأولا، ما هو السلاسل الزمنية؟
الثاني، وهي المرة طريقة التنبؤ سلسلة
ثلاثة، ARIMA الملف الشخصي
أربع خطوات تنفيذ ARIMA
V. لماذا ARIMA السيارات؟
ست حالات مع السيارات ARIMA تحقيق (طيران مجموعات بيانات المسافرين)
سبعة، السيارات ARIMA كيفية اختيار المعلمات؟
إذا كنت معتادا على طريقة شائعة والسلاسل الزمنية (على سبيل المثال، المتوسط المتحرك، تجانس الأسي وARIMA)، يمكنك تخطي مباشرة إلى القسم 4. للمبتدئين، وتبدأ مع القسم التالي، بما في ذلك وصف موجز لمختلف أساليب السلاسل الزمنية والتنبؤ.
أولا، ما هو السلاسل الزمنية؟قبل أن نتعلم كيفية التعامل مع بيانات السلاسل الزمنية، يجب علينا أولا أن نفهم ما هو الوقت السلسلة، وكيف يختلف عن أنواع أخرى من البيانات. التعريف الرسمي للسلسلة الزمنية كما يلي: تم قياسها في سلسلة من نقاط البيانات الفاصلة الزمنية نفسها .
لفترة وجيزة، والتسلسل الزمني يشير إلى قيمة محددة في فترات زمنية ثابتة تحت التسجيل، يمكن أن الفاصل الزمني يكون ساعة، يوميا، أسبوعيا، كل 10 يوما، وما شابه ذلك. خصوصية التسلسل الزمني: ترتبط كل نقطة البيانات في التسلسل مع نقطة البيانات السابقة. دعونا تكون مفهومة أكثر وضوحا من الأمثلة التالية من هذا.
- مثال 1:
- مثال 2:
الآن أن لديك الحدس، المثال الأول هو وجود مشكلة الانحدار بسيطة، والمثال الثاني هو قضية السلاسل الزمنية. على الرغم من أن السلسلة الزمنية تصدر هنا يمكن أن تستخدم أيضا في حل الانحدار الخطي، ولكن ليس هذا هو أفضل وسيلة، لأنه يتجاهل العلاقة بين هذه القيم، والقيم النسبية للالماضي. أدناه، ونحن نلقي نظرة على بعض الطرق الشائعة لإيجاد حل لمشكلة السلاسل الزمنية.
الثاني، وهي المرة طريقة التنبؤ سلسلةهناك العديد من الطرق لأداء سلسلة التنبؤ الوقت، ونحن سوف تفعل مقدمة موجزة لهم في هذا القسم. المذكورة أدناه صفا مفصلا كود بايثون وفي جميع طرق يمكن العثور عليها في ما يلي:
سبعة أنواع من الوقت طريقة التنبؤ سلسلة (مع رمز بيثون): https://www.analyticsvidhya.com/blog/2018/02/time-series-forecasting-methods/1. التنبؤ بسيط: في هذه الطريقة للتنبؤ، والقيمة المتوقعة تساوي تشير البيانات الجديدة قيمة النقطة البيانات السابقة. وستكون النتيجة خط مواز، حيث يتم توقع كل القيم الجديدة باستخدام القيم السابقة.
2. متوسط طريقة بسيطة: وأقل عرض متوسط قيمة كل القيم السابقة. هذا التوقع هو أفضل من أسلوب "توقعات بسيطة"، لأنها ليست نتيجة لخط مواز. ولكن في طريقة المتوسط البسيط، وتؤخذ جميع قيم الماضي في الاعتبار، وهذه القيم قد لا يكون مفيدا. على سبيل المثال، عندما طلب منه التنبؤ درجات الحرارة اليوم، ما عليك سوى أن تنظر في درجات الحرارة في الأيام السبعة الأولى، بدلا من درجة حرارة قبل شهر.
3. المتوسط المتحرك الطريقة: هذا هو تحسنا طريقتين الأولى. جميع النقاط السابقة لم متوسط، ولكن متوسط ن النقطة السابقة حيث بلغت قيمة المتوقعة.
4. المتوسط المتحرك الموزون الأسلوب: المتوسط المتحرك الموزون هو المتوسط المتحرك مع الأوزان، يتم تعيين قيم ن السابقة أوزان مختلفة.
تجانس الأسي بسيط: في هذه الطريقة، يتم تعيين وزن أكبر لملاحظات أكثر حداثة، وقدمت ملاحظات من الماضي البعيد أقل وزنا.
6. هولت (هولت) الخطية نموذج الاتجاه: وتأخذ هذه الطريقة في الاعتبار الاتجاهات في مجموعة البيانات. ما يسمى الاتجاه، مشيرا إلى زيادة أو خفض طبيعة البيانات. على افتراض أن عدد حجز الفنادق في تزايد كل عام، وبعد ذلك يمكننا القول أن عدد من البرامج تحفظات اتجاه متزايد. وظيفة التنبؤ هي وظيفة من قيمة والاتجاهات العملية.
7. هولت - وينترز (هولت وينترز) الأسلوب: تأخذ الخوارزمية في الاعتبار الاتجاه والبيانات الموسمية. على سبيل المثال، هناك عدد من الحجوزات الفندقية على ارتفاع في نهاية الأسبوع، وانخفاض خلال الأسبوع، ويتزايد كل عام، وبالتالي الاتجاهات الموسمية أسبوعيا والوجود النمو.
8. ARIMA: ARIMA تحظى بشعبية كبيرة النمذجة السلاسل الزمنية. ويصف العلاقة بين نقاط البيانات وأخذ الفرق بين القيم. ARIMA نسخة محسنة هو SARIMA (أو ARIMA الموسمية). ARIMA سوف نناقش بمزيد من التفصيل في القسم التالي.
ثلاثة، ARIMA الملف الشخصيفي هذا القسم، سوف نقدم لفترة وجيزة ARIMA، والتي سوف تساعد على فهم اريما السيارات. "دوام كامل سلسلة دروس" زوج من ARIMA الورق، (ص، س، د) معلمات، ACF، والتي تتجسد PACF التين وشرحا مفصلا.
ARIMA هي طريقة التنبؤ السلسلة الزمنية شعبية جدا، والتي تتكامل المتحركة (المتوسطات السيارات الرجعية المتكاملة نقل) متوسط اختصار autoregression. نموذج ARIMA على أساس الافتراضات التالية:
- سلسلة بيانات متوقفة وهذا يعني أنه ينبغي للالحسابي والتباين لا تختلف مع مرور الوقت. أو عن طريق التحول لوغاريتمي التفاضلية يمكن بسلاسة التسلسل.
- يجب أن يكون تسلسل إدخال البيانات وحيد المتغير لأن قيم ARIMA التنبؤ بمستقبل الماضي العددي.
ARIMA من ثلاثة عناصر: AR (الانحدار)، I (التفاضلي المدى) وMA (المتوسط المتحرك البند). دعونا نفعل بعض شرح كل مكون:
- يشير AR المصطلح إلى القيمة الأخيرة استخدامها للتنبؤ قيمة. ويعرف AR بشروط المعلمة ARIMA 'ع'. يتم تحديد قيمة "ص" من قبل PACF FIG.
- يحدد دخول MA عدد الأخطاء التوقعات السابقة عند التنبؤ قيمة المستقبل. المعلمات ARIMA 'ف' البند ممثلي MA. FIG ACF لتحديد "ف" القيمة الصحيحة،
- يوفر تسلسل فرق لتنفيذ عملية التفاضلية من الرقم المتسلسل، كائن البيانات هو جعل ظلت عملية التفاضلية مستقرة. ADF وKPSS مثل يمكن أن تستخدم لتحديد ما إذا كان اختبار سلسلة متوقفة، والمساعدة في تحديد قيمة د.
نموذج ARIMA لتحقيق الإجراء العام هو كما يلي:
1. تحميل البيانات: الخطوة الأولى في بناء نموذج من هذه الدورة هو لتحميل مجموعة البيانات. 2. ما قبل المعالجة: مجموعة البيانات المحددة في خطوة المعالجة. بما في ذلك إنشاء الطابع الزمني، العمود وقت / زمن لنوع د، أحادي المتغير تسلسل الخ .. تسلسل 3. تمهيد: من أجل تلبية الافتراضات، ينبغي ضمان تسلسل سلس. وهذا يشمل تحويل الاستقرار المنشود وإجراء تسلسل الاختيار. 4. تحديد قيمة d: من أجل جعل تسلسل سلس، ويتحدد بالفرق قيمة د إجراء عدد من العمليات. 5. إنشاء خريطة ACF وPACF: هذا هو تنفيذ ARIMA من أهم خطوة. FIG ACF PACF تحددها معلمات الإدخال للنموذج ARIMA. 6. تحديد قيمة من القيم ص و q: قراءة قيمة ف وفاء من الخطوة السابقة وACF PACF FIG. 7. تركيب ARIMA نموذج: مع البيانات المحسوبة لدينا من الخطوة السابقة وقيمة المعلمة، وتركيب نموذج ARIMA. 8. التنبؤ على مجموعة التحقق من الصحة: التنبؤ قيم المستقبل. 9. حساب RMSE: للتحقق من أداء نموذج عن طريق التحقق من RMSE مع الشيكات التحقق توقع والقيم الفعلية للقيم مجموعة RMSE. خامسا، لماذا نحن بحاجة ARIMA السيارات؟على الرغم من أن نموذج ARIMA يشكل مؤشرا قويا جدا من بيانات السلاسل الزمنية، ولكن إعداد البيانات وعملية التكيف المعلمة تستغرق وقتا طويلا جدا. قبل تنفيذ ARIMA، يحتاج البيانات إلى أن استقر، وناقش استخدام ACF وPACF FIG سبق تحديدها قيم p و q. السيارات ARIMA المهمة برمتها بسيطة جدا لتنفيذ ، لأنه يقضي على خطوة ذكرنا في القسم السابق 3-6. وهنا هي الخطوات التي يجب اتباعها لتحقيق AUTO ARIMA:
1. تحميل البيانات: هذه الخطوة هو نفس الخطوة 1 تحقق ARIMA. تحميل البيانات إلى جهاز كمبيوتر محمول. 2. المعالجة المسبقة البيانات: يجب أن تكون مدخلا المتغيرات واحدة، لذلك إزالة الأعمدة الأخرى. 3. صالح ARIMA السيارات: في أحادي المتغير تسلسل النموذج المناسب. 4. التنبؤ على مجموعة التحقق من الصحة: للتنبؤ مجموعة التحقق من الصحة. 5. حساب RMSE: A الشيكات التحقق توقعت والقيم الفعلية للقيم RMSE تعيين.كما ترون، نحن تماما تجاوز الخطوات لتحديد p و ف. آه! أنا أستطيع التنفس من السهل! في المقطع التالي، سوف نستخدم مجموعة بيانات افتراضية حققت ARIMA السيارات.
إعمال بيثون، وRوسوف تستخدم مجموعات بيانات ركاب الطائرات الدولية، ومجموعة البيانات يحتوي على عدد الركاب في الشهر (بالآلاف)، فقد اثنين من أعمدة - الشهر وعدد الركاب. يمكنك الحصول على مجموعات البيانات من الرابط التالي:
https://datamarket.com/data/set/22u3/international-airline-passengers-monthly-totals-in-thousands-jan-49-dec-60#!ds=22u3&display=lineما يلي هو رمز R لنفس المشكلة:
سبعة، السيارات ARIMA كيفية اختيار أفضل معلمةفي رمز أعلاه، ونحن نستخدم فقط .efit () الأوامر لتناسب النموذج، دون الحاجة إلى تحديد ص، س، د الجمع، ولكن هذا النموذج هو كيفية تحديد أفضل مزيج من هذه المعايير كذلك؟ السيارات ARIMA توليد AIC والقيم BIC (كما ترون في رمز أعلاه)، لتحديد أفضل مزيج من المعلمات. يتم استخدام AIC (معيار أكايكي للمعلومة) وBIC (النظرية الافتراضية معلومات الفرقان) لتقييم القيمة النسبية للنموذج. وانخفاض قيمة، وأفضل نموذج.
إذا كنت مهتما في الرياضيات وراء AIC وBIC، يرجى زيارة الرابط التالي:
- AIC:
- BIC:
لقد وجدت ARIMA السيارات هو أسهل طريقة لأداء التنبؤ السلاسل الزمنية. أنا أعرف طريقا مختصرا هو شيء جيد، ولكن على دراية الرياضيات وراء ذلك هو أيضا نفس القدر من الأهمية. في هذه المقالة، وسوف القفز على تفاصيل كيفية عمل ARIMA، ولكن تأكد من قراءة توفر هذه المقالة على ارتباطات إلى مقالات. لراحتك، وهنا مرة أخرى على الرابط مرة أخرى:
- الوقت سلسلة التنبؤ دليل شامل للمبتدئين (بايثون)
- https://www.analyticsvidhya.com/blog/2016/02/time-series-forecasting-codes-python/
- سلسلة دورة كاملة الوقت (R)
- https://www.analyticsvidhya.com/blog/2015/12/complete-tutorial-time-series-modeling/
- أساليب سبعة (رمز الثعبان المرفقة) التنبؤ السلاسل الزمنية
- https://www.analyticsvidhya.com/blog/2018/02/time-series-forecasting-methods/
أقترح عليك القيام ببعض التمارين في هذه الدورة: "إن سلسلة زمنية من القتال." يمكنك أيضا المشاركة في الدورات التدريبية لدينا، والمشاركة في القتال الفعلي، يوفر برنامج "الوقت سلسلة التنبؤ" نقطة البدء الرائدة بالنسبة لك.
حظا سعيدا لكم، يرجى تقديم ملاحظاتك في قسم التعليقات أدناه وطرح الأسئلة.
العنوان الأصلي:
بناء نماذج عالية الأداء السلاسل الزمنية باستخدام ARIMA السيارات في بيثون وR
الرابط الأصلي:
https://www.analyticsvidhya.com/blog/2018/08/auto-arima-time-series-modeling-python-r/
مقدمة المترجم
تشن يان، جامعة جياوتونغ بكين، الاتصالات والدراسات العليا هندسة التحكم، ودرجة الماجستير في الهندسة، وشغل منصب والبرمجيات ونظم المهندس سور الصين العظيم الحاسوب، داتانغ الدقيقة مهندس، وترجم الحالي متفوقة بكين والتكنولوجيا المحدودة تشارك حاليا في تدريس تشغيل نظام الترجمة ذكية والصيانة، والتي تراكمت لديها بعض الخبرة في دراسة متعمقة من الذكاء الاصطناعي وشروط معالجة اللغة الطبيعية (NLP). الترجمة وقت الفراغ خلق المفضلة، وتشمل أعمال الترجمة: IEC-ISO 7816، ومشاريع النفط العراقية، والضرائب الجديدة البيان وغيرها، حيث تم نشر الترجمة الإنجليزية العمل "نيو الضرائب البيان" في GLOBAL TIMES. يمكن ترجمة تدخر الوقت للانضمام مجموعة من المتطوعين THU منصة البيانات الإرسال، ونأمل أن حصة مع تبادل التقدم المشترك
- انتهى -تسينغهوا الانتباه - بيانات أكاديمية تشينغداو للعلوم قناة الصغرى الرسمية منصة الجمهور " بيانات الإرسال THU "أيتها الأخوات ولا". إرسال البيانات THU "لرعاية المزيد من المحاضرات ونوعية المحتوى.