پیشبینی سریهای زمانی یک تکنیک فوقالعاده محبوب و پرکاربرد در امور مالی، اقتصاد و سایر زمینههای مبتنی بر داده است. همانطور که تقاضا برای پیشبینی دقیق رویدادهای آینده رو به افزایش است، نیاز به روشهای قابل اعتماد و کارآمد پیشبینی نیز افزایش مییابد. یکی از این روش ها، میانگین متحرک یکپارچه اتورگرسیو (ARIMA) است. ARIMA یک مدل قدرتمند است که به دلیل توانایی آن در ایجاد سریع پیش بینی های دقیق، به طور گسترده توسط متخصصان در این زمینه مورد استفاده قرار گرفته است.
مدل ARIMA چیست؟
ARIMA مخفف Autoregressive Integrated Moving Average است و یکی از محبوب ترین و پرکاربردترین تکنیک ها برای پیش بینی سری های زمانی تک متغیره است. برخی از متغیرهایی که می توانید با مدل های ARIMA پیش بینی کنید عبارتند از: تولید ناخالص داخلی، شاخص قیمت مصرف کننده (CPI) و قیمت سهام یا کالاها.
مدل های تک متغیره
ما سعی نخواهیم کرد که مقادیر آینده یک متغیر (یعنی تورم) را با استفاده از بسیاری از رگرسیون های دیگر (یعنی تولید ناخالص داخلی، عرضه پول، نرخ بهره) پیش بینی کنیم. در عوض، برای پیشبینی سطوح تورم آتی، به سطوح گذشته تورم تکیه میکنیم. دانستن اینکه متغیر در گذشته چگونه رفتار کرده است به ما امکان می دهد پیش بینی کنیم که در آینده به کجا خواهد رفت.
در این آموزش ما از روش Box Jenkins برای انتخاب مدلهای مناسب و پیشبینی مقادیر آینده متغیر مورد علاقه خود استفاده میکنیم.
روش باکس جنکینز چیست؟
روش باکس جنکینز به افتخار نویسندگان جورج باکس و گویلیم جنکینز، که روشی سه مرحله ای را برای انتخاب مدل های ARIMA مناسب برای پیش بینی متغیرهای اقتصادی پیشنهاد کردند، نامگذاری شد. با استفاده از متدولوژی Box-Jenkis، سعی خواهیم کرد مدلی پیدا کنیم که به خوبی با داده ها مطابقت داشته باشد و بتواند مقادیر مناسب را پیش بینی کند. این روش شامل سه مرحله اساسی است:
مرحله 1: شناسایی
مرحله 2: برآورد
مرحله 3: تشخیص و پیش بینی
برخی از کتابهای درسی نشان میدهند که روش باکس جنکینز شامل چهار مرحله است.
کتاب اصلی نوشته باکس و جنکینز با عنوان "تحلیل سری های زمانی: پیش بینی و کنترل" تنها سه مرحله را مشخص می کند. با این حال، برخی از کتاب های درسی روش را به چهار مرحله تقسیم کرده اند. مرحله 3 تشخیص و مرحله 4 پیش بینی است. تحلیل به همین شکل باقی می ماند.
نحوه تخمین مدل های میانگین یکپارچه اتورگرسیو (ARIMA) در EViews
باکس جنکینز، مرحله 1: شناسایی
ARIMA به صورت ARIMA (p,d,q) نوشته می شود که در آن "p" ترتیب مولفه خودرگرسیون(درجه خودهمبستگي) است، "d" زمان هایی است که برای دستیابی به مانايي نیاز داریم تا متغیر را متمایز کنیم، و "q" ميانگين متحرکت است.
مرحله 1 بر دو جنبه تمرکز دارد. ابتدا مانا بودن متغیر مورد علاقه خود را بررسی می کنیم. بعد، تعیین ترتیب مولفه های خودرگرسیون و میانگین متحرک. به عبارت دیگر، در مرحله 1 "p"، "d" و "q" را تعیین خواهیم کرد.
در مثال سعی می کنیم مدل ARIMA را برای سری «شاخص قیمت مصرف کننده » برازش دهیم. باید تحلیل خود را با بررسی مانا بودن شروع کنیم. چرا؟ سري باید مانا باشد تا بتوان آن را پیش بینی کرد. اگر متغیر در سطوح مانا نباشد، باید تبدیلهای مناسب (logs/differences) را برای مانا کردن آن اعمال کنیم.
آزمون مانايي در Eviews
چگونه مانا بودن را در EViews بررسی کنیم
برای بررسی مانا بودن، به موارد زیر نگاه می کنیم:
1-نمودار
2-همبستگی نگار
3-آزمون های رسمی: دیکی فولر تعميم يافته، آزمون فیلیپس-پرون و آزمون KPSS.
(Augmented Dickey Fuller, Phillips-Perron Test and KPSS test)
لطفاً در صورت نیاز به توضیح بیشتر در مورد روش، آموزش ثابت بودن من را تماشا کنید.
در مثال، تأیید کردیم که CPI در سطوح مانا نیست، اما در تفاوت های اولیه مانا است. در نتیجه، از متغیر در تفاوت های اول(first differences) استفاده می کنیم.
توجه: از آنجایی که P-Value > 0.05 است، نمیتوانیم فرضیه صفر را رد کنیم (H0: CPI ریشه واحد دارد).
Arima: نحوه تعیین ترتیب p,d و q
برای شناسایی ترتیب مولفه های اتورگرسیو و میانگین متحرک، در اولین تفاوت ها((first differences)) بر روی همبستگی "CPI" تمرکز می کنیم. همبستگی را در اولین تفاوت ها((first differences)) نشان می دهیم زیرا تأیید کرده ایم که "CPI" در تفاوت های اول (first differences) مانا است. هدف از این مرحله یافتن تمام مدل های ممکن برای برآورد است.
برای تعیین ترتیب مولفه خودرگرسیون ("p")، باید ستون خودهمبستگی جزئی (PACF) را مشاهده کنیم. در ستون، یک كران اطمینان در طرفین مشاهده می کنیم. مقادیری که از كرانه ها فراتر می روند، ترتیب احتمالی مولفه خودرگرسیون را نشان می دهند. با نگاهی به همبستگی، اولین تاخیر یک جزء (1) AR بسیار مهم است و سپس تاخیرهای 2 و 3 روی خط هستند و میتوانند آزمون شوند. برای هدف این مثال، فقط یک جزء (1) AR را در نظر خواهم گرفت.
در مرحله بعد، برای تعیین ترتیب مولفه میانگین متحرک ("q")، باید ستون خودهمبستگی (ACF) را مشاهده کنیم. می توانیم ببینیم که تاخیر 1 و 3 از كرانه هاي اطمینان بیشتر است. در نتیجه، دو جزء میانگین متحرک ممکن (1) MA و (3) MA وجود دارد.
باکس جنکینز، مرحله 2: برآورد
هنگامی که نامزدهای احتمالی مدل های ARIMA را شناسایی کردیم، باید آنها را تخمین بزنیم و تصمیم بگیریم که کدام مدل مناسب ترین است. دو مدلی که تصمیم گرفتیم تخمین بزنیم عبارتند از:
(1،1،1) ARIMA
(1،1،3) ARIMA
در روش جعبه جنکینز، مرحله 2:
مدل هایی را که در مرحله 1 شناسایی کردیم، تخمین بزنید
مدلی را بر اساس اهمیت برآوردهای ضریب انتخاب می کنیم
و بر اساس معیارهای مدل مانند: شوارتز، آکایک و هانان کوئین
مدلی که کمترین مقادیر را در معیارهای مدل داشته باشد و بیشترین ضریب را داشته باشد مناسب ترین خواهد بود
توجه: معیارهای انتخاب مدل مناسب.
چگونه مدل ARIMA مناسب را انتخاب کنیم؟
برای انتخاب مناسب ترین مدل به شما توصیه می کنم جدولی مانند تصویر زیر انجام دهید و اطلاعات را با داده هایی که در شکل قبل به دست آورده ایم (مدل های تخمینی ARIMA) پر کنید.
باید موارد زیر را تضمین کنیم:
1. معناداري مولفه هاي ARMA: مدلی را انتخاب کنید که بیشترین مولفه ها را دارد (p-values<0.05)
2.SigmaSQ: معياري براي اندازه گیری نوسانات است. کوچکترین را انتخاب کنید
3.Log Likelihood: باید بزرگترین مقدار را انتخاب کنیم، زیرا در حال به حداکثر رساندن تابع log-likelihood هستیم. (در مثال ما بزرگترین مقدار کمترین مقدار منفی است).
4. معیارهای انتخاب مدل: مدلی را با کوچکترین آکایک، شوارتز و هانان کوئین انتخاب کنید.
نتیجه گیری: مدل B برازش بهتری نسبت به مدل A دارد.
باکس جنکینز، مرحله 3: تشخیص و پیش بینی
مدلهای ممکن را شناسایی و در مرحله 2 تخمین زدیم. همچنین مناسبترین مدل را بر اساس معیارهای متنوع انتخاب کردیم. اکنون زمان آن فرا رسیده است که مطمئن شویم مدل الزامات پیش بینی و پیش بینی مقادیر آینده را برآورده می کند!
در روش جعبه جنکینز، مرحله 3 :
1-اطمینان حاصل کنید که مدل شرایط پایداری را برآورده می کند
2-خود همبستگی وجود ندارد
اگر شرایط فوق برآورده شود، می توانیم پیش بینی کنیم!
نحوه بررسی همبستگی خودکار در مدل های ARIMA
برای بررسی همبستگی خودکار، همبستگی مدل (1،1،3) ARIMA را نمایش می دهیم و به آمار جعبه Q Ljung نگاه می کنیم، که در آن فرضیه صفر این است که "باقیمانده ها داراي نویز سفید هستند".
همانطور که در شکل زیر می بینیم، مقادیر p برای آماره Q بیش از 0.05 است که تایید می کند که باقیمانده ها داراي نویز سفید هستند. آخرین مرحله تأیید این است که آیا ریشه های AR/MA معکوس در داخل دایره واحد قرار دارند یا خیر.
شرایط پایداری در مدل های ARIMA
1-مدل تخمینی کوواریانس ثابت است: ریشه های AR معکوس باید در داخل دایره واحد قرار بگیرند
2-فرآیند تخمین زده شده معکوس است: ریشه های MA معکوس باید در داخل دایره واحد قرار گیرند
نکته: همه ریشه ها در دایره قرار دارند. مدل پایدار است.
در شکل بالا می بینیم که تمام ریشه های معکوس در داخل دایره واحد قرار دارند. ARIMA ما (1،1،3) شرایط پایداری را برآورده کرد و شرایط خطا نویز سفید است. اکنون در موقعیت خوبی برای پیش بینی ارزش های آتی شاخص قیمت مصرف کننده هستیم. اگر مدلی که انتخاب کرده اید شرایط پایداری را برآورده نمی کرد، باید مرحله 2 و 3 را دوباره تکرار کنید و کاندیدای مناسب دیگری را پیدا کنید.
همچنین می توانیم سری اصلی و مقادیر پیش بینی شده را با هم ترسیم کنیم.
نظرات