Sabtu, 17 Desember 2011

ARIMA..



ARIMA sering juga disebut metode runtun waktu Box-Jenkins. ARIMA sangat baik ketepatannya untuk peramalan jangka pendek, sedangkan untuk peramalan jangka panjang ketepatan peramalannya kurang baik. Biasanya akan cenderung flat (mendatar/konstan) untuk periode yang cukup panjang.
Model Autoregresif Integrated Moving Average (ARIMA) adalah model yang secara penuh mengabaikan independen variabel dalam membuat peramalan. ARIMA menggunakan nilai masa lalu dan sekarang dari variabel dependen untuk menghasilkan peramalan jangka pendek yang akurat. ARIMA cocok jika observasi dari deret waktu (time series) secara statistik berhubungan satu sama lain (dependent).
Metode ARIMA menggunakan pendekatan iteratif dalam mengidentifikasi suatu model yang paling tepat dari berbagai model yang ada. Model sementara yang telah dipilih diuji lagi dengan data historis untuk melihat apakah model sementara yang terbentuk tersebut sudah memadai atau belum. Model sudah dianggap memadai apabila residual (selisih  hasil peramalan dengan data historis) terdistribusi secara acak, kecil dan independen satu sama lain. Langkah-langkah penerapan metode ARIMA secara berturut-turut adalah : identifikasi model, estimasi parameter model, diagnostic checking, dan peramalan (forecasting).
a. Identifikasi model
Model ARIMA hanya dapat diterapkan  untuk deret waktu yang stasioner. Oleh karena itu, pertama kali yang harus dilakukan adalah menyelidiki apakah data yang kita gunakan sudah stasioner atau belum. Jika data tidak stasioner, yang perlu dilakukan adalah memeriksa pada pembedaan beberapa data akan stasioner, yaitu menentukan berapa nilai d. Proses ini dapat dilakukan dengan menggunakan koefisien ACF(Auto Correlation Function), atau uji akar-akar unit (unit roots test) dan derajat integrasi. Jika data sudah stasioner sehingga tidak dilakukan pembedaan terhadap data runtun waktu maka d diberi nilai 0. Disamping menentukan d, pada tahap ini juga ditentukan berapa jumlah nilai lag residual (q) dan nilai lag dependen (p) yang digunakan dalam model. Alat utama yang digunakan untuk mengidentifikasi q dan p adalah ACF dan PACF (Partial Auto Correlation Funtion / Koefisien Autokorelasi Parsial), dan correlogram yang menunjukkan plot nilai ACF dan PACF terhadap lag. Koefisien autokorelasi parsial mengukur tingkat keeratan hubungan antara Xt dan Xt-ksedangkan pengaruh dari time lab 1,2,3,…,k-1 dianggap konstan. Dengan kata lain, koefisien autokorelasi parsial mengukur derajat hubungan  antara nilai-nilai sekarang dengan nilai-nilai sebelumnya (untuk time lag tertentu), sedangkan pengaruh nilai variabel time lab yang lain dianggap konstan. Secara matematis, koefisien autokorelasi parsial berorde m didefinisikan sebagai koefisien autoregressive terakhir dari model AR(m).
b. Estimasi
Setelah menetapkan model sementara dari hasil identifikasi, yaitu menentukan nilai p, d, dan q, langkah berikutnya adalah melakukan estimasi paramater autoregressive dan moving average yang tercakup dalam model (Firmansyah, 2000). Jika teridentifikasi proses AR murni maka parameter dapat diestimasi dengan menggunakan kuadrat terkecil (Least Square). Jika sebuah pola MA diidentifikasi maka maximum likelihood atau estimasi kuadrat terkecil, keduanya membutuhkan metode optimisasi non-linier(Griffiths, 1993),  hal ini terjadi karena adanya unsur moving average yang menyebabkan ketidak linieran parameter (Firmansyah, 2000). Namun, saat ini sudah tersedia berbagai piranti lunak statistik yang mampu menangani perhitungan tersebut sehingga kita tidak perlu khawatir mengenai estimasi matematis.
c. Diagnostic Checking
Setelah melakukan estimasi dan mendapatkan penduga paramater, agar model sementara dapat digunakan untuk peramalan, perlu dilakukan uji kelayakan terhadap model tersebut. Tahap ini disebut diagnostic checking, dimana pada tahap ini diuji apakah spesifikasi model sudah benar atau belum. Pengujian kelayanan ini dapat dilakukan dengan beberapa cara.
(1) Setelah estimasi dilakukan, maka nilai residual dapat ditentukan. Jika nilai-nilai koefisien autokorelasi residual untuk berbagi time lag tidak berbeda secara signifikan dari nol, model dianggap memadai untuk dipakai sebagai model peramalan.
(2)   Menggunakan statistik Box-Pierce Q.
(3) Menggunakan varian dari statistik Box-Pierce Q, yaitu statistik Ljung-Box(LB).
Sama seperti Q statistik, statistik LB mendekati c2 kritis dengan derajat kebebasan m. Jika statistik LB lebih kecil dari nilai ckritis, maka semua koefisien autokorelasi dianggap tidak berbeda dari nol, atau model telah dispesifikasikan dengan benar. Statistik LB dianggap lebih unggul secara statistik daripada Q statistik dalam menjelaskan sample kecil.
(4)   Menggunakan t statistik untuk menguji apakah koefisien model secara individu berbeda dari nol. Apabila suatu variabel tidak signifikan secara individu berarti variabel tersebut seharusnya dilepas dari spesifikasi model lain kemudian diduga dan diuji. Jika model sementara yang dipilih belum lolos uji diagnostik, maka proses pembentukan model diulang kembali. Menemukan model ARIMA yang terbaik merupakan proses iteratif.
d.  Peramalan (forecasting)
Setelah model terbaik diperoleh, selanjutnya peramalan dapat dilakukan. Dalam berbagai kasus, peramalan dengan metode ini lebih dipercaya daripada peramalan yang dilakukan dengan model ekonometri tradisional. Namun, hal ini tentu saja perlu dipelajari lebih lanjut oleh para peneliti yang tertarik menggunakan metode serupa. Berdasarkan ciri yang dimilikinya, model runtun waktu seperti ini lebih cocok untuk peramalan dengan jangkauan sangat pendek, sementara model struktural lebih cocok untuk peramalan dengan jangkauan panjang (Mulyono, 2000 dalam Firmansyah, 2000.

ARIMA


Klasifikasi model ARIMA
Model Box-Jenkins (ARIMA) dibagi kedalam 3 kelompok, yaitu: model autoregressive (AR), moving average (MA), dan model campuran ARIMA (autoregressive moving average) yang mempunyai karakteristik dari dua model pertama.
1) Autoregressive Model (AR)
Bentuk umum model autoregressive dengan ordo p (AR(p)) atau model ARIMA (p,0,0) dinyatakan sebagai berikut: t t t p t p t X = + X + X + + X + e − − − μ ' φ φ ... φ 1 1 2 2 [0]
dimana: μ ' = suatu konstanta p
φ = parameter autoregresif ke-p
et = nilai kesalahan pada saat t
2) Moving Average Model (MA)
Bentuk umum model moving average ordo q (MA(q)) atau ARIMA (0,0,q) dinyatakan sebagai berikut: t t t t q t k X e e e e − − − = μ '+ −θ −θ − ... −θ 1 1 2 2
dimana: μ ' = suatu konstanta 1 θ sampai q θ adalah parameter-parameter moving average
et-k = nilai kesalahan pada saat t – k
3) Model campuran
a. Proses ARMA
Model umum untuk campuran proses AR(1) murni dan MA(1) murni, missal ARIMA (1,0,1) dinyatakan sebagai berikut: 1 1 1 1 ' − − = + + − t t t t X μ φ X e θ e atau t t (1 B)X ' (1 B)e 1 1 −φ = μ + −θ AR(1) MA(1)
b. Proses ARIMA
Apabila nonstasioneritas ditambahkan pada campuran proses ARMA, maka model umum ARIMA (p,d,q) terpenuhi. Persamaan untuk kasus sederhana ARIMA (1,1,1) adalah sebagai berikut: t t (1 B)(1 B)X ' (1 B)e 1 1 − −φ = μ + −θ pembedaan AR(1) MA(1) pertama.

Musiman dan Model ARIMA
Musiman didefinisikan sebagai suatu pola yang berulang-ulang dalam selang waktu yang tetap. Untuk data yang stasioner, faktor musiman dapat ditentukan dengan mengidentifikasi koefisien autokorelasi pada dua atau tiga time-lag yang berbeda nyata dari nol. Autokorelasi yang secara signifikan berbeda dari nol menyatakan adanya suatu pola dalam data. Untuk mengenali adanya faktor musiman, seseorang harus melihat pada autokorelasi yang tinggi. Untuk menangani musiman, notasi umum yang singkat adalah: ARIMA (p,d,q) (P,D,Q)S Dimana (p,d,q) = bagian yang tidak musiman dari model (P,D,Q) = bagian musiman dari model S = jumlah periode per musim.
Identifikasi
Proses identifikasi dari model musiman tergantung pada alat-alat statistik berupa autokorelasi dan parsial autokorelasi, serta pengetahuan terhadap sistem (atau proses) yang dipelajari.
Penaksiran Parameter
Ada dua cara yang mendasar untuk mendapatkan parameter-parameter tersebut:
a.  Dengan cara mencoba-coba (trial and error), menguji beberapa nilai yang berbeda dan memilih satu nilai tersebut (atau sekumpulan nilai, apabila terdapat lebih dari satu parameter yang akan ditaksir) yang meminimumkan jumlah kuadrat nilai sisa (sum of squared residual).
b. Perbaikan secara iteratif, memilih taksiran awal dan kemudian membiarkan program komputer memperhalus penaksiran tersebut secara iteratif.
Pengujian Parameter Model
1. Pengujian masing-masing parameter model secara parsial (t-test)
2. Pengujian model secara keseluruhan (Overall F test)
Model dikatakan baik jika nilai error bersifat random, artinya sudah tidak mempunyai pola tertentu lagi. Dengan kata lain model yang diperoleh dapat menangkap dengan baik pola data yang ada. Untuk melihat kerandoman nilai error dilakukan pengujian terhadap nilai koefisien autokorelasi dari error.