Nama:
Harmi Sugiarti & Andi Megawarni
Judul:
Selang Kepercayaan Untuk Koefisien Garis Regresi Dalam Hal Ragam Galat Tidak
Homogen Menggunakan Metode OLS dan WLS
Tanggal: Maret, 2002
Abstract
The assumption of homogeneous error variance underlying the OLS method was so important in getting the best linear unbiased estimation of the regression coefficients. Violation of this assumption could reduce the accuracy of confidence interval of the regression coefficients.This paper aims at comparing the width of confidence interval which results from OLS and WLS methods when the error term was not homogen. Using simulation data with MINITAB indicates that the width of confidence interval results from WLS method ere narrower compare to OLS method.
PENDAHULUAN
Hubungan linear antara peubah respons dengan p peubah bebas dapat dimodelkan sebagai: . Yi adalah nilai peubah respons pada pengamatan ke-i dan Xi adalah nilai peubah bebas pada pengamatan ke-i. adalah koefisien regresi yang tidak diketahui nilainya, ei adalah suku galat yang bersifat acak dengan mean nol (E(ei) = 0) dan ragam sama untuk setiap pengamatan (s2(ei ) = s2) serta ei dan ej tidak berkorelasi untuk setiap ij, i,j = 1, 2, ... ,n.
Penduga bagi parameter b berupa selang kepercayaan dapat diperoleh melalui metode kuadrat terkecil biasa (ordinary least square, OLS). Dengan metode ini dapat diperoleh suatu penduga yang bersifat tak bias linear terbaik (best linear unbiased estimation, BLUE). Salah satu asumsi dasar yang harus dipenuhi metode OLS adalah terpenuhinya teorema Gauss-Markov yaitu ragam galat sama untuk setiap pengamatan (s2(ei ) = s2) biasanya disebut asumsi kehomogenan ragam galat.
Dalam hal terdapat penyimpangan terhadap asumsi, khususnya penyimpangan asumsi kehomogenan ragam galat, metode OLS akan menghasilkan penduga tak bias linear dengan ragam yang tidak minimum. Apabila hubungan regresi yang tepat telah diperoleh tetapi ragam galat masih tetap tidak homogen, maka salah satu alternatifnya adalah metode kuadrat terkecil terbobot (weighted least square, WLS). Metode WLS adalah suatu metode yang cukup efektif dalam kondisi ragam galat tidak homogen. Adapun tujuan dari tulisan ini adalah dengan menggunakan data hasil simulasi dan data hasil eksperimen ingin dibandingkan lebar selang kepercayaan koefisien garis regresi yang diperoleh menggunakan metode OLS dan lebar selang kepercayaan koefisien garis regresi yang diperoleh dengan menggunakan metode WLS dalam hal ragam galat tidak homogen.
SELANG KEPERCAYAAN
Selang kepercayaan adalah suatu kisaran nilai yang dianggap mengandung nilai parameter populasi yang sebenarnya. Besaran B dan A dikatakan menentukan selang kepercayaan (1-a)100% bagi suatu parameter apabila memenuhi kriteria berikut:
a. P[B nilai parameter yang sebenarnya A] (1-a) dan
b. Nilai-nilai B dan A dapat dihitung apabila sampel telah diambil dari populasi dan digunakan untuk menghitung kedua batas tersebut.
Selang kepercayaan yang cukup baik adalah selang kepercayaan yang mempunyai lebar selang yang sempit dan persentase selang yang memuat parameter cukup besar (Koopmans, 1987).
METODE KUADRAT TERKECIL
Hubungan linear antara satu peubah respons dengan p peubah bebas dapat dinyatakan sebagai: atau dengan notasi matriks dapat ditulis sebagai: . Dalam hal ini Y adalah vektor respons, X adalah matriks konstanta, b adalah vektor parameter dan e adalah vektor galat bersifat acak normal bebas dengan nilai harapan E(e) = 0 dan matriks ragam koragam , dimana I adalah matriks identitas.
Untuk mendapatkan nilai dugaan bagi parameter yaitu dapat digunakan metode kuadrat terkecil. Pada dasarnya, metode ini meminimumkan jumlah kuadrat simpangan Y dari nilai harapannya yaitu meminimumkan , sehingga dengan menyelesaikan persamaan normal , akan diperoleh penduga OLS bagi b adalah .
Selang kepercayaan (1-a)100% untuk parameter b dapat diperoleh sebagai: dan lebar selang dapat dinyatakan dengan , p menyatakan banyaknya peubah bebas dalam model, n menyatakan banyaknya pengamatan, dan (Draper,1981).
Selang kepercayaan (1-a)100% untuk parameter b dapat diperoleh sebagai: dan lebar selang dapat dinyatakan dengan , p menyatakan banyaknya peubah bebas dalam model, n menyatakan banyaknya pengamatan, dan (Draper,1981).
METODE KUADRAT TERKECIL TERBOBOT
Jika pada OLS setiap pengamatan diberi pembobot yang sama, maka pada metode WLS setiap pengamatan diberi pembobot yang tidak sama. Untuk model dengan , dimana V adalah matriks diagonal dengan , penduga untuk koefisien persamaan regresi adalah (Myers, 1990).
Dengan demikian jika digunakan pembobot , , maka akan diperoleh penduga untuk koefisien persamaan regresi yaitu: , jika diketahui. Sedangkan untuk tidak diketahui, kita dapat menduga melalui rata-rata kuadrat galat murni untuk setiap kelompok ulangan berdasarkan pengamatan nilai rata-rata peubah bebas X. Selang kepercayaan (1-a)100% untuk parameter b* dapat diperoleh sebagai dan lebar selang dinyatakan dengan , , p menyatakan banyaknya peubah bebas dalam model dan n menyatakan banyaknya pengamatan (Neter,1990).
HETEROSKEDASTISITAS
Salah satu asumsi yang penting dalam model regresi linear adalah ragam galat homogen (homoskedastisitas) atau s2(ei) =s2 . Jika asumsi ini tidak dipenuhi, maka kondisi yang ada disebut ragam galat tidak homogen (heteroskedastisitas).
Untuk mengetahui apakah suatu model regresi mengalami heteroskedastisitas atau tidak, salah satunya dapat digunakan uji Goldfelt-Quandt (Gujarati,1988).
DATA
Data yang dipergunakan dalam tulisan ini adalah data simulasi yang dibangkitkan dengan bantuan paket program MINITAB 11.12 dan data eksperimen, yaitu berupa data rata-rata panjang daun (cm) tanaman temulawak (Curcuma Xanthorrhiza Roxb.) pada umur 17 minggu yang diberi pupuk kandang pada berbagai taraf (tanpa pupuk, 0,5 kg/lubang, 1 kg/lubang) dan ditanam pada 2 variasi jarak tanam yaitu 60 X 40 cm dan 60 X 60 cm (Priono, 1988).
HASIL DARI DATA SIMULASI
Sebanyak tiga kelompok galat (e1 , e2 , e3) dibangkitkan secara terpisah dengan software MINITAB, dimana masing-masing kelompok berisi sepuluh galat (Tabel 1).
Tabel 1: Data Simulasi
Pengamatan | X1 | X2 | e | Y | | |
1. | 48 | 53 | -0,02759 | 100.972 | 1 | 1 |
2. | 95 | 26 | 0,6587 | 121.659 | 1 | 1 |
3. | 42 | 1 | -1,26903 | 41.731 | 1 | 1 |
4. | 62 | 46 | 1,83219 | 109.832 | 1 | 1 |
5. | 34 | 22 | -0,50565 | 55.494 | 1 | 1 |
6. | 17 | 11 | -1,03007 | 26.97 | 1 | 1 |
7. | 23 | 90 | -1,35382 | 111.646 | 1 | 1 |
8. | 62 | 50 | 0,60968 | 112.61 | 1 | 1 |
9. | 83 | 24 | 0,54867 | 107.549 | 1 | 1 |
10. | 79 | 91 | 0,49285 | 170.493 | 1 | 1 |
11. | 42 | 62 | -0,08276 | 103.917 | 9 | 0,1111 |
12. | 18 | 13 | 1,9761 | 32.976 | 9 | 0,1111 |
13. | 89 | 36 | -3,80709 | 121.193 | 9 | 0,1111 |
14. | 8 | 40 | 5,49658 | 53.497 | 9 | 0,1111 |
15. | 76 | 14 | -1,51694 | 88.483 | 9 | 0,1111 |
16. | 2 | 36 | -3,09022 | 34.91 | 9 | 0,1111 |
17. | 37 | 23 | -4,06147 | 55.939 | 9 | 0,1111 |
18. | 5 | 89 | 1,82903 | 95.829 | 9 | 0,1111 |
19. | 21 | 28 | 1,64601 | 50.646 | 9 | 0,1111 |
20. | 48 | 89 | 1,47856 | 138.479 | 9 | 0,1111 |
21. | 83 | 88 | -0,13793 | 170.862 | 25 | 0,04 |
22. | 40 | 11 | 3,2935 | 54.293 | 25 | 0,04 |
23. | 60 | 24 | -6,34514 | 77.655 | 25 | 0,04 |
24. | 30 | 28 | 9,16096 | 67.161 | 25 | 0,04 |
25. | 37 | 100 | -2,52823 | 134.472 | 25 | 0,04 |
26. | 66 | 74 | -5,15036 | 134.85 | 25 | 0,04 |
27. | 69 | 82 | -6,76912 | 144.231 | 25 | 0,04 |
28. | 67 | 11 | 3,04839 | 81.048 | 25 | 0,04 |
29. | 55 | 26 | 2,74335 | 83.743 | 25 | 0,04 |
30. | 37 | 61 | 2,46427 | 100.464 | 25 | 0,04 |
Tabel 2: Data Eksperimen
Pengamatan | X1 | X2 | Y | | | | |
1. | 0 | 40 | 52,90 | 7,26 | 0,137760 | 10,14 | 0,0986193 |
2. | 0 | 40 | 55,07 | 7,26 | 0,137760 | 10,14 | 0,0986193 |
3. | 0 | 40 | 55,73 | 7,26 | 0,137760 | 10,14 | 0,0986193 |
4. | 0 | 60 | 46,97 | 7,26 | 0,137760 | 10,14 | 0,0986193 |
5. | 0 | 60 | 48,00 | 7,26 | 0,137760 | 10,14 | 0,0986193 |
6. | 0 | 60 | 53,50 | 7,26 | 0,137760 | 10,14 | 0,0986193 |
7. | 0,5 | 40 | 69,00 | 5,75 | 0,173883 | 10,14 | 0,0986193 |
8. | 0,5 | 40 | 70,60 | 5,75 | 0,173883 | 10,14 | 0,0986193 |
9. | 0,5 | 40 | 64,40 | 5,75 | 0,173883 | 10,14 | 0,0986193 |
10. | 0,5 | 60 | 69,27 | 5,75 | 0,173883 | 971,0 | 0,0010299 |
11. | 0,5 | 60 | 71,03 | 5,75 | 0,173883 | 971,0 | 0,0010299 |
12. | 0,5 | 60 | 71,20 | 5,75 | 0,173883 | 971,0 | 0,0010299 |
13. | 1 | 40 | 72,13 | 1697,00 | 0,000589 | 971,0 | 0,0010299 |
14. | 1 | 40 | 72,73 | 1697,00 | 0,000589 | 971,0 | 0,0010299 |
15. | 1 | 40 | 77,90 | 1697,00 | 0,000589 | 971,0 | 0,0010299 |
16. | 1 | 60 | 46,73 | 1697,00 | 0,000589 | 971,0 | 0,0010299 |
17. | 1 | 60 | 73,93 | 1697,00 | 0,000589 | 971,0 | 0,0010299 |
18. | 1 | 60 | 158,30 | 1697,00 | 0,000589 | 971,0 | 0,0010299 |
Dengan mengasumsikan , , dan diperoleh pasangan data X1 , X2 ,Y dan pembobot W pada Tabel 1. Metode kuadrat terkecil (OLS) dan WLS memberikan penduga bagi koefisien garis regresi dan standar deviasinya sebagai berikut:
Tabel 3: Penduga Koefisien Garis Regresi Data Simulasi
Koefisien Regresi | OLS | WLS | ||
| | | | |
b0 | 2,396 | 1,557 | -0,9361 | 0,7687 |
b1 | 0,96714 | 0,02383 | 1,01526 | 0,0114 |
b2 | 0,98137 | 0,02049 | 1,00305 | 0,01005 |
Dari tabel di atas tampak bahwa metode OLS memberikan nilai lebih besar dibanding metode WLS. Nilai yang lebih besar mempunyai pengaruh terhadap lebar selang yang dihasilkan, yaitu semakin besar nilai maka lebar selang yang dihasilkan juga makin lebar. Dengan demikian lebar selang yang dihasilkan dengan metode OLS akan lebih lebar dibanding selang yang dihasilkan dengan metode WLS atau dengan kata lain metode WLS menghasilkan selang yang lebih sempit dibanding metode OLS.
Secara singkat, lebar selang kepercayaan untuk koefisien garis regresi dapat dilihat pada Tabel 4 berikut ini:
Tabel 4: Lebar Selang Koefisien Garis Regresi Data Simulasi
Koefisien Regresi | Koefisien Kepercayaan 95% | Koefisien Kepercayaan 99% | ||
OLS | WLS | OLS | WLS | |
b0 | 6,3899 | 3,1548 | 8,6289 | 4,2601 |
b1 | 0,0978 | 0,0468 | 0,1321 | 0,0632 |
b2 | 0,0841 | 0,0413 | 0,1136 | 0,0557 |
HASIL DARI DATA EKSPERIMEN
Dengan menggunakan data eksperimen (Tabel 2) tentang rata-rata panjang daun tanaman temulawak berumur 17 minggu (Y) yang diberi pupuk kandang pada tiga taraf (X1) dan ditanam pada 2 variasi jarak tanaman (X2), metode OLS dan WLS memberikan penduga bagi koefisien garis regresi sebagai berikut:
Tabel 5: Penduga Koefisien Garis Regresi Data Eksperimen
Koefisien Garis Regresi | OLS | WLS | ||||
Pembobot Jarak Tanam | Pembobot Konsentrasi Pupuk | |||||
| | | | | | |
b0 | 39,04 | 27,25 | 44,78 | 20,96 | 54,071 | 4,291 |
b1 | 31,59 | 12,73 | 19,933 | 2,575 | 34,381 | 3,287 |
b2 | 0,2693 | 0,1597 | 0,2693 | 0,5198 | -0,0406 | 0,0822 |
Lebar selang kepercayaan untuk koefisien garis regresi secara singkat dapat dilihat pada Tabel 6 berikut ini:
Tabel 6: Lebar Selang Koefisien Garis Regresi Data Eksperimen
Koefisien | Koefisien Kepercayaan 95% | Koefisien Kepercayaan 99% | ||||
Garis | | WLS | | WLS | ||
Regresi | OLS | Jarak Tanam | Konsentrasi Pupuk | OLS | Jarak Tanam | Konsentrasi Pupuk |
b0 | 116,1395 | 89,3315 | 18,2882 | 160,6115 | 123,5382 | 25,2912 |
b1 | 54,2553 | 10,9747 | 14,0092 | 75,0306 | 15,1771 | 19,3736 |
b2 | 2,2150 | 2,2154 | 0,3503 | 3,0631 | 3,0637 | 0,4845 |
Jika digunakan jarak tanam sebagai pembobot, tampak bahwa lebar selang yang dihasilkan oleh metode WLS lebih sempit dibanding selang yang dihasilkan oleh metode OLS, kecuali untuk selang koefisien garis regresi b2 . Sedangkan jika konsentrasi pupuk sebagai pembobot, maka tampak bahwa lebar selang yang dihasilkan oleh metode WLS lebih sempit dibanding selang yang dihasilkan oleh metode OLS untuk semua koefisien garis regresi.
KESIMPULAN
Metode OLS memberikan lebar selang kepercayaan untuk koefisien garis regresi dengan koefisien kepercayaan 95% lebih sempit dibanding lebar selang kepercayaan untuk koefisien garis regresi dengan koefisien kepercayaan 99%, begitu juga dengan metode WLS. Hal ini disebabkan karena semakin tinggi koefisien kepercayaan yang digunakan, maka nilai sebaran t-nya semakin besar.
Metode WLS menghasilkan selang kepercayaan untuk koefisien garis regresi lebih baik dibanding metode OLS jika ragam galat tidak homogen, karena metode WLS menghasilkan selang yang lebih sempit dibanding metode OLS.
DAFTAR PUSTAKA
- Draper, N.R. & Smith, H. (1981). Applied Regression Analysis. 2nd ed. New york: Wiley.
- Gujarati, D.N. (1988). Basic Econometrics. 2nd ed. Singapore: Mc.Graw Hill.
- Koopmans, L.H. (1987). Introduction to Contemporary Statistical Methods. 2nd ed. Boston: PWS.
- Priono, M. (1988). Pengaruh Pemberian Pupuk Kandang dan Jarak Tanam terhadap Pertumbuhan Tanaman Temulawak ( Curcuma Xanthorrhiza Roxb.). Skripsi (tidak dipublikasikan). Universitas Jenderal Soedirman, Purwokerto.
Tidak ada komentar:
Posting Komentar