Nilai Konstanta Pada Persamaan Regresi Negatif! BAGAIMANA?
Table of Contents
Banyak sekali pertanyaan yang ditanyakan kepada saya mengenai konstanta/intercept negatif. Apakah ini salah? apakah ini boleh atau tidak dalam persamaan regresi. Daripada ditanya terus, maka saya buatkan artikel khusus mengenai hal ini. Sebelum dijelaskan mengenai nilai konstanta yang negatif di persamaan regresi ini, mari kita simak dulu sekilas penjelasan mengenai persamaan regresi lenear.
Analisis regresi mempelajari bentuk hubungan antara satu atau lebih peubah/variabel bebas (X) dengan satu peubah tak bebas (Y). Dalam penelitian perubah bebas ( X) biasanya peubah yang ditentukan oleh peneliti secara bebas. Sedangkan peubah tak bebas (Y) dalam penelitian berupa respon yang diukur akibat perlakuan/peubah bebas (X).
Dari hasil analisis biasanya akan terbentuk persamaan regresi dengang bentuk persamaan sebagai berikut:
Atau sering sekali dituliskan Y = a + bx
Terkadang dari hasil perhitungan nilai konstanta atau a menghasilkan nilai Negatif. Terlebih dahulu saya akan berikan beberapa contoh persamaan regresi dengan nilai konstanta yang negatif :
CONTOH 1
Akan diuji mengenai pengaruh masa kerja bekerja (dalam bulan) terhadap jumlah penjualan handphone (ceritanya ini adalah sales handphone). Rata-rata masa kerja dari 30 sampel adalah 6.4 bulan dan rata-rata penjualan bulanan adalah 34. Melalui analisis selanjutkan diperoleh persamaan berikut :
Y = -0.7 + 5.5 (X)
Konstanta / Intercept (a) = – 0.7 (dibulatkan dari -0.736)
Slope = 5.5 (dibulatkan dari 5.461)
Y = -0.7 + 5.5 (X)
Konstanta / Intercept (a) = – 0.7 (dibulatkan dari -0.736)
Slope = 5.5 (dibulatkan dari 5.461)
Intepretasi :
- Slope : setiap kenaikan 1 bulan kerja, maka jumlah handphone yang terjual adalah sebanyak 5.5 unit
- Intercept/konstanta : Jika masa kerja adalah nol, maka jumlah handphone yang terjual adalah – 0.7
Perhatikan interpretasi dari intercept yang tidak masuk akal tersebut. Pertama, mengapa harus memprediksi jumlah handphone terjual jika karyawannya belum bekerja (masa kerja = 0).
Kedua, nilai slope nya positif, maka persamaan regresinya cukup dibalik menjadi : Y = 5.5 (X) – 0.7 Jadi, jika masa kerja = 5 bulan, maka diperoleh persamaan Y = (5.5 * (5)) – 0.7 = 26.6 unit
Kedua, nilai slope nya positif, maka persamaan regresinya cukup dibalik menjadi : Y = 5.5 (X) – 0.7 Jadi, jika masa kerja = 5 bulan, maka diperoleh persamaan Y = (5.5 * (5)) – 0.7 = 26.6 unit
CONTOH 2
Seorang peneliti ingin menguji pengaruh tinggi badan (dalam centimeter) terhadap berat badan 30 orang siswa. Persamaan regresi diperoleh adalah :
Y = – 2.75 + 0.38 (X)
Konstanta / Intercept (a) = – 2.75.
Slope (b)= 0.38
Interpretasi
Slope : setiap kenaikan 1 centimeter siswa maka akan menaikkan berat badan sebesar 0.38 Kg
Intercept : Jika tinggi badang bernilai konstan (nol), maka berat badan siswa adalah – 2.75
Komentar pada konstanta, sangat aneh jika dilakukan interpretasi karena mana ada manusia yang tingginya NOL ??. Jadi ada baiknya, konstanta negatif seperti ini diabaikan saja karena dalam banyak kasus tidak masuk akal untuk diinterpretasikan.
Dengan demikian,..Jika Tinggi siswa 90 cm, maka berat badan siswa adalah Y = 0.38 (90) – 2.75 = 31.45 Kg !!
Y = – 2.75 + 0.38 (X)
Konstanta / Intercept (a) = – 2.75.
Slope (b)= 0.38
Interpretasi
Slope : setiap kenaikan 1 centimeter siswa maka akan menaikkan berat badan sebesar 0.38 Kg
Intercept : Jika tinggi badang bernilai konstan (nol), maka berat badan siswa adalah – 2.75
Komentar pada konstanta, sangat aneh jika dilakukan interpretasi karena mana ada manusia yang tingginya NOL ??. Jadi ada baiknya, konstanta negatif seperti ini diabaikan saja karena dalam banyak kasus tidak masuk akal untuk diinterpretasikan.
Dengan demikian,..Jika Tinggi siswa 90 cm, maka berat badan siswa adalah Y = 0.38 (90) – 2.75 = 31.45 Kg !!
Kesimpulan
- Konstanta negatif tidaklah menjadi persoalan dan bisa diabaikan selama model regresi yang anda uji sudah memenuhi asumsi (misal normalitas untuk regresi sederhana) atau asumsi klasik lainnya untuk regresi ganda. Selain itu, selama nilai slope tidak NOL maka tidak perlu memperdulikan konstanta negatif ini.
- Konstanta negatif umumnya terjadi jika ada rentang yang cukup jauh antara X (variabel independen) dan Y (variabel respon. misal X memiliki rentang nilai 1 – 8, sedangkan Y memiliki rentang nilai 100 – 200.
- Karena dasarnya regresi digunakan memprediksi Y berdasarkan nilai perubahan X, maka harusnya yang menjadi perhatian adalah X nya (slope), bukan nilai konstanta.
- Dalam berbagai kasus, intercept juga sering tdk masuk akan untuk diinterpreasi sehingga harus diabaikan seperti kasus2 yang saya uraikan di atas.
- Jika menggunakan SPSS, coba cek garis regresi menggunakan scatter plot untuk mengetahui posisi intercep
Rujukan Buku Yang Menjelaskan Tentang Intercept Negatif
Dougherty, C. 2002. Introduction to econometrics. 2nd ed. New York: Oxford University Press.
Bab 2 hal 13-14 memberikan contoh penjelasan mengenai konstanta negatif… Persamaan Regresi yang diperoleh adalah EARNING = –1.39 + 1.07S.
Dougherty (2002) menjelaskan : “What about the constant term? Strictly speaking, it indicates the predicted level of EARNINGS when S is 0. Sometimes the constant will have a clear meaning, but sometimes not. If the sample values of the explanatory variable are a long way from 0, extrapolating the regression line back to 0 may be dangerous. Even if the regression line gives a good fit for the sample of observations, there is no guarantee that it will continue to do so when extrapolated to the left or to the right. In this case a literal interpretation of the constant would lead to the nonsensical conclusion that an individual with no schooling would have hourly earnings of –$1.39. In this data set, no individual had less than six years of schooling and only three failed to complete elementary school, so it is not surprising that extrapolation to 0 leads to trouble” (p. 13).
Bab 2 hal 13-14 memberikan contoh penjelasan mengenai konstanta negatif… Persamaan Regresi yang diperoleh adalah EARNING = –1.39 + 1.07S.
Dougherty (2002) menjelaskan : “What about the constant term? Strictly speaking, it indicates the predicted level of EARNINGS when S is 0. Sometimes the constant will have a clear meaning, but sometimes not. If the sample values of the explanatory variable are a long way from 0, extrapolating the regression line back to 0 may be dangerous. Even if the regression line gives a good fit for the sample of observations, there is no guarantee that it will continue to do so when extrapolated to the left or to the right. In this case a literal interpretation of the constant would lead to the nonsensical conclusion that an individual with no schooling would have hourly earnings of –$1.39. In this data set, no individual had less than six years of schooling and only three failed to complete elementary school, so it is not surprising that extrapolation to 0 leads to trouble” (p. 13).
William Mendenhall. (2011). A Second Course in Statistics: Regression Analysis [7th (Seventh) Edition]. Prentice Hall.
Halaman 99 Persamaan yang diperoleh adalah Sales = – 0.100 + advertising Penjelasan Mendenhall tentang konstanta negatif ini adalah : “The least squares intercept, β0 =−.1, is our estimate of mean sales revenue y when advertising expenditure is set at x = $0. Since sales revenue can never be negative, why does such a nonsensical result occur? The reason is that we are attempting to use the least squares model to predict y for a value of x(x = 0) that is outside the range of the sample data and therefore impractical. Consequently, β0 will not always have a practical interpretation. Only when x = 0 is within the range of the x-values in the sample and is a practical value will β0 have a meaningful interpretation” (p. 99).
Halaman 99 Persamaan yang diperoleh adalah Sales = – 0.100 + advertising Penjelasan Mendenhall tentang konstanta negatif ini adalah : “The least squares intercept, β0 =−.1, is our estimate of mean sales revenue y when advertising expenditure is set at x = $0. Since sales revenue can never be negative, why does such a nonsensical result occur? The reason is that we are attempting to use the least squares model to predict y for a value of x(x = 0) that is outside the range of the sample data and therefore impractical. Consequently, β0 will not always have a practical interpretation. Only when x = 0 is within the range of the x-values in the sample and is a practical value will β0 have a meaningful interpretation” (p. 99).