Pendidikan Penelitian Pengabdian Pelatihan
Mat Eko 1 Mat Eko 2 Stat Eko 1 Stat Eko 2 Ekonometrika 1 Ekonometrika 2
Jurnal Pemb Jurnal Moneter Jurnal Perencanaan
Diskusi Stat Eko Diskusi Ekonometrika Diskusi Blog
Mat Eko 1 Mat Eko 2 Stat Eko 1 Stat Eko 2 Ekonometrika 1 Ekonometrika 2 Ekonomi Manajerial Olah Data Statistika
Uji Normalitas Uji Autokorelasi Uji Multikolinearitas Uji Heteroskedastisitas Uji Liniearitas Contoh Menu 5
Slmt Datang Di Blog Page Rank Di Blog Memasang Jam Blog Memasang File PPT, DOC excel dan pdf Membuat Efek Remote Linking Pada Gambar Membuat Gambar Berputar Memasang Jam Online Animasi Flash Teks Berwarna Anti COPAS dan Klik Kanan Tanggal Di Blog Kotak Teks Di Blog
BPS BI Kebij Moneter Kebij Fiskal Kalkulator Kurs Contoh Menu 5
Abg/Ade Blog Bbg TtphS EPFEUP MK Stat Eko (1 MK Stat Eko (2) Abg dan Ade Blog

Selasa, 01 April 2014

KORELASI DAN REGRESI LINEAR SEDERHANA

1.      Korelasi
Pada semua kejadian, baik kejadian ekonomi maupun lainnya, pasti ada faktor yang menyebabkan terjadinya kejadian-kejadian tersebut. Misal, angka penjualan suatu barang yang turun disebabkan oleh naiknya harga barang tersebut. Contoh lain, seorang anak yang tidak belajar mendapatkan nilai jelek pada saat ulangan, dll.
Uraian di atas menunjukkan adanya hubungan atau korelasi antara kejadian yang satu dengan kejadian yang lainnya. Kejadian itu dapat dinyatakan dengan perubahan nilai variabel. Misal, jika x merupakan variabel harga, maka naik turunnya harga dapat dinyatakan dengan perubahan nilai x. Dan apabila y merupakan variabel hasil penjualan, maka naik turunnya hasil penjualan dapat dinyatakan dengan perubahan nilai y. Jadi, hubungan antara dua kejadian dapat dinyatakan dengan hubungan dua variabel x dan y. Disini saya hanya akan menjelaskan tentang hubungn antara dua variabel, hubungan linier lebih dari dua variabel akan dijelaskan pada subbab berikutnya.
Pada contoh diuraian sebelumnya, kita tentu setuju jika dikatakan bahwa naik turunnya harga mempengaruhi hasil penjualan. Namun dalam hal ini kita tidak tahu pasti seberapa besar pengaruhnya. Analisis Korelasi yang akan dibahas kali ini berfungsi untuk mengetahui seberapa besar atau seberapa kuat suatu relasi antar dua variabel.
2.      Ukuran korelasi
            Hubungan dua variabel ada yang positif dan negatif. Suatu hubungan dikatakan positif apabila kenaikan/penurunan x pada umumnya diikuti oleh kenaikan/penurunan y. Sebaliknya dikatakan negatif bila kenaikan/penurunan x pada umumnya diikuti oleh penurunan/kenaikan y.  Perhatikan Gambar 1 dan 2.

Gambar 1. Korelasi positif

Gambar 2. Korelasi negatif.

Contoh korelasi positif:
            x = pupuk,                   y = produksi
            x = biaya iklan,            y = hasil penjualan
            x = berat badan,          y = tekanan darah
Contoh korelasi negatif:
            x = harga suatu barang,           y = permintaan barang
            x = pendapatan masyarakat,   y = kejahatan ekonomi
Apabila diagram pencar tidak teratur, artinya kenaikan/penurunan x tidak berpengaruh pada kenaikan/penurunan x. Maka dapat dikatakan x dan y tidak berkorelasi.
3.      Koefisien korelasi
            Kuat dan tidaknya hubungan antara x dan y apabila dinyatakan denagn fungsi linier, diukur dengan suatu nilai yang disebut koefisien korelasi (r). Nilai koefisien korelasi ini paling sedikit bernilai -1 dan paling besar bernilai 1. Jadi dapat dinyatakan sebagai berikut:
-1<= r >= 1
Artinya:
·         Jika r = 1, hubungan x dan y sempurna dan positif (mendekati 1, yaitu hubungan sangat kuat dan positif).
·         Jika r = -1, hubungan x dan y sempurna dan negatif (mendekati -1, yaitu hubungan sangat kuat dan negatif).
·         Jika r = 0, tidak ada hubungan atau lemah sekali hubungan antara x dan y.

Cara menghitung nilai r yakni:

Rumus ini merupakan rumusan koefisien korelasi Pearson.

4.      Koefisien Penentu
            Nilai x dikatakan mempengaruhi y karena kenaikan atau penurunan x mempengaruhi nilai y. Namun dalam diagram pencar, nilai y memiliki nilai yang bervariasi meskipun nilai y naik dalam deret ukur. Hal ini terjadi karena nilai y tidak hanya dipengaruhi oleh variabel x namun juga beberapa faktor lain. Misal, hasil penjualan tidak hanya dipengaruhi oleh harga pasar tapi melainkan juga dipengaruhi oleh pendapatan masyarakat, selera, dll. Dari sini timbul pertanyaan, beraa besarnya kontribusi dari x terhadap naik turunnya nilai y? Untuk menjawab pertanyaan ini harus dihitung dulu suatu koefisien yang disebut keofisien determinasi atau koefisien penentu (KP). Nilai KP dicari dengan rumus,
KP = r2
Jika r = 0.9 maka nilai KP = (0.9)2 = 0.81 atau 81%. Hal ini berarti besar kontribusi dari x terhadap nilai y sebesar 81%, dan 19% lainnya adalah kontribusi dari faktor-faktor lainnya.

Contoh soal korelasi:
  1. Jika x adalah presentase kenaikan biaya iklan dan y adalah presentase kenaikan hasil penjualan, kemudian berdasarkan tabel dibawah ini, hitunglah koefisien korelasi (r)!
x
1
2
4
5
7
9
10
12
Y
2
4
5
7
8
10
12
14

Penyelesaian :
untuk menghitung r diperlukan lembaran kerja yang disusun berdasarkan rumus sebagai berikut :
x
Y
x2
y2
xy
1
2
1
4
2
2
4
4
16
8
4
5
16
25
20
5
7
25
49
35
7
8
49
64
56
9
10
81
100
90
10
12
100
144
120
12
14
144
196
168
Σxi = 50
Σyi = 62
Σxi2 = 420
Σyi2 = 598
Σxiyi = 499

2.  2. Jika X adalah presentase kenaikan harga dan Y adalah presentase kenaikan hasil penjualan, kemudian berdasarkan tabel dibawah ini, hitunglah koefisien korelasi (r) dan kofisien determinasi (KP) !
X
2
4
5
6
8
10
11
13
14
15
Y
15
14
12
10
9
8
6
4
3
2

Penyelesaian :
untuk menghitung r diperlukan lembaran kerja yang disusun berdasarkan rumus sebagai berikut :
X
Y
X2
Y2
XY
2
15
4
225
30
4
14
16
196
56
5
12
25
144
60
6
10
36
100
60
8
9
64
81
72
10
8
100
64
80
11
6
121
36
66
13
4
169
16
52
14
3
196
9
42
15
2
225
4
30
ΣXi=88
ΣYi=83
ΣXi2= 956
ΣYi2=875
ΣXiYi=548
Kesimpulan: hubungan X dan Y kuat dan negatif. Dengan demikian, nilai KP = r2 = (-0.99)2 = 0.9801 = 0.98 = 98%.

5.      Regresi
Apa perlunya mengetahui hubungan antar variable? Di dalam perencanaan, selain data masa lampau dan masa sekarang, juga diperlukan data hasil ramalan yang menggambarkan kemampuan di masa yang akan datang. Misalnya, perusahaan dalam merencanakanproduksi memerlukan ramalan hasil penjualan (kemampuan menjual di masa yang akan datang, sehingga dapat dicegah terjadinya overproduction atau underproduction).
Apabila dua variable X dan Y mempunyai hubungan, maka nilai variable X yang sudah diketahui dapat digunakan untuk menaksir/memperkirakan nilai variable Y.
Variable Y yang nilainya akan diramalkan disebut variable tidak bebas (dependent variable), sedangkan variable X yang nilainya digunakan untuk  meramalkan nilai Y disebut variable bebas (independent variable).
Jadi analisis korelasi membantu kita untuk mengetahui seberapa kuat hubungan antara dua variable, sedangkan analisis regresi membantu kita untuk:
1.      Mengetahui apakah ada relasi/hubungan antar variable
2.      Membantu menentukan jenis persamaan yang akan digunakan untuk menentukan hubungan tersebut..
        
6. Diagram pencar
         Jika terdapat sebuah data antara dua variable dan kita belum dapat memastikan apakah data tersebut memiliki hubungan satu sama lain atau tidak, cara untuk mengetahuinya adalah dengan cara menggunakan diagram pencar (scatter diagram).
Gambar 3. Macam-macam scatter diagram

         Pada kesempatan ini hanya akan dijelaskan mengenai regresi linear sederhana yakni regresi yang berbentuk garis lurus atau linear (gambar (a), dan (b)).
7. Persamaan Regresi Linear Sederhana
         Bentuk umum persamaan regresi linier:  y = a + bx
                        y          : peubah takbebas                    x          : peubah bebas
                        a          : konstanta                               b          : kemiringan/gradien
                                               


·      Penetapan Persamaan Regresi Linier Sederhana
Dengan,           n  : banyak pasangan data
yi  : nilai peubah takbebas y ke-i
xi  : nilai peubah bebas x ke-i

Contoh soal regresi linear sederhana:
1.      Berikut adalah data Biaya Promosi dan Volume Penjualan  PT BIMOIL perusahaan Minyak Goreng. Banyaknya data ada lima data. Tentukan persamaan regresinya!

Tahun
x
Biaya Promosi
(Juta Rupiah)
Y
Volume Penjualan (Ratusan Juta Liter)

xy


1992
            2
            5
            10
             4
            25
1993
            4
            6
            24
           16
            36
1994
            5
            8
            40
           25
            64
1995
            7
          10
            70
           49
          100
1996
            8
          11
            88
           64
          121
S
 Sx = 26
  Sy = 40
Sxy = 232
Sx² =158
Sy² = 346


bentuk umum persaman regresi linier sederhana : y = a + b x
y = a + b x       ®        y = 2.530 + 1.053 x

2.      Diketahui hubungan Biaya Promosi  (x dalam Juta Rupiah) dan y (Volume penjualan dalam Ratusan  Juta liter) dapat dinyatakan dalam persamaan regresi linier berikut
y = 2.530  + 1.053 x. Perkirakan Volume penjualan jika dikeluarkan biaya promosi Rp. 10 juta ?

Penyelesaian:   y = 2.530  + 1.053 x
                        x = 10
                        y = 2.53 + 1.053 (10) = 2.53 + 10.53 = 13.06 (ratusan juta liter)
Volume penjualan = 13.06 x 100 000 000 liter

8. Standar Error Estimasi
         Dalam menggunakan persamaan regresi untuk melakukan suatu perkiraan, terdapat satu pertanyaan penting mengenai seberapa kuat hubungan antar variable bebas dan terikatnya; atau dengan kata lain, seberapa besar derajat ketergantungannya (dependability) hasil perkiraan tersebut. Hal ini dapat lebih dimengerti dengan memperhatikan gambar 4 (a), terlihat bahwa titik-titik data terpencar lebih rapat di sekitar garis regresi dibandingkan dengan titik-titik data pada gambar 4 (b). Dengan nalar secara awam saja, kita dapat mengatakan bahwa suatu estimasi yang dilakukan dengan persamaan garis regresi untuk keadaan pada gambar 4 (a) akan lebih baik dibandingkan untuk keadaan pada gambar 4 (b).

Gambar 4

            Ukuran yang mengindifikasi derajat variasi sebaran data di sekitar garis regresi dapat menunjukkan seberapa besar derajat keterikatan perkiraan yang diperoleh dengan menggunakan persamaan regresi tersebut. Ukuran ini dinamakan sebagai standar error estimasi. Dalam definisi yang lebih tepat standar error estimasi estimasi (sy,x) adalah deviasi standar yang memberikan ukuran penyebaran nilai-nilai yang teramati di sekitar garis regresi, dirumuskan sebagai berikut:
Contoh soal:
Dari suatu praktikum fisika dasar diperoleh data yang menghubungkan variabel bebas x dan variabel terikat y seperti ditunjukkan dalam tabel berikut:
Ujian ke-
x
y
1
6
30
2
9
49
3
3
18
4
8
42
5
7
39
6
5
25
7
8
41
8
10
52
S
56
296

Jika diasumsikan memiliki bentuk hubungan yang linear, maka hitunglah persamaan garis regresinya dan standar error estimasinya!
Penyelesaian:
Ujian ke-
x
y
xy
x2
y2
1
6
30
180
36
900
2
9
49
441
81
2401
3
3
18
54
9
324
4
8
42
336
64
1764
5
7
39
273
49
1521
6
5
25
125
25
625
7
8
41
328
64
1681
8
10
52
520
100
2704
S
56
296
2257
428
12920

·         Nilai konstanta b dapat ditentukan:
·         Nilai konstanta a dapat ditentukan:
Jadi persamaan regresi linear yang menggambarkan hubungan antara variabel x dan y dari data sampel pada percobaan/praktikum di atas adalah:
y = 1.0277 + 5.138 x
·         Menghitung standar error estimasi:


Perkiraan atau Pendugaan Interval
Pada teori pendugaan (estimation theory) terdapat dua hal yang penting yaitu pendugaan interval (confidence interval, atau interval estimation) dan pendugaan tunggal (prediction interval atau point estimation). Pendugaan interval dimaksudkan untuk menggambarkan nilai tengah untuk setiap nilai X tertentu, sedang pendugaan tunggal untuk menggambarkan kisaran nilai untuk setiap nilai X tertentu.
1.1  Pendugaan Nilai – Tengah Y.
Pendugaan interval nilai tengah Y dimaksudkan untuk mengetahui nilai dugaan bagi Y untuk seluruh nilai X yang diketahui. Telah disinggung pada sub-bab sebelumnya bahwa dalam model regresi linier ini, dengan adanya nilai pengamatan dari nilai dugaannya, suatu nilai peubah bebas X tertentu dapat memberikan beragam nilai peubah Y yang bervariasi  yang pusatnya diperkirakan terletak pada titik yx = β0 + β1x.  Dengan kata lain, nilai harapan Y pada X tertentu adalah β0 + β1X. Nilai tengah Y tersebut diduga oleh y = b0 + b1x dengan galat baku:





sehingga selang kepercayaan (1 – α) 100% bagi µyıx adalah:

Contoh 1
Berikut ini adalah delapan pengukuran pada tinggi anak dengan tinggi bapak dan tinggi anak sulungnya (cm). 

Tentukan selang kepercayaan 95% bagi nilai-tengah tinggi badan anak yang bapaknya memiliki tinggi 165 cm!
Jawab:
Untuk pengamatan tersebut dapat dibuat tabel berikut ini (X untuk tinggi bapak, Y untuk tinggi anak)

Model Regresinya adalah:
sehingga Y = 64.70 + 0.623x
Penduga titik nilai – tengah tinggi anak yang bapaknya memiliki tinggi 165 cm adalah:
 µy|x=165 = 64.70 + (0.623) (165) = 167.495 cm
Galat baku dugaan tersebut adalah:


dengan t0.025,6 = 2.447
Selang kepercayaan 95% tinggi anak yang bapaknya memiliki tinggi 165 cm adalah :


  
1.2. Pendugaan Satu Nilai y pada x tertentu (Pendugaan Tunggal)
           
Nilai y pada x tertentu juga diduga dengan y = b0 + b1x. Berbeda dengan nilai tengahnya, galat baku pendugaan satu nilai y adalah

 sehingga selang kepercayaan (1 - α) 100% bagi y pada x tertentu adalah

Contoh 2
Untuk data pada contoh 1 tentukan selang kepercayaan 95% bagi tinggi badan seorang anak yang bapaknya memiliki tinggi 165 cm!
Jawab:
Penduga titik nilai y pada tinggi anak yang bapaknya memiliki tinggi 165 cm adalah
y|x=165 = 64.70 + (0.623) (165) = 167.495 cm
Galat baku dugaan tersebut adalah:


dengan t0.025,6 = 2.447
Selang kepercayaan 95% tinggi anak yang bapaknya memiliki tinggi 165 cm adalah :
 
  Tabel Analisis Ragam
                        Analisis ragam atau analysis of variance(ANOVA) adalah suatu metode untuk
menguraikan keragaman total data menjadi komponen-komponen yang mengukur
berbagai sumber keragaman. Pengujian model dapat juga dilakukan dengan menggunakan analisis ragam. Perhatikan bahwa jumlah kuadrat total dapat diuraikan menjadi jumlah kuadrat regresi dan jumlah kuadrat galat sebagai berikut:


Sementara itu, derajat bebas masing – masing jumlah kuadrat tersebut berturut – turut adalah:
DB(Total) = n – 1
DB(Regresi) = 1
DB(Galat)= n-2
Sedangkan DB(Total)= DB(Regresi) + DB(Galat)
Tabel Analisis dengan demikian dapat disusun, sebagai berikut:
Nilai Fhitung dari table analisis raga mini adalah nilai F uji atas hipotesis H0 : σ2regresi = σ2sisa  v.s. H1 : σ2regresi = σ2sisa
Nilai Fhitung yang lebih dari Fα, DB(Regresi),DB(Galat) yang berarti tertolaknya H0 pada taraf nyata α, diinterpretasikan bahwa persamaan regresi linear yang terpasang pada data adalah berperan dalam menjelaskan keragaman total. Dengan kata lain, tertolaknya H0 dalam uji-F tadi menunjukkan adanya peran peubah bebas dalam menjelaskan keragaman peubah tak bebas, atau keragaman data bukanlah sekedar keragaman acak tetapi berkaitan dengan keragaman peubah bebas menurut persamaan regresi linier.
Contoh 3
Untuk data pada contoh 1 buatlah tabel analisis ragam untuk regresi tinggi badan anak pada tinggi badan bapaknya!
Jawab :
Untuk data pada contoh 1 dapat disusun tabel perhitungan sebagai berikut :
Dari tabel diperoleh:
            JK (Galat)       =  375.80
JK (Total)        =  463.50
JK (Regresi)    = JK(Total) – JK (Galat)
= 463.50 – 375.80
= 87.7
Tabel Analisis Ragam untuk regresi tinggi badan anak pada tinggi badan bapaknya :
Adapun F0.05,1.6 = 5.99
Dengan Fhitung tidak lebih dari F0.05,1.6 maka keputusan ujinya adalah tidak tolak H0. Berdasarkan data tabel tersebut , persamaan regresi linier yang terpasang pada data belum bisa dikatakan berperan dalam menjelaskan keragaman total.

        Kesesuaian Model Regresi
Kesesuaian model merupakan ukuran untuk mengetahui kesesuain atau ketepatan antara nilai dugaan atau garis regresi dengan data sample. Ukuran kesesuaian  model ini disebut Koefisien Determinasi (R2).  Koefisien Determinasi adalah bagian dari keragaman total variable tak bebas Y (variable yang dipengaruhi atau dependent) yang dapat diterangkan atau diperhitungkan oleh keragaman variable bebas X (variabel yang mempengaruhi atau independent). Jadi koefisien determinasi adalah kemampuan variable X (variable independent) mempengaruhi variable Y (variable dependent). Semakin besar koefisien determinasi menunjukan semakin baik kemampuan X menerangkan Y. Besarnya koefisien determinasi adalah kuadrat dari koefisien korelasi dan dirumuskan sbb :




Nisbah kuadrat tengah total pada kuadrat tengah galat menunjukkan besarnya keragaman data yang tidak terjelaskan oleh model. Koefisien determinasi dengan demikian menyatakan besarnya keragaman yang terjelaskan oleh model. Nilai minimum koefisien determinasi adalah 0, dan nilai maksimumnya adalah 1. Semakin besar nilai koefisien determinasi, mendekati angka 1, semakin sesuai model yang dipasang dengan data yang dibicarakan. Koefisien determinasi kadang – kadang juga dinyatakan dalam persen, sehingga nilainya berkisar antara 0 – 100%.
Contoh 4
Hitunglah besarnya koefisien determinasi untuk regresi tinggi badan anak pada tinggi badan bapaknya!
Jawab:
Dari contoh 1, koefisien determinasi regressi tersebut adalah:
Koefisien determinasi untuk model regresi ini sangat kecil, menunjukkan model ini kurang baik dalam menjelaskan keragaman peubah respon dalam kaitannya dengan peubah penjelas. Kurang baiknya model ini mungkin karena antara kedua peubah tersebut pada kenyataannya tidak berkaitan satu sama lain, atau keterkaitan antara peubah tersebut ada tetapi tidak linier.

Sumber:
Dapat diklik di PRS & PRB

2 komentar:

MENU BAR