Memahami Regresi: dari Galton, hubungan statistik, hingga data ekonomi
Bab 1 membangun fondasi berpikir regresi. Gujarati menjelaskan bahwa regresi bukan sekadar garis pada grafik, tetapi suatu pendekatan untuk mempelajari ketergantungan rata-rata satu variabel terhadap variabel lain, membedakannya dari kausalitas dan korelasi, serta menegaskan pentingnya kualitas data.
Struktur Utama Chapter 1
Bab ini dapat dibaca sebagai peta berpikir berjenjang: dimulai dari sejarah istilah regresi, berkembang menuju interpretasi modern, contoh-contoh penggunaannya, perbedaan konsep, terminologi, hingga pembahasan data ekonomi.
Regresi sebagai Studi Ketergantungan Statistik
Tujuan utamanya adalah memperkirakan atau memprediksi nilai rata-rata variabel dependen berdasarkan nilai variabel penjelas yang diketahui.
Asal Historis Regresi
Galton memperkenalkan regresi melalui hubungan tinggi ayah dan anak.
- Anak dari ayah tinggi cenderung tinggi.
- Namun rata-ratanya bergerak mendekati pusat populasi.
- Dikenal sebagai regression to mediocrity.
Interpretasi Modern
Regresi digunakan untuk menjelaskan rata-rata \(Y\) berdasarkan \(X\).
- Fokus bukan hanya “kembali ke rata-rata”.
- Regresi mempelajari conditional mean.
- Variabel dependen dijelaskan oleh explanatory variables.
Contoh Regresi
Gujarati memberi contoh dari biologi, ekonomi, dan kebijakan.
- Tinggi anak terhadap tinggi ayah.
- Tinggi badan terhadap usia.
- Konsumsi terhadap pendapatan.
- Permintaan terhadap harga.
- Phillips curve dan inflasi.
Statistical vs Deterministic
Hubungan ekonomi tidak pasti, selalu memiliki variasi.
- Fisika sering bersifat deterministik.
- Ekonomi umumnya bersifat stokastik.
- Perbedaannya diringkas oleh error term \(u\).
Regression vs Causation
Hubungan statistik tidak otomatis berarti sebab-akibat.
- Kausalitas membutuhkan teori.
- Rainfall menjelaskan yield, bukan sebaliknya.
- Arah hubungan tidak ditentukan oleh angka semata.
Regression vs Correlation
Regresi bersifat asimetris, korelasi bersifat simetris.
- Regresi: estimasi dan prediksi.
- Korelasi: kekuatan hubungan linear.
- \(r_{XY}=r_{YX}\), tetapi regresi \(Y\) atas \(X\) berbeda dari sebaliknya.
Terminologi dan Notasi
Banyak istilah berbeda digunakan untuk variabel yang sama.
- Dependent variable = regressand.
- Explanatory variable = regressor.
- Model dapat memiliki satu atau banyak \(X\).
Data Ekonomi
Jenis, sumber, dan kualitas data menentukan kualitas analisis.
- Time series, cross-section, pooled, panel.
- Sumber: pemerintah, lembaga internasional, internet.
- Data sosial umumnya nonexperimental.
Rumus Inti untuk Memahami Bab 1
Bab 1 belum masuk ke teknik estimasi formal, tetapi konsep utamanya dapat diringkas melalui rumus-rumus dasar berikut.
1. Hubungan Deterministik
Semua titik tepat mengikuti suatu fungsi.
2. Hubungan Statistik
Nilai \(Y\) dipengaruhi \(X\), tetapi juga faktor lain.
3. Regresi Linear Sederhana
Bentuk paling dasar model regresi.
4. Tujuan Regresi Modern
Menjelaskan nilai rata-rata \(Y\) pada \(X\) tertentu.
Galton dan Regression to the Mean
Gujarati membuka bab dengan Francis Galton. Dalam contoh tinggi ayah dan anak, anak dari ayah tinggi cenderung tinggi, tetapi rata-rata tinggi anak tidak meningkat sebesar peningkatan tinggi ayahnya.
Distribusi Tinggi Anak berdasarkan Tinggi Ayah
Titik menunjukkan variasi tinggi anak, sedangkan garis emas menunjukkan rata-rata kelompok.
Coba Ubah Tinggi Ayah
Simulasi berikut memperlihatkan mengapa prediksi rata-rata anak bergerak menuju pusat distribusi.
Regresi dalam Contoh Usia dan Tinggi Badan
Gujarati menampilkan contoh tinggi badan anak pada usia 10–14 tahun. Pada setiap usia terdapat variasi tinggi badan, tetapi rata-rata tinggi meningkat seiring bertambahnya usia.
Distribusi Tinggi pada Usia Tertentu
Grafik memperlihatkan variasi individu dan mean height yang meningkat menurut usia.
Pilih Usia dan Amati Mean Height
Regresi modern tidak memprediksi semua individu secara persis, tetapi memprediksi nilai rata-rata kelompok.
Kurva Phillips dan Money Holding terhadap Inflasi
Dua contoh ini menunjukkan bahwa regresi dapat digunakan untuk membaca hubungan ekonomi yang relevan bagi kebijakan dan perilaku masyarakat.
Pengangguran vs Perubahan Upah
Semakin tinggi pengangguran, tekanan kenaikan upah cenderung melemah.
Inflasi vs \(k=\frac{Money}{Income}\)
Semakin tinggi inflasi, masyarakat cenderung menahan proporsi uang lebih kecil.
Statistical Relationship vs Deterministic Relationship
Gujarati membedakan hubungan pasti seperti hukum fisika dengan hubungan ekonomi yang lebih longgar. Dalam ekonomi, nilai \(Y\) pada tingkat \(X\) tertentu hampir selalu berbeda antarobservasi karena adanya faktor lain.
Regression, Causation, dan Correlation
Gujarati menegaskan dua pembedaan yang sangat penting: regresi tidak otomatis membuktikan kausalitas, dan regresi berbeda dari korelasi.
Regression vs Causation
- Regresi menunjukkan pola ketergantungan statistik.
- Kausalitas memerlukan dasar teori atau logika substantif.
- Curah hujan dapat memengaruhi hasil panen, bukan sebaliknya.
- Arah hubungan tidak ditentukan oleh angka semata.
Regression vs Correlation
- Korelasi mengukur derajat hubungan linear.
- Regresi digunakan untuk estimasi atau prediksi.
- Korelasi \(r_{XY}=r_{YX}\), sifatnya simetris.
- Regresi \(Y\) atas \(X\) berbeda dari regresi \(X\) atas \(Y\).
Regresi
Model diarahkan untuk menjelaskan \(Y\).
Korelasi
Mengukur kekuatan hubungan linear.
Kausalitas
Tidak cukup dibuktikan hanya dari scatter plot.
Pesan Gujarati
Association bukan otomatis causation.
Ubah Nilai Korelasi
Korelasi tinggi menandakan hubungan linear kuat, tetapi tidak otomatis membuktikan kausalitas.
Apa Artinya Korelasi?
Panel ini menerjemahkan nilai korelasi ke dalam bahasa yang lebih intuitif.
Mengapa korelasi bukan kausalitas?
- Bisa ada variabel ketiga yang memengaruhi keduanya.
- Arah hubungan bisa terbalik.
- Hubungan bisa terjadi secara kebetulan.
- Teori ekonomi dan desain penelitian tetap diperlukan.
Tabel Istilah Variabel dalam Regresi
Gujarati menunjukkan bahwa literatur ekonometrika menggunakan banyak istilah untuk menyebut variabel dependen dan variabel penjelas.
| No. | Dependent Variable | Explanatory Variable | Makna Praktis |
|---|---|---|---|
| 1 | \(Y\) | \(X\) | Notasi paling umum dalam model regresi. |
| 2 | Explained Variable | Independent Variable | \(Y\) dijelaskan oleh \(X\). |
| 3 | Predictand | Predictor | Digunakan ketika fokus analisis adalah prediksi. |
| 4 | Regressand | Regressor | Istilah khas dalam teori regresi. |
| 5 | Response | Stimulus | Umum dalam bidang perilaku atau eksperimen. |
| 6 | Endogenous | Exogenous | Banyak dipakai dalam pemodelan ekonomi. |
| 7 | Outcome | Covariate | Sering dipakai dalam studi empiris modern. |
| 8 | Controlled Variable | Control Variable | Istilah dalam konteks pengendalian model. |
Jenis Data dalam Analisis Ekonometrika
Gujarati menekankan bahwa regresi bergantung pada data. Bentuk data memengaruhi jenis analisis yang dapat dilakukan.
Time Series Data
Contoh: money supply bulanan, GDP tahunan, atau pengangguran triwulanan.
Simulator Risiko Kualitas Data
Gujarati mengingatkan bahwa data ekonomi sering menghadapi persoalan: sifat nonexperimental, nonresponse, measurement error, agregasi tinggi, keterbatasan kerahasiaan, dan variasi metode sampling.
Indeks Risiko Kualitas Data
Ratio, Interval, Ordinal, dan Nominal Scale
Teknik ekonometrika yang cocok untuk variabel rasio belum tentu cocok untuk variabel nominal. Karena itu, pengenalan skala data menjadi penting.
Ratio Scale
Rasio, jarak, dan urutan bermakna. Contoh: GDP, pendapatan.
Interval Scale
Jarak dan urutan bermakna, tetapi rasio tidak. Contoh: tahun kalender.
Ordinal Scale
Hanya urutan yang bermakna. Contoh: grade A, B, C.
Nominal Scale
Hanya kategori. Contoh: status perkawinan atau gender.
Simulator Klasifikasi Skala Variabel
Advertising Expenditure vs Impressions Retained
Exercise 1.7 meminta mahasiswa memplot impressions terhadap advertising expenditure untuk 21 perusahaan. Dashboard ini membantu membaca pola hubungan secara visual.
Tabel Data 21 Perusahaan
Data menunjukkan pengeluaran iklan dan jumlah impressions yang masih diingat audiens.
| Firm | Impressions | Ad Expenditure |
|---|
Scatter Plot Interaktif
Grafik memperlihatkan apakah expenditure iklan yang lebih tinggi cenderung berkaitan dengan impressions yang lebih besar.
Interpretasi Awal Exercise 1.7
- Terdapat kecenderungan hubungan positif antara expenditure dan impressions.
- Namun pola hubungan tidak membentuk garis linear sempurna.
- Beberapa perusahaan memperoleh impressions tinggi tanpa expenditure terbesar.
- Efektivitas iklan dapat dipengaruhi kreativitas, merek, strategi media, dan kualitas pesan.
Inti Chapter 1 yang Harus Dipahami Mahasiswa
Chapter 1 bukan sekadar bab pengantar. Ia membentuk cara berpikir ekonometrika: memahami bahwa regresi mempelajari ketergantungan statistik, tidak otomatis membuktikan kausalitas, perlu dibedakan dari korelasi, dan harus didukung oleh data yang baik.
Regresi adalah studi tentang nilai rata-rata variabel dependen berdasarkan variabel penjelas.
Dalam ekonomi, hubungan hampir selalu mengandung komponen acak atau error term.
Data nonexperimental, bias survei, dan agregasi tinggi menuntut interpretasi yang hati-hati.
Scatter plot, kurva mean, dan distribusi titik membantu mahasiswa melihat konsep regresi.