Gujarati · Chapter 1 · The Nature of Regression Analysis

Gujarati · Chapter 1 · The Nature of Regression Analysis

Memahami Regresi: dari Galton, hubungan statistik, hingga data ekonomi

Bab 1 membangun fondasi berpikir regresi. Gujarati menjelaskan bahwa regresi bukan sekadar garis pada grafik, tetapi suatu pendekatan untuk mempelajari ketergantungan rata-rata satu variabel terhadap variabel lain, membedakannya dari kausalitas dan korelasi, serta menegaskan pentingnya kualitas data.

\(E(Y\mid X)\) Regresi mempelajari nilai rata-rata \(Y\) ketika \(X\) diketahui.
\(Y=f(X)+u\) Hubungan ekonomi umumnya bersifat statistik, bukan deterministik sempurna.
Regression \(\neq\) Causation Hubungan statistik tidak otomatis membuktikan sebab-akibat.
Data Matters Kualitas hasil analisis sangat dipengaruhi kualitas data yang digunakan.

Struktur Utama Chapter 1

Bab ini dapat dibaca sebagai peta berpikir berjenjang: dimulai dari sejarah istilah regresi, berkembang menuju interpretasi modern, contoh-contoh penggunaannya, perbedaan konsep, terminologi, hingga pembahasan data ekonomi.

Akar Konseptual

Regresi sebagai Studi Ketergantungan Statistik

Tujuan utamanya adalah memperkirakan atau memprediksi nilai rata-rata variabel dependen berdasarkan nilai variabel penjelas yang diketahui.

1.1

Asal Historis Regresi

Galton memperkenalkan regresi melalui hubungan tinggi ayah dan anak.

  • Anak dari ayah tinggi cenderung tinggi.
  • Namun rata-ratanya bergerak mendekati pusat populasi.
  • Dikenal sebagai regression to mediocrity.
1.2

Interpretasi Modern

Regresi digunakan untuk menjelaskan rata-rata \(Y\) berdasarkan \(X\).

  • Fokus bukan hanya “kembali ke rata-rata”.
  • Regresi mempelajari conditional mean.
  • Variabel dependen dijelaskan oleh explanatory variables.
Examples

Contoh Regresi

Gujarati memberi contoh dari biologi, ekonomi, dan kebijakan.

  • Tinggi anak terhadap tinggi ayah.
  • Tinggi badan terhadap usia.
  • Konsumsi terhadap pendapatan.
  • Permintaan terhadap harga.
  • Phillips curve dan inflasi.
1.3

Statistical vs Deterministic

Hubungan ekonomi tidak pasti, selalu memiliki variasi.

  • Fisika sering bersifat deterministik.
  • Ekonomi umumnya bersifat stokastik.
  • Perbedaannya diringkas oleh error term \(u\).
1.4

Regression vs Causation

Hubungan statistik tidak otomatis berarti sebab-akibat.

  • Kausalitas membutuhkan teori.
  • Rainfall menjelaskan yield, bukan sebaliknya.
  • Arah hubungan tidak ditentukan oleh angka semata.
1.5

Regression vs Correlation

Regresi bersifat asimetris, korelasi bersifat simetris.

  • Regresi: estimasi dan prediksi.
  • Korelasi: kekuatan hubungan linear.
  • \(r_{XY}=r_{YX}\), tetapi regresi \(Y\) atas \(X\) berbeda dari sebaliknya.
1.6

Terminologi dan Notasi

Banyak istilah berbeda digunakan untuk variabel yang sama.

  • Dependent variable = regressand.
  • Explanatory variable = regressor.
  • Model dapat memiliki satu atau banyak \(X\).
1.7

Data Ekonomi

Jenis, sumber, dan kualitas data menentukan kualitas analisis.

  • Time series, cross-section, pooled, panel.
  • Sumber: pemerintah, lembaga internasional, internet.
  • Data sosial umumnya nonexperimental.

Rumus Inti untuk Memahami Bab 1

Bab 1 belum masuk ke teknik estimasi formal, tetapi konsep utamanya dapat diringkas melalui rumus-rumus dasar berikut.

1. Hubungan Deterministik

Semua titik tepat mengikuti suatu fungsi.

\[ Y=f(X) \]

2. Hubungan Statistik

Nilai \(Y\) dipengaruhi \(X\), tetapi juga faktor lain.

\[ Y=f(X)+u \]

3. Regresi Linear Sederhana

Bentuk paling dasar model regresi.

\[ Y_i=\beta_1+\beta_2X_i+u_i \]

4. Tujuan Regresi Modern

Menjelaskan nilai rata-rata \(Y\) pada \(X\) tertentu.

\[ E(Y\mid X) \]

Galton dan Regression to the Mean

Gujarati membuka bab dengan Francis Galton. Dalam contoh tinggi ayah dan anak, anak dari ayah tinggi cenderung tinggi, tetapi rata-rata tinggi anak tidak meningkat sebesar peningkatan tinggi ayahnya.

Grafik Interaktif

Distribusi Tinggi Anak berdasarkan Tinggi Ayah

Titik menunjukkan variasi tinggi anak, sedangkan garis emas menunjukkan rata-rata kelompok.

Simulator Pedagogis

Coba Ubah Tinggi Ayah

Simulasi berikut memperlihatkan mengapa prediksi rata-rata anak bergerak menuju pusat distribusi.

\[ \widehat{H}_{anak}=67+0.60(H_{ayah}-67) \]
\(\widehat{H}_{anak}=68.80\) Prediksi rata-rata anak bergerak lebih dekat ke pusat distribusi.

Regresi dalam Contoh Usia dan Tinggi Badan

Gujarati menampilkan contoh tinggi badan anak pada usia 10–14 tahun. Pada setiap usia terdapat variasi tinggi badan, tetapi rata-rata tinggi meningkat seiring bertambahnya usia.

Kurva Mean

Distribusi Tinggi pada Usia Tertentu

Grafik memperlihatkan variasi individu dan mean height yang meningkat menurut usia.

Simulator Usia

Pilih Usia dan Amati Mean Height

Regresi modern tidak memprediksi semua individu secara persis, tetapi memprediksi nilai rata-rata kelompok.

\[ E(H\mid Age=a) \]
Rata-rata tinggi ≈ 57 inci Terdapat variasi individual di sekitar mean tersebut.

Kurva Phillips dan Money Holding terhadap Inflasi

Dua contoh ini menunjukkan bahwa regresi dapat digunakan untuk membaca hubungan ekonomi yang relevan bagi kebijakan dan perilaku masyarakat.

Phillips Curve

Pengangguran vs Perubahan Upah

Semakin tinggi pengangguran, tekanan kenaikan upah cenderung melemah.

\[ \Delta W=f(U),\qquad f'(U)<0 \]
Perubahan upah ilustratif ≈ 2.76% Tekanan kenaikan upah melemah saat pengangguran meningkat.
Money Holding

Inflasi vs \(k=\frac{Money}{Income}\)

Semakin tinggi inflasi, masyarakat cenderung menahan proporsi uang lebih kecil.

\[ k=\frac{\text{Money}}{\text{Income}} \]
\(k\approx0.52\) Kenaikan inflasi menurunkan kecenderungan menahan uang.

Statistical Relationship vs Deterministic Relationship

Gujarati membedakan hubungan pasti seperti hukum fisika dengan hubungan ekonomi yang lebih longgar. Dalam ekonomi, nilai \(Y\) pada tingkat \(X\) tertentu hampir selalu berbeda antarobservasi karena adanya faktor lain.

\[ Y_i=2+0.8X_i+u_i \]
Hubungan statistik Titik-titik menyebar di sekitar garis karena ada error term \(u_i\).

Regression, Causation, dan Correlation

Gujarati menegaskan dua pembedaan yang sangat penting: regresi tidak otomatis membuktikan kausalitas, dan regresi berbeda dari korelasi.

Regression vs Causation

  • Regresi menunjukkan pola ketergantungan statistik.
  • Kausalitas memerlukan dasar teori atau logika substantif.
  • Curah hujan dapat memengaruhi hasil panen, bukan sebaliknya.
  • Arah hubungan tidak ditentukan oleh angka semata.

Regression vs Correlation

  • Korelasi mengukur derajat hubungan linear.
  • Regresi digunakan untuk estimasi atau prediksi.
  • Korelasi \(r_{XY}=r_{YX}\), sifatnya simetris.
  • Regresi \(Y\) atas \(X\) berbeda dari regresi \(X\) atas \(Y\).

Regresi

Model diarahkan untuk menjelaskan \(Y\).

\[ Y_i=\beta_1+\beta_2X_i+u_i \]

Korelasi

Mengukur kekuatan hubungan linear.

\[ r_{XY}= \frac{\operatorname{Cov}(X,Y)} {\sigma_X\sigma_Y} \]

Kausalitas

Tidak cukup dibuktikan hanya dari scatter plot.

\[ X\rightarrow Y \neq Y\rightarrow X \]

Pesan Gujarati

Association bukan otomatis causation.

\[ \text{Association}\not\equiv\text{Causation} \]
Simulator Korelasi

Ubah Nilai Korelasi

Korelasi tinggi menandakan hubungan linear kuat, tetapi tidak otomatis membuktikan kausalitas.

Interpretasi Otomatis

Apa Artinya Korelasi?

Panel ini menerjemahkan nilai korelasi ke dalam bahasa yang lebih intuitif.

Korelasi positif kuat Data cenderung naik bersama, tetapi tidak otomatis berarti \(X\) menyebabkan \(Y\).
Mengapa korelasi bukan kausalitas?
  • Bisa ada variabel ketiga yang memengaruhi keduanya.
  • Arah hubungan bisa terbalik.
  • Hubungan bisa terjadi secara kebetulan.
  • Teori ekonomi dan desain penelitian tetap diperlukan.

Tabel Istilah Variabel dalam Regresi

Gujarati menunjukkan bahwa literatur ekonometrika menggunakan banyak istilah untuk menyebut variabel dependen dan variabel penjelas.

No. Dependent Variable Explanatory Variable Makna Praktis
1\(Y\)\(X\)Notasi paling umum dalam model regresi.
2Explained VariableIndependent Variable\(Y\) dijelaskan oleh \(X\).
3PredictandPredictorDigunakan ketika fokus analisis adalah prediksi.
4RegressandRegressorIstilah khas dalam teori regresi.
5ResponseStimulusUmum dalam bidang perilaku atau eksperimen.
6EndogenousExogenousBanyak dipakai dalam pemodelan ekonomi.
7OutcomeCovariateSering dipakai dalam studi empiris modern.
8Controlled VariableControl VariableIstilah dalam konteks pengendalian model.

Jenis Data dalam Analisis Ekonometrika

Gujarati menekankan bahwa regresi bergantung pada data. Bentuk data memengaruhi jenis analisis yang dapat dilakukan.

Time Series Data

Contoh: money supply bulanan, GDP tahunan, atau pengangguran triwulanan.

Simulator Risiko Kualitas Data

Gujarati mengingatkan bahwa data ekonomi sering menghadapi persoalan: sifat nonexperimental, nonresponse, measurement error, agregasi tinggi, keterbatasan kerahasiaan, dan variasi metode sampling.

Indeks Risiko Kualitas Data

18%
Risiko awal: data nonexperimental menuntut kehati-hatian dalam menafsirkan hasil.
Prinsip Gujarati: hasil penelitian hanya sebaik kualitas data yang digunakan.

Ratio, Interval, Ordinal, dan Nominal Scale

Teknik ekonometrika yang cocok untuk variabel rasio belum tentu cocok untuk variabel nominal. Karena itu, pengenalan skala data menjadi penting.

R

Ratio Scale

Rasio, jarak, dan urutan bermakna. Contoh: GDP, pendapatan.

I

Interval Scale

Jarak dan urutan bermakna, tetapi rasio tidak. Contoh: tahun kalender.

O

Ordinal Scale

Hanya urutan yang bermakna. Contoh: grade A, B, C.

N

Nominal Scale

Hanya kategori. Contoh: status perkawinan atau gender.

Simulator Klasifikasi Skala Variabel

Ratio Scale GDP memiliki nol bermakna, rasio bermakna, dan urutan bermakna.

Advertising Expenditure vs Impressions Retained

Exercise 1.7 meminta mahasiswa memplot impressions terhadap advertising expenditure untuk 21 perusahaan. Dashboard ini membantu membaca pola hubungan secara visual.

Tabel Data 21 Perusahaan

Data menunjukkan pengeluaran iklan dan jumlah impressions yang masih diingat audiens.

Firm Impressions Ad Expenditure

Scatter Plot Interaktif

Grafik memperlihatkan apakah expenditure iklan yang lebih tinggi cenderung berkaitan dengan impressions yang lebih besar.

\(r=0.58\) Korelasi expenditure dan impressions.
\(\hat{\beta}_2=0.39\) Kenaikan impressions rata-rata per tambahan expenditure.
\(\hat{Y}=20.32+0.39X\) Garis kecenderungan linear eksploratif.
Interpretasi Awal Exercise 1.7
  • Terdapat kecenderungan hubungan positif antara expenditure dan impressions.
  • Namun pola hubungan tidak membentuk garis linear sempurna.
  • Beberapa perusahaan memperoleh impressions tinggi tanpa expenditure terbesar.
  • Efektivitas iklan dapat dipengaruhi kreativitas, merek, strategi media, dan kualitas pesan.

Inti Chapter 1 yang Harus Dipahami Mahasiswa

Chapter 1 bukan sekadar bab pengantar. Ia membentuk cara berpikir ekonometrika: memahami bahwa regresi mempelajari ketergantungan statistik, tidak otomatis membuktikan kausalitas, perlu dibedakan dari korelasi, dan harus didukung oleh data yang baik.

1. Regresi Bukan Sekadar Garis

Regresi adalah studi tentang nilai rata-rata variabel dependen berdasarkan variabel penjelas.

2. Variasi adalah Kenyataan

Dalam ekonomi, hubungan hampir selalu mengandung komponen acak atau error term.

3. Data Menentukan Kualitas

Data nonexperimental, bias survei, dan agregasi tinggi menuntut interpretasi yang hati-hati.

4. Visualisasi Membantu Teori

Scatter plot, kurva mean, dan distribusi titik membantu mahasiswa melihat konsep regresi.

Kesimpulan Pembelajaran: Setelah memahami Bab 1, mahasiswa mampu menjelaskan makna regresi, membedakannya dari korelasi dan kausalitas, mengenali jenis data, memahami risiko kualitas data, serta membaca pola awal melalui scatter plot.