Basic Econometrics_Damodar N. Gujarati_Chapter 2 · Two-Variable Regression Analysis

Gujarati · Chapter 2 · Two-Variable Regression Analysis

Memahami Regresi Dua Variabel: dari Conditional Mean, PRF, SRF, hingga Stochastic Disturbance

Chapter 2 memperkenalkan gagasan formal paling dasar dalam regresi: bagaimana nilai rata-rata variabel dependen berubah ketika nilai variabel penjelas diketahui. Gujarati menggunakan contoh konsumsi keluarga dan pendapatan mingguan untuk menjelaskan Conditional Expectation Function, Population Regression Function, dan Sample Regression Function.

\(E(Y\mid X_i)\) Inti regresi: rata-rata \(Y\) pada nilai \(X_i\) tertentu.
PRF Population Regression Function: fungsi regresi populasi yang ideal.
SRF Sample Regression Function: pendekatan empiris dari sampel.
\(u_i\) Stochastic disturbance: semua faktor lain yang memengaruhi \(Y\).
Pohon Pengetahuan

Struktur Utama Chapter 2

Bab ini membangun fondasi teoretis regresi dua variabel secara bertahap: dari contoh hipotetis, conditional mean, PRF, linearitas, stochastic error, hingga hubungan antara PRF dan SRF.

Akar Konseptual

Regresi Dua Variabel sebagai Model Rata-Rata Bersyarat

Tujuan regresi bukan memprediksi setiap individu secara sempurna, tetapi menjelaskan bagaimana nilai rata-rata \(Y\) berubah ketika nilai \(X\) diketahui atau dianggap tetap.

2.1

Hypothetical Example

Data konsumsi keluarga berdasarkan kelompok pendapatan.

  • Variabel \(X\): weekly family income.
  • Variabel \(Y\): weekly consumption expenditure.
  • Terdapat subpopulasi \(Y\) untuk setiap \(X_i\).
2.2

CEF dan PRF

Conditional mean membentuk population regression function.

  • \(E(Y\mid X_i)\) adalah conditional expectation.
  • PRF menghubungkan semua conditional means.
  • PRF adalah konsep populasi yang ideal.
2.3

Makna Linear

Linear dapat berarti linear dalam variabel atau parameter.

  • Linear in variables.
  • Linear in parameters.
  • Model regresi linear terutama linear dalam parameter.
2.4

Stochastic PRF

Setiap individu berbeda dari mean karena error term.

  • \(u_i=Y_i-E(Y\mid X_i)\).
  • Error merepresentasikan faktor tak teramati.
  • Hubungan ekonomi tidak deterministik sempurna.
2.5

Signifikansi \(u_i\)

Error term memiliki peran sentral dalam regresi.

  • Mewakili omitted variables.
  • Mengandung measurement error.
  • Menyimpan unsur unpredictable human behavior.
2.6

SRF

Karena populasi jarang tersedia, kita memakai sampel.

  • SRF memperkirakan PRF.
  • Koefisien sampel ditulis \(\hat{\beta}_1,\hat{\beta}_2\).
  • Residual sampel ditulis \(\hat{u}_i\).
2.7

Illustrative Example

Mean hourly wage berdasarkan years of schooling.

  • Pendidikan sebagai \(X\).
  • Mean wage sebagai \(Y\).
  • Rata-rata wage cenderung naik dengan pendidikan.
Summary

Kesimpulan Bab

Regresi adalah studi tentang conditional expectation.

  • CEF/PRF adalah inti regresi.
  • SRF dipakai untuk menduga PRF.
  • Stochastic error penting untuk model empiris.
Rumus Fondasi Chapter 2

Rumus Inti Regresi Dua Variabel

Bab ini berpusat pada konsep conditional expectation dan perbedaan antara fungsi populasi dan fungsi sampel. Rumus berikut menjadi inti pemahaman Chapter 2.

1. Conditional Expectation Function

Rata-rata \(Y\) ketika \(X\) diketahui.

\[ E(Y\mid X_i)=f(X_i) \]

2. Linear PRF

PRF linear dalam bentuk sederhana.

\[ E(Y\mid X_i)=\beta_1+\beta_2X_i \]

3. Stochastic PRF

Observasi individu berbeda dari rata-ratanya.

\[ Y_i=\beta_1+\beta_2X_i+u_i \]

4. Disturbance Term

Deviasi individu dari conditional mean.

\[ u_i=Y_i-E(Y\mid X_i) \]

5. Sample Regression Function

Garis regresi berdasarkan sampel.

\[ \hat{Y}_i=\hat{\beta}_1+\hat{\beta}_2X_i \]

6. Sample Residual

Selisih antara \(Y_i\) aktual dan \(\hat{Y}_i\).

\[ \hat{u}_i=Y_i-\hat{Y}_i \]

7. SRF Stokastik

Model sampel lengkap dengan residual.

\[ Y_i=\hat{\beta}_1+\hat{\beta}_2X_i+\hat{u}_i \]

8. Tujuan Estimasi

SRF diharapkan mendekati PRF.

\[ SRF \approx PRF \]
Ilustrasi Interaktif 1

Conditional Distribution dan Conditional Mean

Pada setiap nilai pendapatan \(X_i\), terdapat beberapa nilai konsumsi \(Y\). Rata-rata nilai \(Y\) pada setiap \(X_i\) disebut conditional mean. Garis yang menghubungkan conditional means adalah bentuk awal dari PRF.

Grafik Konsumsi–Pendapatan

Distribusi \(Y\) untuk Berbagai Nilai \(X\)

Titik menunjukkan konsumsi individual. Titik emas menunjukkan conditional mean \(E(Y\mid X_i)\).

Simulator Conditional Mean

Pilih Pendapatan Mingguan

Pilih nilai \(X\) untuk melihat subpopulasi konsumsi dan conditional mean.

\[ E(Y\mid X_i)=\frac{\sum Y_i}{n_i} \]
\(E(Y\mid X=80)=65\) Pada pendapatan 80, rata-rata konsumsi adalah 65.
Ilustrasi Interaktif 2

Population Regression Function vs Sample Regression Function

PRF adalah konsep ideal berbasis populasi. Namun dalam praktik, peneliti jarang memiliki seluruh populasi. Karena itu, peneliti menggunakan sampel dan membentuk SRF untuk memperkirakan PRF.

PRF dan SRF

Bandingkan Garis Populasi dan Garis Sampel

Garis emas menunjukkan PRF. Garis hijau/merah menunjukkan SRF dari dua sampel berbeda.

Makna Estimasi

Mengapa SRF Tidak Sama Persis dengan PRF?

Karena sampel hanya sebagian dari populasi. Dua sampel yang berbeda dapat menghasilkan garis regresi sampel yang berbeda.

\[ PRF: \quad E(Y\mid X_i)=\beta_1+\beta_2X_i \] \[ SRF: \quad \hat{Y}_i=\hat{\beta}_1+\hat{\beta}_2X_i \]
Sampel 1 SRF pertama mendekati PRF, tetapi tidak identik karena sampling fluctuation.
Ilustrasi Interaktif 3

Stochastic Disturbance Term \(u_i\)

Disturbance term \(u_i\) menjelaskan mengapa konsumsi individu tidak selalu sama dengan rata-rata konsumsi pada tingkat pendapatan tertentu. Ia memuat pengaruh variabel lain, error pengukuran, dan unsur perilaku manusia yang tidak sepenuhnya terprediksi.

Simulator Error

Ubah Nilai Error \(u_i\)

Perhatikan bagaimana titik observasi bergerak di atas atau di bawah conditional mean.

\[ Y_i=E(Y\mid X_i)+u_i \]
\(Y_i=149+10=159\) Observasi berada di atas conditional mean.
Visualisasi \(u_i\)

Deviasi dari Conditional Mean

Garis vertikal menunjukkan deviasi individu dari rata-rata kelompoknya.

Makna Linear

Linear dalam Variabel vs Linear dalam Parameter

Gujarati menegaskan bahwa dalam ekonometrika, istilah linear regression model terutama merujuk pada linear dalam parameter, bukan harus selalu linear dalam variabel.

Model Linear dalam Parameter? Linear dalam Variabel? Kategori Interpretasi
\(Y_i=\beta_1+\beta_2X_i+u_i\) Ya Ya LRM Model linear sederhana paling dasar.
\(Y_i=\beta_1+\beta_2X_i^2+u_i\) Ya Tidak LRM Linear dalam parameter, meskipun variabel berbentuk kuadrat.
\(Y_i=\beta_1+\beta_2\ln X_i+u_i\) Ya Tidak LRM Model semilog; tetap linear regression model.
\(Y_i=\beta_1+\beta_2^2X_i+u_i\) Tidak Ya NLRM Tidak linear dalam parameter karena \(\beta_2\) berpangkat dua.
Inti penting: model regresi linear tidak harus selalu berbentuk garis lurus terhadap \(X\). Yang lebih penting adalah apakah model tersebut linear terhadap parameter \(\beta\).
Illustrative Example 2.7

Mean Hourly Wage by Education

Gujarati menutup bab dengan contoh hubungan antara pendidikan dan mean wage. Secara umum, semakin tinggi tahun pendidikan, rata-rata upah cenderung meningkat.

Data Wage–Education

Tabel Ringkas

Data berikut menunjukkan years of schooling, mean wage, dan jumlah orang pada tiap level pendidikan.

Schooling Mean Wage People
Kurva Wage–Education

Mean Wage terhadap Education

Titik menunjukkan mean wage pada level pendidikan tertentu.

Exercise 2.15 · Interaktif

Food Expenditure vs Total Expenditure

Latihan 2.15 meminta mahasiswa memplot food expenditure terhadap total expenditure. Karena total expenditure dapat dipakai sebagai proksi income, grafik ini dapat digunakan untuk membaca apakah konsumsi makanan meningkat seiring kemampuan belanja rumah tangga.

Scatter Plot

Food dan Total Expenditure

Gunakan tombol untuk menambahkan garis linear eksploratif.

Interpretasi Otomatis

Apa Kesimpulan Awalnya?

Panel ini memberikan interpretasi awal berdasarkan garis kecenderungan.

\[ \widehat{Food}=\hat{\beta}_1+\hat{\beta}_2Total \]
Hubungan positif Food expenditure cenderung meningkat saat total expenditure meningkat.
Apakah hubungan selalu linear?
  • Secara ekonomi, food expenditure biasanya naik ketika income naik.
  • Namun kenaikannya mungkin tidak selalu proporsional.
  • Untuk rumah tangga berpendapatan tinggi, proporsi pengeluaran makanan bisa menurun.
  • Karena itu bentuk non-linear dapat menjadi alternatif dalam kajian lanjutan.
Sintesis Akhir

Inti Chapter 2 yang Harus Dipahami Mahasiswa

Chapter 2 memperkenalkan fondasi formal regresi dua variabel. Mahasiswa harus memahami bahwa regresi bukan sekadar garis pada scatter plot, tetapi cara untuk menjelaskan conditional mean melalui PRF dan memperkirakannya dengan SRF.

1. CEF adalah Inti

Regresi mempelajari \(E(Y\mid X_i)\), yaitu rata-rata \(Y\) ketika \(X_i\) diketahui.

2. PRF adalah Ideal

PRF menunjukkan hubungan populasi yang sebenarnya, tetapi jarang diketahui secara langsung.

3. SRF adalah Estimasi

Karena peneliti memakai sampel, SRF digunakan untuk memperkirakan PRF.

4. Error Term Penting

\(u_i\) menjelaskan mengapa observasi individu berbeda dari rata-rata kelompoknya.

Kesimpulan pembelajaran: Setelah memahami Chapter 2, mahasiswa seharusnya mampu membedakan PRF dan SRF, menjelaskan conditional mean, memahami makna stochastic disturbance, serta menyadari bahwa regresi sampel hanyalah pendekatan terhadap hubungan populasi.