Pemodelan Ekonomi Pertumbuhan China

Pemodelan Ekonomi Pertumbuhan China: OLS, Ridge, dan Lasso Secara Matematis

Artikel ini merujuk pada:

Li et al. (2021), Analysis of Potential Factors Influencing China’s Regional Sustainable Economic Growth, Applied Sciences, 11, 10832.


1️⃣ Spesifikasi Model Dasar

Penelitian ini bertujuan memodelkan pertumbuhan ekonomi China sebagai fungsi dari sejumlah variabel makroekonomi.

1.1 Model Linear Umum

Model dituliskan sebagai:Y=Xβ+εY = X\beta + \varepsilon

Penjelasan Notasi:

  • YRn×1Y \in \mathbb{R}^{n \times 1} → vektor pertumbuhan GDP
  • XRn×pX \in \mathbb{R}^{n \times p} → matriks variabel penjelas
  • βRp×1\beta \in \mathbb{R}^{p \times 1} → vektor parameter
  • εRn×1\varepsilon \in \mathbb{R}^{n \times 1} → error term
  • nn → jumlah observasi (2000–2019)
  • pp → jumlah variabel independen

Secara eksplisit:GDPt=β0+β1X1t+β2X2t+...+βpXpt+εtGDP_t = \beta_0 + \beta_1 X_{1t} + \beta_2 X_{2t} + … + \beta_p X_{pt} + \varepsilon_t


2️⃣ Ordinary Least Squares (OLS)

2.1 Estimator OLS

OLS meminimalkan jumlah kuadrat error:minβi=1n(yixiTβ)2\min_{\beta} \sum_{i=1}^{n} (y_i – x_i^T\beta)^2

Solusi tertutup:β^OLS=(XTX)1XTY\hat{\beta}_{OLS} = (X^TX)^{-1}X^TY


2.2 Asumsi Klasik

OLS mengasumsikan:

  1. E(ε)=0E(\varepsilon) = 0
  2. Var(ε)=σ2IVar(\varepsilon) = \sigma^2 I
  3. Tidak ada multikolinearitas sempurna

Masalah yang ditemukan dalam penelitian:XTXsingularX^TX \approx \text{singular}

Akibatnya:Var(β^)=σ2(XTX)1Var(\hat{\beta}) = \sigma^2 (X^TX)^{-1}

Jika XTXX^TXhampir singular → varians koefisien sangat besar → estimasi tidak stabil.

Penelitian menunjukkan adanya multikolinearitas tinggi


3️⃣ Ridge Regression (Regularisasi L2)

Untuk mengatasi multikolinearitas, digunakan Ridge Regression.


3.1 Fungsi Objektif Ridge

minβ[i=1n(yixiTβ)2+λj=1pβj2]\min_{\beta} \left[ \sum_{i=1}^{n}(y_i – x_i^T\beta)^2 + \lambda \sum_{j=1}^{p} \beta_j^2 \right]

Dimana:

  • λ0\lambda \ge 0 → parameter regularisasi
  • βj2\sum \beta_j^2​ → penalti L2

3.2 Solusi Ridge

β^ridge=(XTX+λI)1XTY\hat{\beta}_{ridge} = (X^TX + \lambda I)^{-1}X^TY

Makna Notasi:

  • II → matriks identitas ukuran p×pp \times p
  • Penambahan λI\lambda I membuat matriks selalu invertible

Interpretasi:

Ridge mengurangi varians koefisien tetapi tidak menghilangkan variabel.


4️⃣ Lasso Regression (Regularisasi L1)

Metode yang menghasilkan model terbaik dalam penelitian applsci-11-10832


4.1 Fungsi Objektif Lasso

minβ[i=1n(yixiTβ)2+λj=1pβj]\min_{\beta} \left[ \sum_{i=1}^{n}(y_i – x_i^T\beta)^2 + \lambda \sum_{j=1}^{p} |\beta_j| \right]

Perbedaan utama dengan Ridge:

  • Ridge → penalti kuadrat
  • Lasso → penalti absolut

4.2 Karakteristik Matematis

Karena penalti berbentuk nilai absolut:βj|\beta_j|

Maka solusi dapat menghasilkan:βj=0\beta_j = 0

Artinya:
Lasso melakukan variable selection otomatis.


5️⃣ Perbandingan Bias–Variance Tradeoff

Secara teoretis:MSE=Bias2+Variance+σ2MSE = Bias^2 + Variance + \sigma^2

  • OLS → variance tinggi
  • Ridge → variance turun, bias naik sedikit
  • Lasso → variance turun + variabel tidak relevan dihapus

Penelitian menunjukkan bahwa Lasso memiliki MSE paling kecil


6️⃣ Model Final (Hasil Lasso)

Model yang diperoleh:GDP=0.32174+0.00882Trade+0.02303FDI0.18662Fiscal+0.00372Money+0.65418Consumption+0.07189Education+0.63368Tertiary0.01650Finance0.00703IndustryGDP = 0.32174 + 0.00882 Trade + 0.02303 FDI – 0.18662 Fiscal + 0.00372 Money + 0.65418 Consumption + 0.07189 Education + 0.63368 Tertiary – 0.01650 Finance – 0.00703 Industry

Interpretasi notasi:

  • Koefisien positif → hubungan searah
  • Koefisien negatif → hubungan berlawanan

7️⃣ Interpretasi Struktural Model

Model dapat dituliskan sebagai:GDPt=f(Consumptiont,Tertiaryt,Tradet,FDIt,Fiscalt)GDP_t = f(Consumption_t, Tertiary_t, Trade_t, FDI_t, Fiscal_t)

Koefisien terbesar:

  • Consumption (0.65418)
  • Tertiary Industry (0.63368)

Artinya:
Ekonomi China didorong oleh permintaan domestik dan sektor jasa.


8️⃣ Ringkasan Perbandingan Metode

MetodeEstimatorRegularisasiSeleksi Variabel
OLS(XTX)1XTY(X^TX)^{-1}X^TYTidakTidak
Ridge(XTX+λI)1XTY(X^TX + \lambda I)^{-1}X^TYL2Tidak
LassoMinimasi dengan ( \sum\beta)

9️⃣ Insight Metodologis untuk Peneliti

Jika:

  • ppp relatif besar
  • Variabel saling berkorelasi
  • Data time series makro

Maka gunakan:Lasso Regression\textbf{Lasso Regression}Lasso Regression

Karena mampu:

  1. Mengurangi multikolinearitas
  2. Mengontrol overfitting
  3. Melakukan seleksi variabel

🔎 Kesimpulan Modeling

Secara matematis, penelitian ini menunjukkan bahwa:β^lasso=argminβ[YXβ2+λβ1]\hat{\beta}_{lasso} = \arg\min_{\beta} \left[ ||Y – X\beta||^2 + \lambda ||\beta||_1 \right]

Memberikan estimasi paling stabil dan interpretatif dibanding metode lainnya