Pemodelan Ekonomi Pertumbuhan China: OLS, Ridge, dan Lasso Secara Matematis
Artikel ini merujuk pada:
Li et al. (2021), Analysis of Potential Factors Influencing China’s Regional Sustainable Economic Growth, Applied Sciences, 11, 10832.
1️⃣ Spesifikasi Model Dasar
Penelitian ini bertujuan memodelkan pertumbuhan ekonomi China sebagai fungsi dari sejumlah variabel makroekonomi.
1.1 Model Linear Umum
Model dituliskan sebagai:
Penjelasan Notasi:
- → vektor pertumbuhan GDP
- → matriks variabel penjelas
- → vektor parameter
- → error term
- → jumlah observasi (2000–2019)
- → jumlah variabel independen
Secara eksplisit:
2️⃣ Ordinary Least Squares (OLS)
2.1 Estimator OLS
OLS meminimalkan jumlah kuadrat error:
Solusi tertutup:
2.2 Asumsi Klasik
OLS mengasumsikan:
- Tidak ada multikolinearitas sempurna
Masalah yang ditemukan dalam penelitian:
Akibatnya:
Jika hampir singular → varians koefisien sangat besar → estimasi tidak stabil.
Penelitian menunjukkan adanya multikolinearitas tinggi
3️⃣ Ridge Regression (Regularisasi L2)
Untuk mengatasi multikolinearitas, digunakan Ridge Regression.
3.1 Fungsi Objektif Ridge
Dimana:
- → parameter regularisasi
- → penalti L2
3.2 Solusi Ridge
Makna Notasi:
- → matriks identitas ukuran
- Penambahan membuat matriks selalu invertible
Interpretasi:
Ridge mengurangi varians koefisien tetapi tidak menghilangkan variabel.
4️⃣ Lasso Regression (Regularisasi L1)
Metode yang menghasilkan model terbaik dalam penelitian applsci-11-10832
4.1 Fungsi Objektif Lasso
Perbedaan utama dengan Ridge:
- Ridge → penalti kuadrat
- Lasso → penalti absolut
4.2 Karakteristik Matematis
Karena penalti berbentuk nilai absolut:
Maka solusi dapat menghasilkan:
Artinya:
Lasso melakukan variable selection otomatis.
5️⃣ Perbandingan Bias–Variance Tradeoff
Secara teoretis:
- OLS → variance tinggi
- Ridge → variance turun, bias naik sedikit
- Lasso → variance turun + variabel tidak relevan dihapus
Penelitian menunjukkan bahwa Lasso memiliki MSE paling kecil
6️⃣ Model Final (Hasil Lasso)
Model yang diperoleh:
Interpretasi notasi:
- Koefisien positif → hubungan searah
- Koefisien negatif → hubungan berlawanan
7️⃣ Interpretasi Struktural Model
Model dapat dituliskan sebagai:
Koefisien terbesar:
- Consumption (0.65418)
- Tertiary Industry (0.63368)
Artinya:
Ekonomi China didorong oleh permintaan domestik dan sektor jasa.
8️⃣ Ringkasan Perbandingan Metode
| Metode | Estimator | Regularisasi | Seleksi Variabel |
|---|---|---|---|
| OLS | Tidak | Tidak | |
| Ridge | L2 | Tidak | |
| Lasso | Minimasi dengan ( \sum | \beta | ) |
9️⃣ Insight Metodologis untuk Peneliti
Jika:
- p relatif besar
- Variabel saling berkorelasi
- Data time series makro
Maka gunakan:Lasso Regression
Karena mampu:
- Mengurangi multikolinearitas
- Mengontrol overfitting
- Melakukan seleksi variabel
🔎 Kesimpulan Modeling
Secara matematis, penelitian ini menunjukkan bahwa:
Memberikan estimasi paling stabil dan interpretatif dibanding metode lainnya