📌 Catatan ini diambil :
“Penerapan Algoritme Genetika dalam Penentuan Indikator Krisis Keuangan Hasil Pemodelan Machine Learning” (IPB University, 2024).
Catatan ini merupakan bagian dari agenda riset mengenai deteksi dini krisis keuangan dalam kerangka tata kelola moneter adaptif (adaptive monetary governance). Fokus utamanya adalah membangun sistem identifikasi indikator krisis yang tidak hanya akurat secara statistik, tetapi juga relevan untuk desain kebijakan berbasis rezim dan respons non-linear.
Penelitian ini mengintegrasikan tiga pendekatan machine learning Regresi Logistik, Random Forest, dan XGBoost untuk mengidentifikasi indikator utama krisis sistemik. Model-model tersebut digunakan untuk menghasilkan ranking kepentingan variabel (feature importance), yang kemudian dioptimasi menggunakan Algoritme Genetika.
Pendekatan ini bertujuan menjembatani pemodelan prediktif dengan kebutuhan kebijakan moneter dalam menghadapi dinamika krisis lintas negara dan periode waktu.
This note forms part of a broader research agenda on early-warning detection of financial crises within the framework of adaptive monetary governance. The objective is not merely statistical accuracy, but the construction of crisis indicators that are relevant for regime-sensitive and nonlinear policy responses.
The study integrates three machine learning approaches—Logistic Regression, Random Forest, and XGBoost—to identify key systemic crisis indicators. Feature importance rankings generated by these models are subsequently optimized using a Genetic Algorithm.
The broader goal is to bridge predictive modeling with monetary policy design in crisis-prone environments across countries and time periods.
Pendahuluan
Penelitian ini bertujuan untuk mengidentifikasi indikator utama krisis keuangan sistemik dengan mengintegrasikan tiga model Machine Learning, yaitu:
- Regresi Logistik
- Random Forest
- XGBoost
Ketiga model tersebut digunakan untuk menghasilkan ranking kepentingan variabel (feature importance), yang kemudian dioptimasi menggunakan Algoritme Genetika.
Catatan ini secara khusus menguraikan struktur matematis dari ketiga model tersebut.
1. Regresi Logistik (Logistic Regression)
1.1 Struktur Model
Misalkan:
dengan:
- → terjadi krisis
- → tidak terjadi krisis
dan vektor variabel independen:
Model logistik mendefinisikan probabilitas krisis sebagai:
Fungsi logit:
Sehingga probabilitasnya:
1.2 Estimasi Parameter
Parameter diperoleh dengan Maximum Likelihood Estimation (MLE).
Likelihood function:
Log-likelihood:
Estimasi parameter:
1.3 Karakteristik Matematis
- Model parametrik
- Linear pada log-odds
- Interpretasi berbasis koefisien
- Tidak menangkap non-linearitas kompleks tanpa transformasi tambahan
2. Random Forest
Random Forest adalah model ensemble berbasis banyak decision tree.
2.1 Struktur Decision Tree
Ruang fitur dibagi menjadi region:
Probabilitas pada region Rm:
Prediksi satu tree:f^(X)=p^mjika X∈Rm
2.2 Agregasi Random Forest
Jika terdapat B tree:
Untuk klasifikasi:
2.3 Sifat Matematis
Random Forest dapat dipandang sebagai:
dengan:
- = tree
- = randomness (bootstrap + random feature selection)
Model ini bersifat:
- Non-parametrik
- Non-linear
- Robust terhadap overfitting
3. XGBoost (Extreme Gradient Boosting)
XGBoost adalah model boosting berbasis optimasi gradien.
3.1 Model Adiktif
Prediksi model:
dengan:
- = tree ke-k
- = jumlah tree
3.2 Fungsi Objektif
Regularisasi:
di mana:
- = jumlah daun
- = bobot daun
3.3 Optimasi Berbasis Taylor Expansion
Pada iterasi ke-t:
dengan:
Tree baru dibangun untuk meminimalkan fungsi tersebut.
4. Permutation Feature Importance (PFI)
Setelah model dibangun, importance dihitung dengan:
di mana:
- = fitur ke-j yang dipermutasi
- Penurunan performa → menunjukkan pentingnya variabel
5. Perbandingan Matematis Ketiga Model
| Model | Parametrik | Linear | Menangkap Non-Linearitas |
|---|---|---|---|
| Logit | Ya | Ya (log-odds) | Terbatas |
| RF | Tidak | Tidak | Ya |
| XGB | Semi | Tidak | Sangat kuat |
Secara matematis, penelitian ini membangun tiga estimator fungsi prediksi—
, , dan
yang kemudian digunakan untuk menentukan ranking indikator krisis melalui Permutation Feature Importance dan optimasi Algoritme Genetika.
Namun kontribusi utamanya bukan semata pada akurasi klasifikasi, melainkan pada upaya membangun arsitektur deteksi dini yang mendukung perumusan kebijakan moneter adaptif. Dalam konteks tata kelola moneter modern, identifikasi indikator krisis yang bersifat non-linear dan berbasis data menjadi fondasi penting dalam merespons rezim ketidakstabilan yang berubah-ubah.
Dengan demikian, integrasi model parametrik dan non-parametrik dalam studi ini memberikan landasan metodologis bagi pengembangan kerangka early-warning yang lebih sistemik dan relevan bagi negara berkembang.
Mathematically, the study constructs three predictive estimators
, , and
which are used to rank crisis indicators through Permutation Feature Importance and Genetic Algorithm optimization.
Yet its main contribution lies beyond classification accuracy. It contributes to the development of an early-warning architecture that supports adaptive monetary policy design. In modern monetary governance, nonlinear and data-driven crisis indicators are essential for responding to shifting instability regimes.
The integration of parametric and non-parametric models thus provides a methodological foundation for systemic early-warning frameworks, particularly relevant for emerging market economies.