Este repositorio contiene modelos bancarios optimizados con técnicas avanzadas de machine learning, incluyendo optimización bayesiana con Optuna, análisis por segmentos y aprovechamiento de hardware de alto rendimiento.
- Optimización Bayesiana con Optuna (200 trials por modelo)
- Análisis por Segmentos de cliente detallado
- Soporte GPU para XGBoost (RTX 4070)
- Paralelización completa (32 cores)
- Dataset Sintético realista de 10,000 registros
- Comparación Rigurosa entre modelos optimizados
notebook_churn_Version3.ipynb: Predicción de fuga de clientes con análisis por segmentosnotebook_cobranza_Version2.ipynb: Predicción de recuperación de cartera optimizadanotebook_score_riesgo_Version2.ipynb: Credit scoring con optimización bayesiana
modelo_fuga_clientes.py: Script standalone para churn predictionmodelo_cobranza.py: Script standalone para cobranzamodelo_score_riesgo_bancario.py: Script standalone para credit scoring
requirements.txt: Dependencias optimizadas y compatiblessetup_environment.md: Guía de configuración del entornotest_models.py: Script de pruebas automatizadas
git clone https://github.com/tu-usuario/modelos-bancarios-ejemplo.git
cd modelos-bancarios-ejemplo# Windows
python -m venv venv_bancario
venv_bancario\Scripts\activate
# Linux/Mac
python -m venv venv_bancario
source venv_bancario/bin/activatepip install -r requirements.txtjupyter notebook- Retail: 99.1% accuracy, 96.7% precision
- Premium: 99.2% accuracy, 98.9% precision
- Pyme: 99.7% accuracy, 98.6% precision
- Empresarial: 99.6% accuracy, 100% precision
- 200 trials de optimización bayesiana por modelo
- Validación cruzada 5-fold para evaluación robusta
- Paralelización completa aprovechando 32 cores
- Soporte GPU para XGBoost con RTX 4070
- Dataset ampliado a 10,000 registros sintéticos
- CPU: Intel Core i9 13900HX (32 cores)
- RAM: 64GB DDR5 4800MHz
- GPU: NVIDIA RTX 4070 Laptop
- Almacenamiento: SSD NVMe
# Para habilitar GPU en XGBoost, descomenta en requirements.txt:
# xgboost[gpu]==1.7.6Los notebooks generan automáticamente datasets sintéticos realistas de 10,000 registros con:
- Variables demográficas y financieras
- Patrones de comportamiento bancario
- Distribuciones realistas de churn/cobranza/riesgo
# Cargar tus propios datos CSV
data = pd.read_csv('tu_archivo.csv')# Ejecutar pruebas de todos los modelos
python test_models.py¡Las contribuciones son bienvenidas! Por favor:
- Fork el repositorio
- Crea una rama para tu feature (
git checkout -b feature/nueva-funcionalidad) - Commit tus cambios (
git commit -am 'Agregar nueva funcionalidad') - Push a la rama (
git push origin feature/nueva-funcionalidad) - Abre un Pull Request
Este proyecto está bajo la Licencia MIT - ver el archivo LICENSE para detalles.
Desarrollado con optimización para hardware de alto rendimiento y técnicas avanzadas de machine learning.
⭐ Si este proyecto te fue útil, ¡dale una estrella al repositorio!