Skip to content

El propósito de este proyecto fue determinar si una persona tiene diabetes o no, utilizando un modelo predictivo entrenado con datos de Estados Unidos.

License

Notifications You must be signed in to change notification settings

Cintia-Perez-Battistessa/Predecir-diabetes

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 

Repository files navigation

Predecir la diabetes

Table of Contents

1. Sobre el proyecto

El propósito de este proyecto es determinar si una persona tiene diabetes o no, utilizando un modelo predictivo entrenado con datos de Estados Unidos. Los datos presentaban un desbalance, ya que había una mayor cantidad de casos negativos (sin diabetes). Para abordar este desbalance, se exploraron dos métodos, SMOTE (oversampling y undersampling), con el objetivo de lograr un equilibrio en los datos.

Posteriormente, se evaluaron varios modelos predictivos mediante métricas específicas, y se seleccionó el modelo que mejor se ajustaba a los datos. Los modelos analizados incluyeron:

'Logistic Regression' 'Decision Tree' 'Random Forest' 'SVM' 'KNN' 'Nearest Centroid Classifier' 'Gaussian Naive Bayes Classifier' El modelo seleccionado fue Random Forest. Luego, se redujo la dimensionalidad del conjunto de datos, identificando y eliminando parámetros con poca variabilidad que no influyeron significativamente en la predicción.

Finalmente, se volvió a entrenar el modelo con Random Forest y se realizó un ajuste fino (tuning) para validar y mejorar la efectividad del modelo.

2. Colaboradores

Este proyecto fue creado en grupo en un Bootcamp de Data Scientist. Mis compañeros fueron: Javier Serna Gálvez, Miriam Lamas y Manuel Ruiz.

3. Licencia ⭐

Este proyecto está bajo la licencia Apache. Eche un vistazo al archivo de LICENCIA para obtener más información.

4. ¡Dale una estrella! ⭐

Si esto le resulta útil, dale amor al proyecto. ¡Gracias!

About

El propósito de este proyecto fue determinar si una persona tiene diabetes o no, utilizando un modelo predictivo entrenado con datos de Estados Unidos.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published