Trabajo Práctico para la materia Aprendizaje Automático de UNSAM
A partir del dataset a trabajar (extraído de Kaggle aquí) realizaremos las primeras prácticas de prueba para conocer el dataset en una Jupyter Notebook. Luego de explorar los datos, seguiremos con la predicción y elección de un modelo.
Para poder trabajar localmente, se debe hacer lo siguiente (líneas que empiezan con #, son el alternativo de la línea anterior para usuarios en Linux):
- Clonar el repositorio
cd ./carpeta/en/donde/clonar/repo
git clone https://github.com/JaviCeRodriguez/Heart-Failure-ML.git
- Crear un entorno virtual y activarlo
cd ./Heart-Failure-ML
python -m venv myvenv
# python3 -m venv my-project-env
myvenv/Scripts/activate
# source myvenv/bin/activate
- Instalar librerías
pip install -r requirements.txt
Opcionalmente, pueden utilizar el entorno virtual creado por Anaconda!
- Para desactivar el entorno (si necesario)
deactivate
Estaremos trabajando en la notebook main.ipynb, pero daremos su versión en formato *.py. Podemos ejecutar la notebook
en Jupyter Notebook, Google Colab o desde Visual Studio Code. Recomendamos utilizar PyCharm, ya que facilita la instalación
de las librerías en el entorno virtual y de la extensión Jupyter Notebook.
Como mencionamos anteriormente, el dataset utilizado trata sobre datos recolectados (299 muestras) a partir de pacientes con falla cardíaca. Contiene las siguientes features: age, anaemia, creatinine_phosphokinase, diabetes, ejection_fraction, high_blood_pressure, platelets, serum_creatinine, serum_sodium, sex, smoking, time y DEATH_EVENT.
| Javier Rodriguez | Martin Pierangeli | Marcelo Raponi | Maria Luz Perez Saura |
|---|---|---|---|
|
|
|
|
|