Este repositorio contiene la parte práctica de mi Trabajo de Fin de Máster, donde se desarrolla una solución de planificación de rutas multiagente basada en algoritmos de Deep Reinforcement Learning (DRL). El objetivo de este proyecto es optimizar la navegación de múltiples lunar rovers en un entorno lunar dinámico y complejo, facilitando la recolección y el transporte de minerales para la construcción de la primera Estación Internacional de Investigación Lunar en 2030.
- Simulador: Un simulador de entornos lunares, desarrollado con las bibliotecas Gymnasium y Pygame, que reproduce fielmente las condiciones del problema a resolver.
- Algoritmos: Implementación completa de dos algoritmos de Aprendizaje por Refuerzo Profundo:
- Double Dueling Deep Q-Learning (DDDQL)
- Multi-Agent Proximal Policy Optimization (MAPPO)
- Código del Proyecto: Scripts diseñados para la prueba, el entrenamiento y la evaluación de los algoritmos sobre el simulador.
- Modelos Entrenados: Los archivos generados tras la fase de entrenamiento, junto con las métricas recopiladas para ambos algoritmos.
- Documentación: El documento final de Trabajo de Fín de Máster y la presentación utilizada para la defensa final.
En caso de tener alguna duda, idea o aportación sobre el proyecto por favor contactar al siguiente correo: pepoluis712@gmail.com