AIFriend es una inteligencia artificial diseñada para conversar contigo. Puedes hablarle y te responderá con una voz humana, simulando una conversación con un amigo. Este proyecto nace como una solución a la creciente falta de interacción social en un mundo cada vez más digitalizado.
XTTS---Made-with-Clipchamp.mp4
La parte teórica de este proyecto se encuentra documentada en los siguientes archivos:
Actualidad de la inteligencia artificial generativa.pdfVoz a texto y texto a voz.pdf
La implementación práctica y el código fuente se encuentran en el notebook de Jupyter:
TTS_Y_STT.ipynb
- Conversión de Voz a Texto: Utiliza el modelo Whisper de OpenAI para transcribir tu voz a texto con alta precisión.
- Generación de Respuestas: Emplea un modelo de lenguaje grande (LLM) basado en Llama para generar respuestas inteligentes y contextuales.
- Conversión de Texto a Voz: Usa CoquiTTS y el modelo XTTS2 para convertir las respuestas de texto en una voz natural y humana.
- Clonación de Voz: Tiene la capacidad de clonar una voz a partir de una muestra de audio corta, personalizando así la experiencia.
Rolando Andrade
Este proyecto es solo con fines educativos.