API FastAPI + Ollama

Esta API proporciona una solución poderosa para interactuar con modelos de Inteligencia Artificial de manera local y sin dependencia de Internet. A diferencia de servicios en la nube como ChatGPT o Claude, esta implementación te permite:

🔒 Privacidad y Control Total: Los datos nunca salen de tu computadora.
💰 Sin Costos Recurrentes: No hay tarifas por uso ni suscripciones mensuales.
🌐 Funciona Offline: Opera sin necesidad de conexión a Internet.
⚡ Baja Latencia: Respuestas rápidas al procesar todo localmente.
🛠️ Personalizable: Puedes:
- Cambiar el modelo (ejemplo: usar llama2, mistral, o codellama para programación).
- Ajustar el formato de respuesta (en nuestro caso, forzamos respuestas en JSON).
- Modificar el prompt del sistema para diferentes casos de uso.

Requisito previo:
Instala Ollama en tu sistema siguiendo la guía oficial para tu plataforma.
Descarga el modelo necesario ejecutando:
ollama pull gemma3:latest
Inicia el servidor de Ollama (si no está corriendo):
ollama serve

🚀 Inicio rápido con Docker

Este proyecto utiliza Docker para facilitar la ejecución y despliegue de una API basada en FastAPI que interactúa con modelos LLM de Ollama.

El archivo Dockerfile define el entorno Python, instala dependencias con Poetry y expone el puerto 8000 para la API.
El archivo docker-compose.yml permite levantar el servicio fácilmente, usando el modo de red host para que el contenedor pueda comunicarse con Ollama corriendo en tu máquina.

Pasos para levantar la API

Asegúrate de tener Docker y Docker Compose instalados.
Asegúrate de que Ollama esté corriendo en tu host (por ejemplo, con ollama serve).
Levanta la API:
```
docker compose up --build
```
Accede a la documentación interactiva en: http://localhost:8000/docs

🧠 ¿Qué hace la API? (`src/ollama_app.py`)

Esta API expone un endpoint inteligente que permite enviar una pregunta de dos formas:

Solo texto (por ejemplo: "¿Cuál es la capital de Francia?")
Texto acompañado de una imagen (por ejemplo: "¿Qué contiene esta imagen?" + archivo)

El backend procesa la imagen (si se envía), consulta un modelo LLM de Ollama y devuelve una respuesta enriquecida y estructurada.

Lógica principal:

Modelos de datos:
Se definen modelos Pydantic para estructurar tanto la pregunta como la respuesta. La respuesta incluye:
- La respuesta directa (answer)
- El razonamiento del modelo (thoughts)
- El tema identificado (topic)
Procesamiento de la imagen:
Si se envía una imagen, se convierte automáticamente a base64 para ser entendida por el modelo LLM. Si no se envía imagen, el modelo responde solo en base a la pregunta de texto.
Interacción con Ollama:
Se consulta un modelo LLM de Ollama (por defecto, gemma3:latest), pidiéndole que responda siempre en formato JSON con los campos esperados.
Validación y logging:
La respuesta del modelo se valida y estructura antes de devolverse al usuario. Además, cada interacción se registra en un archivo de log para auditoría y análisis.
Endpoint principal:
- POST /api/question
  Recibe:
  - question: Texto de la pregunta (campo de formulario, obligatorio)
  - file: Imagen a analizar (archivo, opcional) Devuelve:
  - Respuesta estructurada con la respuesta, razonamiento y tema.

📄 Ejemplo de uso en Swagger

Ve a http://localhost:8000/docs
Usa el endpoint /api/question
Escribe tu pregunta y, si lo deseas, sube una imagen.
Obtendrás una respuesta enriquecida y explicada por el modelo.

📝 Notas

Es necesario que el servidor Ollama esté corriendo y accesible desde el contenedor Docker.
El endpoint permite preguntas de solo texto o preguntas con imagen; la imagen es opcional.

🖥️ Interfaz web con Streamlit

Además de la API, este proyecto incluye una interfaz web construida con Streamlit para facilitar la interacción con el modelo LLM de Ollama de forma visual.

¿Por qué un servicio Streamlit en Docker Compose?

El servicio streamlit en docker-compose.yml permite levantar la interfaz web en el puerto 8501 usando el mismo entorno y dependencias que la API.
Así, puedes desarrollar y probar tanto la API como la interfaz web de manera integrada y sin conflictos de versiones.

¿Por qué instalar Streamlit con Poetry?

Se usa Poetry para gestionar todas las dependencias del proyecto, asegurando que tanto la API como la interfaz web funcionen en el mismo entorno reproducible.
Si trabajas fuera de Docker, puedes instalar Streamlit ejecutando:
```
poetry add streamlit
```

Cómo usar la interfaz Streamlit

Levanta los servicios con Docker Compose:
```
docker compose up --build
```
Accede a la interfaz web en tu navegador:
http://localhost:8501
Usa la interfaz para:
- Escribir una pregunta.
- (Opcional) Subir una imagen.
- Ver la respuesta, razonamiento y tema generados por el modelo.

El modelo que se está implementando es gemma3:latest. Gemma es una familia ligera de modelos de Google basada en la tecnología Gemini. Los modelos Gemma 3 son multimodales (procesan texto e imágenes) y cuentan con una ventana de contexto de 128K compatible con más de 140 idiomas. Disponibles en tamaños de parámetro de 1B, 4B, 12B y 27B, son excelentes para tareas como responder preguntas, resumir y razonar, y su diseño compacto permite su implementación en dispositivos con recursos limitados.

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
.vscode		.vscode
src		src
.dockerignore		.dockerignore
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
docker-compose.yml		docker-compose.yml
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

API FastAPI + Ollama

🚀 Inicio rápido con Docker

Pasos para levantar la API

🧠 ¿Qué hace la API? (`src/ollama_app.py`)

Lógica principal:

📄 Ejemplo de uso en Swagger

📝 Notas

🖥️ Interfaz web con Streamlit

¿Por qué un servicio Streamlit en Docker Compose?

¿Por qué instalar Streamlit con Poetry?

Cómo usar la interfaz Streamlit

About

Uh oh!

Releases

Packages

Languages

License

jonma0107/fastapi-ollama-streamlit

Folders and files

Latest commit

History

Repository files navigation

API FastAPI + Ollama

🚀 Inicio rápido con Docker

Pasos para levantar la API

🧠 ¿Qué hace la API? (src/ollama_app.py)

Lógica principal:

📄 Ejemplo de uso en Swagger

📝 Notas

🖥️ Interfaz web con Streamlit

¿Por qué un servicio Streamlit en Docker Compose?

¿Por qué instalar Streamlit con Poetry?

Cómo usar la interfaz Streamlit

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

🧠 ¿Qué hace la API? (`src/ollama_app.py`)

Packages