Embedding Service

A local text embedding service using HuggingFace's Text Embeddings Inference server.

Prerequisites

Docker
jq (for the CLI tool)
curl

Quick Start

# Start the service and wait until ready
./setup.sh

# Generate an embedding
echo "Hello world" | ./embed.sh

Configuration

Set environment variables before starting the service:

Variable	Default	Description
`EMBEDDING_MODEL_ID`	`unsloth/embeddinggemma-300m`	HuggingFace model to use
`EMBEDDING_DIMENSION`	`768`	Embedding vector dimension

Example with a different model:

EMBEDDING_MODEL_ID=BAAI/bge-small-en-v1.5 ./setup.sh

Usage

CLI

# Single string
echo "text to embed" | ./embed.sh

# From a file
cat document.txt | ./embed.sh

API

The service exposes an OpenAI-compatible API on port 8080:

curl http://localhost:8080/v1/embeddings \
  -H 'Content-Type: application/json' \
  -d '{"model":"unsloth/embeddinggemma-300m","input":"text to embed"}'

Stopping

docker compose down

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.gitignore		.gitignore
EC2.md		EC2.md
GOING_NATIVE.md		GOING_NATIVE.md
README.md		README.md
docker-compose.yml		docker-compose.yml
ec2_user_data.txt		ec2_user_data.txt
embed.sh		embed.sh
setup.sh		setup.sh
wait.sh		wait.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Embedding Service

Prerequisites

Quick Start

Configuration

Usage

CLI

API

Stopping

About

Uh oh!

Releases

Packages

Languages

QuixiAI/embedding-docker

Folders and files

Latest commit

History

Repository files navigation

Embedding Service

Prerequisites

Quick Start

Configuration

Usage

CLI

API

Stopping

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages