efficientLLM

for notebooks to run in your local environment

first run

!pip install -r requirements.txt

then download the model

llm model optimizations to decrease latency

1. KV model 2. Batching 3. Continuous Batching

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.gitignore		.gitignore
01TextGeneration.ipynb		01TextGeneration.ipynb
02Batching.ipynb		02Batching.ipynb
03afilter_batching.ipynb		03afilter_batching.ipynb
03ahow_truncate_left.txt		03ahow_truncate_left.txt
03bMerging.ipynb		03bMerging.ipynb
README.md		README.md
data_flow.py		data_flow.py
data_manipulation.py		data_manipulation.py
model_downloader.py		model_downloader.py
requirements.txt		requirements.txt