README.md

Tip

QuickStart

Prep System

kubectl label node papaya nvidia.com/gpu=present

Prep image

# llama.cpp
docker build -t llama-cpp-qwen3:jp6 -f docker/llama_cpp.Dockerfile . &&\
docker save llama-cpp-qwen3:jp6 | sudo k3s ctr images import -

# langcache
docker build -f docker/langcache_embed.Dockerfile -t llama-cpp-langcache:jp6 . &&\
docker save llama-cpp-langcache:jp6 | sudo k3s ctr images import -

deploy

# Start
kubectl apply -f k8s/llama-cpp-qwen3-embedding-0.6b.yaml
kubectl apply -f k8s/llama-cpp-langcache-embed-v3-small.yaml

# Or restart
kubectl rollout restart deployment/llama-cpp-qwen3-embedding-0-6b -n cozy-ai
kubectl rollout restart deployment/llama-cpp-langcache-embed-v3-small -n cozy-ai

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

README.md

QuickStart

Prep System

Prep image

deploy

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
docker		docker
k8s		k8s
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

README.md

QuickStart

Prep System

Prep image

deploy

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages