Bee

Bee, a lightweight LLM API proxy.

介绍

在大模型火热的今天，LLM + RAG 技术做知识库越来越火热，在项目开发中，往往会采用大模型,向量模型，重排模型的组合通过 LLM + RAG 实现智能知识库。

其中，向量模型用于对文本进行向量化，重排模型用于对向量进行排序，LLM 用于对文本进行语言模型预测，通过这三者的组合，实现基于知识库智能问答功能。

目前大多数实现中，对接的这三个模型的接口规范都是采用 OpenAI API 的接口风格（当然，OpenAI 没有提供重排接口文档，因此更多是采用类似的接口规范，比如 Gpustack 的定义就很 OpenAI），但是实际项目中，各个平台或者项目上部署的私有模型接口规范各种各样，因此，需要通过一个适配器把各种接口适配为统一的 OpenAI API 接口规范，才能实现统一的接口调用。

Bee 就是这样一个适配器，它可以把各种接口规范的模型适配为统一的 OpenAI API 接口规范，通过统一的接口调用，实现对接各个平台的私有模型。

Bee 提供了一个快速实现接口适配的方案，把适配过程简化为了 Python 字典数据转换，通过创建一个新的适配器，就可以快速把当前不规范的平台接口转换为统一的 OpenAI API 接口规范，提供给支持 OpenAI API 接口的客户端使用，比如 lobe chat。

已实现代理接口

接口路径	说明	对应的环境变量名称
/v1/embeddings	向量生成接口	bee_embeddings_url
/v1/rerank	结果重排序接口	bee_rerank_url
/v1/chat/completions	对话生成接口	bee_chat_url

代理接口规范文档参考

上层的接口规范参考了 OpenAI API 的接口规范和 Gpustack 的接口规范，文档地址如下：

OpenAI 问答对话接口 API 文档：/v1/chat/completions
OpenAI 向量嵌入接口 API 文档：/v1/embeddings
Gpustack API 文档：API Reference - GPUStack

可配置的环境变量

环境变量名称	默认值	说明
`bee_workers`	`1`	uvicorn 的 worker 数量，高并发场景建议设为 CPU 核心数
`bee_auth_type`	`Bearer`	认证类型，用于接口鉴权（如 Bearer、APIKey 等）
`bee_auth_key`	`sk_123`	认证密钥，用于验证请求合法性
`bee_embeddings_url`	`http://localhost/v1/embeddings`	Embeddings 模型服务的地址（用于向量生成）
`bee_rerank_url`	`http://localhost/v1/rerank`	Rerank 模型服务的地址（用于结果重排序）
`bee_chat_url`	`http://localhost/v1/chat/completions`	Chat 模型服务的地址（用于对话生成）
`bee_provider_type`	`gpustack`	后端模型提供方类型（如 gpustack、ollama、vllm 等）
`bee_show_swagger`	`true`	是否显示 Swagger UI 文档（`true`/`false`）
`bee_show_redoc`	`true`	是否显示 ReDoc 文档（`true`/`false`）
`bee_log_level`	`info`	日志输出级别（如 `debug`, `info`, `warning`, `error` 等）

大多数情况下，只需要配置 bee_embeddings_url, bee_rerank_url, bee_chat_url, bee_provider_type 这四个环境变量即可，其他环境变量的默认值可以直接使用。

docker run 启动

参考命令:

# 在低版本docker（docker version <=20.x）下可能起不来,需要添加 --security-opt seccomp=unconfined --cap-add=SYS_PTRACE 参数
docker run -d --name=bee \
  --security-opt seccomp=unconfined \
  --cap-add=SYS_PTRACE \
  -e bee_embeddings_url=http://localhost/v1/embeddings \
  -e bee_rerank_url=http://localhost/v1/rerank \
  -e bee_chat_url=http://localhost/v1/chat/completions \
  -e bee_provider_type=gpustack \
  -p 8090:80 \
  dhclly/bee:v1.2.1-amd64

# 快速挂载一个新的渠道的示例
docker run -d --name=bee \
  --security-opt seccomp=unconfined \
  --cap-add=SYS_PTRACE \
  -e bee_embeddings_url=http://localhost/v1/embeddings \
  -e bee_rerank_url=http://localhost/v1/rerank \
  -e bee_chat_url=http://localhost/v1/chat/completions \
  -e bee_provider_type=custom_match_1 \
  -v /data/api_providers/custom_match_1:/app/bee/api_providers/custom_match_1
  -p 8090:80 \
  dhclly/bee:v1.3.0-amd64

访问地址：http://localhost:8090

docker hub 地址

dhclly/bee general | Docker Hub

docker pull dhclly/bee:v1.2.1-amd64
docker pull dhclly/bee:v1.2.1-arm64

github 地址

DHclly/bee: Bee, a lightweight LLM API proxy.(https://github.com/DHclly/bee)

代码检测命令

ruff

# 安装
uv add ruff --dev --active

# 检测命令
ruff check src

# 自动修复
ruff check src --fix

Name		Name	Last commit message	Last commit date
Latest commit History 121 Commits
.vscode		.vscode
docker		docker
images		images
src		src
.dockerignore		.dockerignore
.gitignore		.gitignore
.python-version		.python-version
.ruff.toml		.ruff.toml
LICENSE		LICENSE
README.md		README.md
change_log.txt		change_log.txt
pyproject.toml		pyproject.toml
uv.lock		uv.lock
uv.toml		uv.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Bee

介绍

已实现代理接口

代理接口规范文档参考

可配置的环境变量

docker run 启动

docker hub 地址

github 地址

代码检测命令

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Bee

介绍

已实现代理接口

代理接口规范文档参考

可配置的环境变量

docker run 启动

docker hub 地址

github 地址

代码检测命令

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages