Releases · GreenBitAI/gbx-lm · GitHub

05 May 19:45

yanghaojin

Release v0.4.1 Latest

Latest

Added

support for Qwen3 models.
better dependency management and setup configuration.
model evaluation method.
support for MOE model architectures.

Assets 2

17 Mar 16:09

yanghaojin

Release v0.4.0

Updated

improved fastapi-server.
improved bge embedding model serving method.

Assets 2

19 Feb 17:04

yanghaojin

Release v0.3.8

Updated

fixed some issues in fastapi-server and langchain pipeline.

Assets 2

18 Feb 22:07

yanghaojin

Release v0.3.7

Updated

synchronized with mlx==0.23.0 and mlx-lm==0.21.4

Assets 2

15 Jan 22:22

yanghaojin

Release v0.3.6

Updated

created async_generate_step in fast-api
added token usage information in fast-api
extended libra router types

Assets 2

25 Nov 09:16

yanghaojin

Release v0.3.5

Updated

improved fastAPI server
support libra confidence router

Assets 2

15 Oct 08:44

yanghaojin

Release v0.3.4

Updated

improved the hidden states generation method
project structure refactoring

Assets 2

10 Oct 20:15

yanghaojin

Release v0.3.3

Added

langchain integration
local_rag and graph_rag example

Updated

generate method to support hidden states output

Assets 2

13 Sep 16:16

yanghaojin

Release v0.3.2

Added

model management, FastAPI-server
unit test

Updated

synchronized with the mlx-lm
simplified README

Assets 2

14 Jun 14:19

yanghaojin

Release v0.3.1

Updated

updated mlx_fastchat_worker for supporting mlx >= 0.14.
updated conda config.

Assets 2