kxfan2002

Bunny07 kxfan2002

Achievements

SophiaVL-R1 SophiaVL-R1 Public

SophiaVL-R1: Reinforcing MLLMs Reasoning with Thinking Reward

Python 91 3
Reagent Reagent Public

Agent-RRM: Exploring Reasoning Reward Model for Agents

Python 42 4
R1-Collection R1-Collection Public

A collection of R1-based repos.

2
examPapers examPapers Public
kxfan.github.io kxfan.github.io Public template

Github Pages template for academic personal websites, forked from mmistakes/minimal-mistakes

JavaScript
EasyR1 EasyR1 Public

Forked from hiyouga/EasyR1

EasyR1: An Efficient, Scalable, Multi-Modality RL Training Framework based on veRL

Python