reinforcement-finetuning topic

List reinforcement-finetuning repositories

148

Stars

Forks

148

Watchers

Official code for the paper, "Stop Summation: Min-Form Credit Assignment Is All Process Reward Model Needs for Reasoning"

354

Stars

Forks

354

Watchers

[NeurIPS 2025] AutoVLA: A Vision-Language-Action Model for End-to-End Autonomous Driving with Adaptive Reasoning and Reinforcement Fine-Tuning