Lovre Pešut issues

Repositories
Issues
Comments

Results 1 issues of


                                            Lovre Pešut

feat(guides): Add guide for RL via TRL with rollouts running on Daytona sandboxes

## Description This PR adds an example of using Daytona sandboxes for running code generated in RL rollouts. It trains a Qwen base model, `Qwen/Qwen3-1.7B-Base`, on two basic code writing...