yu_wang

Repositories
Issues
Comments

Results 2 repositories owned by


                                            yu_wang

Logic-RL-Lite

Stars

Forks

Watchers

Lightweight replication study of DeepSeek-R1-Zero. Interesting findings include "No Aha Moment", "Longer CoT ≠ Accuracy", and "Language Mixing in Instruct Models".

DolbyUUU

deepseek

deepseek-r1

fine-tuning

gpt-o1

DeepEnlighten