Xiao Hu's picture

5 3

Xiao Hu

huxiao09

·

huxiao09

AI & ML interests

Reinforcement Learning, LLM Reasoning

Recent Activity

upvoted an article 9 days ago

Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries

upvoted a paper 4 months ago

Entropy-Adaptive Fine-Tuning: Resolving Confident Conflicts to Mitigate Forgetting

liked a model 5 months ago

Kwai-Keye/Keye-VL-671B-A37B

View all activity

Organizations

None yet

Papers 5

arxiv:2507.01949

arxiv:2505.21067

arxiv:2505.02835

arxiv:2402.03046

models 0

None public yet

datasets 0

None public yet