131 37

hienhq

wanhin

AI & ML interests

None yet

Recent Activity

updated a model 2 days ago

wanhin/lab22-dpo-vn-gguf

published a model 2 days ago

wanhin/lab22-dpo-vn-gguf

updated a model 2 days ago

wanhin/lab22-dpo-vn-merged

View all activity

Organizations

updated a model 2 days ago

wanhin/lab22-dpo-vn-gguf

3B • Updated 2 days ago • 70

published a model 2 days ago

wanhin/lab22-dpo-vn-gguf

3B • Updated 2 days ago • 70

updated a model 2 days ago

wanhin/lab22-dpo-vn-merged

3B • Updated 2 days ago • 14

published a model 2 days ago

wanhin/lab22-dpo-vn-merged

3B • Updated 2 days ago • 14

updated a model 2 days ago

wanhin/lab22-dpo-vn

Text Generation • Updated 2 days ago • 13

published a model 2 days ago

wanhin/lab22-dpo-vn

Text Generation • Updated 2 days ago • 13

updated a model 2 days ago

wanhin/lab22-sft-mini

Text Generation • Updated 2 days ago • 12

published a model 2 days ago

wanhin/lab22-sft-mini

Text Generation • Updated 2 days ago • 12

updated a model 3 days ago

wanhin/qwen2.5-3b-vi-lab21-r16

Updated 3 days ago

published a model 3 days ago

wanhin/qwen2.5-3b-vi-lab21-r16

Updated 3 days ago

liked a dataset 28 days ago

hungnm/vietnamese-medical-qa

Viewer • Updated Feb 16, 2024 • 9.34k • 241 • 5

upvoted 4 papers 3 months ago

liked a dataset 3 months ago

BleachNick/UltraEdit

Updated Aug 31, 2024 • 15.4k • 16

upvoted 2 papers 4 months ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published Jan 8 • 231

mHC: Manifold-Constrained Hyper-Connections

Paper • 2512.24880 • Published Dec 31, 2025 • 325

upvoted a paper 6 months ago

π_RL: Online RL Fine-tuning for Flow-based Vision-Language-Action Models

Paper • 2510.25889 • Published Oct 29, 2025 • 66

upvoted a paper 7 months ago

Robot Learning: A Tutorial

Paper • 2510.12403 • Published Oct 14, 2025 • 130

hienhq

AI & ML interests

Recent Activity

Organizations

wanhin's activity