AI & ML interests

None yet

Recent Activity

upvoted a paper 11 days ago

Rank-GRPO: Training LLM-based Conversational Recommender Systems with Reinforcement Learning

updated a collection 2 months ago

MIMIGenRec

updated a collection 2 months ago

MIMIGenRec

View all activity

Organizations

None yet

upvoted a paper 11 days ago

Rank-GRPO: Training LLM-based Conversational Recommender Systems with Reinforcement Learning

Paper • 2510.20150 • Published Oct 23, 2025 • 7

updated a collection 2 months ago

MIMIGenRec

Collection

A collection of MIMIGenRec ckpt, including sft and rl model • 8 items • Updated Mar 6

updated a model 2 months ago

cocoshe/Toys_and_Games-qwen2.5-1.5b-instruct-grpo

Updated Mar 1

published a model 2 months ago

cocoshe/Toys_and_Games-qwen2.5-1.5b-instruct-grpo

Updated Mar 1

updated a model 2 months ago

cocoshe/Toys_and_Games-qwen2.5-0.5b-instruct-grpo

Updated Mar 1

published a model 2 months ago

cocoshe/Toys_and_Games-qwen2.5-0.5b-instruct-grpo

Updated Mar 1

updated a model 2 months ago

cocoshe/Toys_and_Games-qwen2.5-1.5b-sft-dsz2

Text Generation • 2B • Updated Mar 1 • 1

published a model 2 months ago

cocoshe/Toys_and_Games-qwen2.5-1.5b-sft-dsz2

Text Generation • 2B • Updated Mar 1 • 1

updated a model 2 months ago

cocoshe/Toys_and_Games-qwen2.5-0.5b-sft-dsz0

Text Generation • 0.6B • Updated Mar 1 • 4

published a model 2 months ago

cocoshe/Toys_and_Games-qwen2.5-0.5b-sft-dsz0

Text Generation • 0.6B • Updated Mar 1 • 4

updated a collection 3 months ago

MIMIGenRec

Collection

A collection of MIMIGenRec ckpt, including sft and rl model • 8 items • Updated Mar 6

updated a model 3 months ago

cocoshe/Office_Products-qwen2.5-0.5b-instruct-grpo

Updated Feb 25

published a model 3 months ago

cocoshe/Office_Products-qwen2.5-0.5b-instruct-grpo

Updated Feb 25

updated a model 3 months ago

cocoshe/Industrial_and_Scientific-qwen2.5-0.5b-instruct-grpo

Updated Feb 25

cocoshe

AI & ML interests

Recent Activity

Organizations

cocoshe's activity