3 5

anonymousee

anonymousee8

AI & ML interests

None yet

Recent Activity

upvoted a collection 4 days ago

Monthly-SWEBench

updated a model 10 days ago

anonymousee8/harbor_multiturn

published a model 10 days ago

anonymousee8/harbor_multiturn

View all activity

Organizations

None yet

upvoted a collection 4 days ago

Monthly-SWEBench

Collection

A continuously updated benchmark evaluating AI coding agents on real-world software engineering tasks from GitHub issues. • 2 items • Updated 4 days ago • 1

updated a model 10 days ago

anonymousee8/harbor_multiturn

Updated 10 days ago

published a model 10 days ago

anonymousee8/harbor_multiturn

Updated 10 days ago

published a dataset 10 days ago

anonymousee8/evocodebench

Updated 10 days ago • 24

updated a dataset 10 days ago

anonymousee8/evocodebench

Updated 10 days ago • 24

upvoted a paper 4 months ago

BabyVision: Visual Reasoning Beyond Language

Paper • 2601.06521 • Published Jan 10 • 201

liked 2 models over 1 year ago

nthakur/contriever-base-msmarco

facebook/contriever-msmarco

Feature Extraction • Updated Jun 25, 2022 • 25.8k • • 33

upvoted a paper almost 2 years ago

MMEvalPro: Calibrating Multimodal Benchmarks Towards Trustworthy and Efficient Evaluation

Paper • 2407.00468 • Published Jun 29, 2024 • 36

liked a model almost 2 years ago

meta-llama/Meta-Llama-3-8B-Instruct

Text Generation • 8B • Updated Jun 18, 2025 • 1.71M • • 4.52k

liked a Space about 2 years ago

Open LLM Leaderboard

🏆

14k

Track, rank and evaluate open LLMs and chatbots

liked a dataset about 2 years ago

allenai/metaicl-data

Viewer • Updated Jun 30, 2022 • 119k • 1.14k • 5

anonymousee

AI & ML interests

Recent Activity

Organizations

anonymousee8's activity

Open LLM Leaderboard