LLM evals and benchmark datasets
updated
Viewer
•
Updated
•
8.11k
•
9.81k
•
87
Viewer
•
Updated
•
164
•
80k
•
271
Viewer
•
Updated
•
541
•
12.6k
•
54
Viewer
•
Updated
•
7.79k
•
230k
•
165
Updated
•
131k
•
60
Viewer
•
Updated
•
12.1k
•
45.2k
•
314
Viewer
•
Updated
•
231k
•
134k
•
383
Viewer
•
Updated
•
1.63k
•
34.9k
•
220
Viewer
•
Updated
•
17.6k
•
255k
•
552
Viewer
•
Updated
•
60k
•
198k
•
106
Updated
•
34.2k
•
53
HuggingFaceH4/mt_bench_prompts
Viewer
•
Updated
•
80
•
131
•
16
Viewer
•
Updated
•
34.6k
•
1.78k
•
108
Viewer
•
Updated
•
95.4k
•
2.88k
•
36