LLM evals and benchmark datasets
updated
Viewer
•
Updated
•
8.11k
•
6.93k
•
91
Viewer
•
Updated
•
164
•
92.6k
•
288
Viewer
•
Updated
•
541
•
16k
•
64
Viewer
•
Updated
•
7.79k
•
535k
•
178
Updated
•
471k
•
61
Viewer
•
Updated
•
12.1k
•
44.6k
•
337
Viewer
•
Updated
•
231k
•
147k
•
430
Viewer
•
Updated
•
1.63k
•
37.6k
•
228
Viewer
•
Updated
•
17.6k
•
331k
•
657
Viewer
•
Updated
•
60k
•
523k
•
114
Updated
•
21.4k
•
54
HuggingFaceH4/mt_bench_prompts
Viewer
•
Updated
•
80
•
386
•
17
Viewer
•
Updated
•
34.6k
•
2.27k
•
108
Viewer
•
Updated
•
95.4k
•
4.21k
•
39