AGI LAb

non-profit

fabdavide

Benchmarking

fabrizio-davide updated a Space 11 days ago

AGILab/README

fabrizio-davide authored a paper 11 days ago

fabrizio-davide published a Space 11 days ago

AGILab/README

Organization Card

We refer to https://arxiv.org/abs/2412.09385

to implement a LLM peer review to end up to a new benchmark

None public yet

None public yet