logical-reasoning / data /Qwen2.5-1.5B-Instruct_shots_metrics.csv
dh-mc's picture
final results
c8eca2c
shots,model,run,accuracy,precision,recall,f1,ratio_valid_classifications
0,Qwen2.5-1.5B-Instruct,Qwen/Qwen2.5-1.5B-Instruct/shots-00,0.18066666666666667,0.5190896501490828,0.18066666666666667,0.2279835258033138,0.931
5,Qwen2.5-1.5B-Instruct,Qwen/Qwen2.5-1.5B-Instruct/shots-05,0.3466666666666667,0.5781128109800681,0.3466666666666667,0.37886593168708843,0.9756666666666667
10,Qwen2.5-1.5B-Instruct,Qwen/Qwen2.5-1.5B-Instruct/shots-10,0.4523333333333333,0.5964896895382023,0.4523333333333333,0.46219676531721876,0.9933333333333333
20,Qwen2.5-1.5B-Instruct,Qwen/Qwen2.5-1.5B-Instruct/shots-20,0.243,0.5419108277814879,0.243,0.31071147199535726,0.8263333333333334
30,Qwen2.5-1.5B-Instruct,Qwen/Qwen2.5-1.5B-Instruct/shots-30,0.23033333333333333,0.55368556787824,0.23033333333333333,0.3067125355762305,0.661
40,Qwen2.5-1.5B-Instruct,Qwen/Qwen2.5-1.5B-Instruct/shots-40,0.292,0.5667420801465655,0.292,0.375496356843247,0.5206666666666667
50,Qwen2.5-1.5B-Instruct,Qwen/Qwen2.5-1.5B-Instruct/shots-50,0.2876666666666667,0.5660207537890989,0.2876666666666667,0.36627420118815035,0.4603333333333333