logical-reasoning / data /Qwen2.5-72B-Instruct_shots_metrics.csv
dh-mc's picture
fix bug in perf calc
11f2c15
raw
history blame contribute delete
520 Bytes
shots,model,run,accuracy,precision,recall,f1,ratio_valid_classifications
0,Qwen2.5-72B-Instruct,Qwen/Qwen2.5-72B-Instruct/shots-00,0.7856666666666666,0.7942511546806512,0.7856666666666666,0.7699212943617263,0.994
5,Qwen2.5-72B-Instruct,Qwen/Qwen2.5-72B-Instruct/shots-05,0.8113333333333334,0.8112264644451684,0.8113333333333334,0.8039596846574816,0.9416666666666667
10,Qwen2.5-72B-Instruct,Qwen/Qwen2.5-72B-Instruct/shots-10,0.8103333333333333,0.8136844357537636,0.8103333333333333,0.8088046626262355,0.9123333333333333