logical-reasoning / data /internlm2_5-7b-chat-1m_shots_metrics.csv
dh-mc's picture
10-shot results ready for 7/8 B models
3db2ae5
raw
history blame
397 Bytes
shots,model,run,accuracy,precision,recall,f1,ratio_valid_classifications
0,internlm2_5-7b-chat-1m,internlm/internlm2_5-7b-chat-1m/shots-00,0.48133333333333334,0.7605248207587668,0.48133333333333334,0.5244515621126862,0.9986666666666667
10,internlm2_5-7b-chat-1m,internlm/internlm2_5-7b-chat-1m/shots-10,0.6473333333333333,0.7282065610714444,0.6473333333333333,0.665824871588245,0.8866666666666667