qgyd2021's picture
Update README.md
c9129a5 verified
|
raw
history blame
472 Bytes
metadata
license: apache-2.0

few_shot_intent_gpt2

这个模型是基于 uer/gpt2-chinese-cluecorpussmall 模型在 qgyd2021/few_shot_intent_sft 数据集上微调的结果.

原本准备了 3 个 epoch 的数据,但模型在大约 1 个 epoch 时就 Early Stop 了。

最终的模型大约是在训练了 0.6 个 epoch 时保存的结果。