qgyd2021's picture
Update README.md
c9129a5 verified
|
raw
history blame
472 Bytes
---
license: apache-2.0
---
## few_shot_intent_gpt2
这个模型是基于 [uer/gpt2-chinese-cluecorpussmall](https://huggingface.co/uer/gpt2-chinese-cluecorpussmall) 模型在 [qgyd2021/few_shot_intent_sft](https://huggingface.co/datasets/qgyd2021/few_shot_intent_sft) 数据集上微调的结果.
原本准备了 3 个 epoch 的数据,但模型在大约 1 个 epoch 时就 Early Stop 了。
最终的模型大约是在训练了 0.6 个 epoch 时保存的结果。