Jinkin commited on
Commit
de0b237
1 Parent(s): 3e9652a

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +1 -1
README.md CHANGED
@@ -1059,7 +1059,7 @@ model-index:
1059
 
1060
  piccolo是一个通用embedding模型(中文), 由来自商汤科技的通用模型组完成训练。piccolo借鉴了E5以及GTE的训练流程,采用了两阶段的训练方式。
1061
  在第一阶段中,我们搜集和爬取了4亿的中文文本对(可视为弱监督文本对数据),并采用二元组的softmax对比学习损失来优化模型。
1062
- 在第二阶段中,我们从搜集整理了2000万人工标注的中文文本对(精标数据),并采用带有难负样本的三元组的softmax对比学习损失来帮助模型更好地优化。
1063
  目前,我们提供了piccolo-base-zh和piccolo-large-zh两个模型。
1064
 
1065
  piccolo is a general text embedding model(chinese), powered by General Model Group from SenseTime Research.
 
1059
 
1060
  piccolo是一个通用embedding模型(中文), 由来自商汤科技的通用模型组完成训练。piccolo借鉴了E5以及GTE的训练流程,采用了两阶段的训练方式。
1061
  在第一阶段中,我们搜集和爬取了4亿的中文文本对(可视为弱监督文本对数据),并采用二元组的softmax对比学习损失来优化模型。
1062
+ 在第二阶段中,我们搜集整理了2000万人工标注的中文文本对(精标数据),并采用带有难负样本的三元组的softmax对比学习损失来帮助模型更好地优化。
1063
  目前,我们提供了piccolo-base-zh和piccolo-large-zh两个模型。
1064
 
1065
  piccolo is a general text embedding model(chinese), powered by General Model Group from SenseTime Research.