讨论

#1
by twhongyujiang - opened

请问该如何解决「是」和「不是」得出的高相关性?
['是', '不是'] Similarity: 91.37
['是', '否'] Similarity: 89.87

单字、单词看语义相似度没意义,本项目解决sentence、text级别的语义。

请问输入的文本token数超过多少效果就会明显下降,我看大佬你的说明里面建议长度为256
但是原始的编码模型的位置编码长度有2048
意思是你在再训练阶段 所用的训练集的输入文本均是小于等于256的长度吗

好的,感谢

Sign up or log in to comment