shibing624
commited on
Update README.md
Browse files
README.md
CHANGED
@@ -24,12 +24,6 @@ pipeline_tag: sentence-similarity
|
|
24 |
- 关于分词:可以使用任何开源分词工具,可以同时考虑细粒度和粗粒度的分词方式。
|
25 |
- 关于停用词、数字、标点:为了满足一些场景的需求,腾讯词向量并没有去掉这些,使用的时候需要自己构建词表并忽略其他无关词汇。
|
26 |
|
27 |
-
## Tencent_AILab_ChineseEmbedding.txt文件内容:
|
28 |
-
第一行是词向量总数(8824330),和词向量维度(200)。
|
29 |
-
|
30 |
-
从第二行开始,每行是中文词以及它的词向量表示,每一维用空格分隔。
|
31 |
-
|
32 |
-
|
33 |
|
34 |
## 腾讯词向量使用举例
|
35 |
以查找近义词为例,介绍腾讯词向量的使用方法。
|
|
|
24 |
- 关于分词:可以使用任何开源分词工具,可以同时考虑细粒度和粗粒度的分词方式。
|
25 |
- 关于停用词、数字、标点:为了满足一些场景的需求,腾讯词向量并没有去掉这些,使用的时候需要自己构建词表并忽略其他无关词汇。
|
26 |
|
|
|
|
|
|
|
|
|
|
|
|
|
27 |
|
28 |
## 腾讯词向量使用举例
|
29 |
以查找近义词为例,介绍腾讯词向量的使用方法。
|