research / documents /docs /4-文献分析平台比较.md
haoqi7's picture
Upload 47 files
16188ba

A newer version of the Streamlit SDK is available: 1.38.0

Upgrade

4 Other Literature Research Tools

1 Citespace

作者:爱学习的毛里 链接:https://www.zhihu.com/question/27463829/answer/284247493 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

一、工作原理 简单来讲,citespace主要基于“共现聚类”思想:

  1. 首先对科学文献中的信息单元进行提取
  • 包括文献层面上的参考文献,主题层面上的关键词、主题词、学科、领域分类等,主体层面上的作者、机构、国家、期刊等
  1. 然后根据信息单元间的联系类型和强度进行重构,形成不同意义的网络结构
  • 如关键词共现、作者合作、文献共被引等,
  • 网络中的节点代表文献信息单元,连线代表节点间的联系(共现)
  1. 最后通过对节点、连线及网络结构进行测度、统计分析(聚类、突现词检测等)和可视化,发现特定学科和领域知识结构的隐含模式和规律。

共现聚类思想

二、主要用途

  1. **研究热点分析**:一般利用关键词/主题词共现
  2. 研究前沿探测:共被引、耦合、共词、突现词检测都有人使用,但因为对“研究前沿”的定义尚未统一,所以方法的选择和图谱结果的解读上众说纷纭
  3. 研究演进路径分析:将时序维度与主题聚类结合,例如citespace中的时间线图和时区图
  4. 研究群体发现:一般建立作者/机构合作、作者耦合等网络,可以发现研究小团体、核心作者/机构等
  5. 学科/领域/知识交叉和流动分析:一般建立期刊/学科等的共现网络,可以研究学科之间的交叉、知识流动和融合等除分析 科学文献 外,citespace也可以用来分析 专利技术文献,用途与科学文献类似,包括技术研究热点、趋势、结构、核心专利权人或团体的识别等。

三、工作流程 摘自《引文空间分析原理与应用》

聚类算法

CiteSpace提供的算法有3个,3个算法的名称分别是:

  • LSI/LSA: Latent Semantic Indexing/Latent Semantic Analysis 浅语义索引 intro

  • LLR: Log Likelihood Ratio 对数极大似然率

  • MI: Mutual Information 互信息

对不同的数据,3种算法表现一样,可在实践中多做实践。

paper

2 VOSviewer

VOSviewer的处理流程与大部分的科学知识图谱类软件类似,即文件导入——信息单元抽取(如作者、关键词等)——建立共现矩阵——利用相似度计算对关系进行标准化处理——统计分析(一般描述统计+聚类)——可视化展现(布局+其它图形属性映射)

Normalization, mapping, and clustering

paper (See Appendix)