Spaces:
Sleeping
Sleeping
title: ChinesePrivacyPolicyMark | |
emoji: 👁 | |
colorFrom: gray | |
colorTo: purple | |
sdk: gradio | |
sdk_version: 5.5.0 | |
app_file: app.py | |
pinned: false | |
short_description: Mark Chinese Privacy Policy with Retrieve models | |
使用的数据地址:https://github.com/EnlightenedAI/CAPP-130<br> | |
使用预训练好的模型检索预先保存好的隐私政策,以此标注隐私政策中的关键信息。<br> | |
首先使用特征提取模型将隐私政策中的句子进行tokenize,将其与保存的向量对比进行一次“粗筛”,选取与其最为接近的n条记录。<br> | |
之后使用文本相似度计算模型,将筛选出来的n条记录与原本的文本进行匹配,过滤出相似度高于阈值p的m条记录,将这m条记录所属的标记合并起来。<br> | |
由于没有使用GPU,直接在Space中运行会很慢。有条件可以clone下来试试。 |