xuandin commited on
Commit
563afd2
·
verified ·
1 Parent(s): 1234318

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +61 -3
README.md CHANGED
@@ -1,9 +1,41 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ```Python
2
  import torch
3
  import torch.nn.functional as F
 
 
4
 
5
- # tokenizer = AutoTokenizer.from_pretrained("xuandin/semviqa-tc-infoxlm-viwikifc")
6
- # model = ClaimModelForClassification.from_pretrained("xuandin/semviqa-tc-infoxlm-viwikifc")
7
  claim = "Chiến tranh với Campuchia đã kết thúc trước khi Việt Nam thống nhất."
8
  evidence = "Sau khi thống nhất, Việt Nam tiếp tục gặp khó khăn do sự sụp đổ và tan rã của đồng minh Liên Xô cùng Khối phía Đông, các lệnh cấm vận của Hoa Kỳ, chiến tranh với Campuchia, biên giới giáp Trung Quốc và hậu quả của chính sách bao cấp sau nhiều năm áp dụng."
9
 
@@ -32,4 +64,30 @@ for i, (label, prob) in enumerate(zip(labels, probabilities.tolist()), start=1):
32
  # 1) NEI 0.0009
33
  # 2) SUPPORTED 0.0000
34
  # 3) REFUTED 0.9990
35
- ```
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - vi
4
+ library_name: transformers
5
+ tags:
6
+ - SemViQA
7
+ - three-class-classification
8
+ - fact-checking
9
+ pipeline_tag: text-classification
10
+ license: mit
11
+ ---
12
+
13
+ # SemViQA-TC: Vietnamese Three-class Classification for Claim Verification
14
+
15
+ ## Model Description
16
+
17
+ **SemViQA-TC** is one of the key components of the **SemViQA** system, designed for **three-class classification** in Vietnamese fact-checking. This model classifies a given claim into one of three categories: **SUPPORTED**, **REFUTED**, or **NOT ENOUGH INFORMATION (NEI)** based on retrieved evidence.
18
+
19
+ ### **Model Information**
20
+ - **Developed by:** [SemViQA Research Team](https://huggingface.co/SemViQA)
21
+ - **Fine-tuned model:** [Ernie-M](https://huggingface.co/MoritzLaurer/ernie-m-large-mnli-xnli)
22
+ - **Supported Language:** Vietnamese
23
+ - **Task:** Three-Class Classification (Fact Verification)
24
+ - **Dataset:** [ISE-DSC01](https://codalab.lisn.upsaclay.fr/competitions/15497)
25
+
26
+ SemViQA-TC serves as the **first step in the two-step classification process** of the SemViQA system. It initially categorizes claims into three classes: **SUPPORTED, REFUTED, or NEI**. For claims classified as **SUPPORTED** or **REFUTED**, a secondary **binary classification model (SemViQA-BC)** further refines the prediction. This hierarchical classification strategy enhances the accuracy of fact verification.
27
+
28
+ ## Usage Example
29
+
30
+ Direct Model Usage
31
  ```Python
32
  import torch
33
  import torch.nn.functional as F
34
+ from transformers import AutoTokenizer
35
+ from semviqa.tvc.model import ClaimModelForClassification
36
 
37
+ tokenizer = AutoTokenizer.from_pretrained("SemViQA/tc-erniem-isedsc01")
38
+ model = ClaimModelForClassification.from_pretrained("SemViQA/tc-erniem-isedsc01")
39
  claim = "Chiến tranh với Campuchia đã kết thúc trước khi Việt Nam thống nhất."
40
  evidence = "Sau khi thống nhất, Việt Nam tiếp tục gặp khó khăn do sự sụp đổ và tan rã của đồng minh Liên Xô cùng Khối phía Đông, các lệnh cấm vận của Hoa Kỳ, chiến tranh với Campuchia, biên giới giáp Trung Quốc và hậu quả của chính sách bao cấp sau nhiều năm áp dụng."
41
 
 
64
  # 1) NEI 0.0009
65
  # 2) SUPPORTED 0.0000
66
  # 3) REFUTED 0.9990
67
+ ```
68
+
69
+ ## **Citation**
70
+
71
+ If you use **SemViQA-TC** in your research, please cite:
72
+
73
+ ```bibtex
74
+ @misc{nguyen2025semviqasemanticquestionanswering,
75
+ title={SemViQA: A Semantic Question Answering System for Vietnamese Information Fact-Checking},
76
+ author={Nam V. Nguyen and Dien X. Tran and Thanh T. Tran and Anh T. Hoang and Tai V. Duong and Di T. Le and Phuc-Lu Le},
77
+ year={2025},
78
+ eprint={2503.00955},
79
+ archivePrefix={arXiv},
80
+ primaryClass={cs.CL},
81
+ url={https://arxiv.org/abs/2503.00955},
82
+ }
83
+ ```
84
+
85
+ 🔗 **Paper Link:** [SemViQA on arXiv](https://arxiv.org/abs/2503.00955)
86
+ 🔗 **Source Code:** [GitHub - SemViQA](https://github.com/DAVID-NGUYEN-S16/SemViQA)
87
+
88
+ ## About
89
+
90
+ *Built by Dien X. Tran*
91
+ [![LinkedIn](https://img.shields.io/badge/LinkedIn-Profile-blue?logo=linkedin)](https://www.linkedin.com/in/xndien2004/)
92
+ For more details, visit the project repository.
93
+ [![GitHub stars](https://img.shields.io/github/stars/DAVID-NGUYEN-S16/SemViQA?style=social)](https://github.com/DAVID-NGUYEN-S16/SemViQA)