Spaces:
Runtime error
Runtime error
Pooya-Fallah
commited on
Create app.py
Browse files
app.py
ADDED
@@ -0,0 +1,67 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
import torch
|
2 |
+
import torch.nn as nn
|
3 |
+
from huggingface_hub import PyTorchModelHubMixin
|
4 |
+
import transformers
|
5 |
+
import hazm
|
6 |
+
import gradio as gr
|
7 |
+
|
8 |
+
# Define class of the model
|
9 |
+
class ParsbertHallu(nn.Module, PyTorchModelHubMixin):
|
10 |
+
def __init__(self):
|
11 |
+
super().__init__()
|
12 |
+
self.transformer_model = transformers.AutoModelForSequenceClassification.from_pretrained("Pooya-Fallah/ParsBERT-nli-FarsTail-FarSick",
|
13 |
+
num_labels=3)
|
14 |
+
self.head = nn.Sequential(
|
15 |
+
nn.Linear(3,1),
|
16 |
+
nn.Sigmoid()
|
17 |
+
)
|
18 |
+
|
19 |
+
|
20 |
+
def forward(self, x):
|
21 |
+
out = self.transformer_model(**x)['logits']
|
22 |
+
return torch.squeeze(self.head(out))
|
23 |
+
|
24 |
+
# Example Inputs
|
25 |
+
example_1 = [
|
26 |
+
"""هنگامی که به تناسب اندام فکر می کنید، مصرف غذاهای پروتئین دار قبل و بعد از بدنسازی می تواند پروتئین لازم را برای کمک به رشد عضلات، فراهم کند. در این مطلب، بهترین منابع غذاهای پروتئین دار و میوه های غنی از پروتئین را معرفی می کنیم. تمرینات بدنسازی معمولا سنگین بوده و نیازمند زمان قابل توجهی از روز هستند. اما برای بدنسازی پیش از هر کاری بهتر است، فهرستی از غذاهای پروتئین دار قبل و بعد از تمرین تهیه کنید. علاوه بر یک رژیم ورزشی خوب، رژیم غذایی مناسب نیز برای رسیدن به اندامی دلخواه، لازم است. در هر حال در بدنسازی هم رژیم غذایی و غذاهای پروتئین دار قبل و بعد از تمرین، امر مهمی است."""
|
27 |
+
,
|
28 |
+
"""چه ماده غذایی برای بدن سازی مهم است؟"""
|
29 |
+
,
|
30 |
+
"""مهمترین ماده غذایی برای بدن سازی، رنگینکمانهای جادویی هستند که باعث افزایش عضلات و کاهش چربی میشوند!"""
|
31 |
+
]
|
32 |
+
|
33 |
+
example_2 = [
|
34 |
+
"""شمشیر بازی نوعی رشته ورزشی است که دو ورزشکار در آن با استفاده از یک شمشیر کوچک با هم مبارزه میکنند. شمشیربازی یکی از پنج رشته ورزشی است که در همه دورههای بازیهای المپیک برگزار شدهاست (چهار رشته دیگر دو و میدانی، شنا، ژیمناستیک و دوچرخهسواری هستند). مسابقات این رشته در سه بخش فلوره، اپه و سابر برگزار میشود که از نظر نوع شمشیر مورد استفاده و قوانین بازی با یکدیگر تفاوت دارند."""
|
35 |
+
,
|
36 |
+
"""شمشیرهای رشته شمشیربازی؟"""
|
37 |
+
,
|
38 |
+
"""فلوره، اپه و سابر"""
|
39 |
+
]
|
40 |
+
|
41 |
+
# Hazm normalizer
|
42 |
+
normalizer = hazm.Normalizer()
|
43 |
+
|
44 |
+
# tokenizer is from ParsBERT (HooshvareLab/bert-fa-zwnj-base)
|
45 |
+
tokenizer = transformers.AutoTokenizer.from_pretrained('HooshvareLab/bert-fa-zwnj-base')
|
46 |
+
|
47 |
+
# load model
|
48 |
+
model = ParsbertHallu.from_pretrained("Pooya-Fallah/ParsbertHallu")
|
49 |
+
|
50 |
+
def get_hallucination_label(knowledge, question, answer):
|
51 |
+
knowledge = normalizer.normalize(knowledge)
|
52 |
+
question = normalizer.normalize(question)
|
53 |
+
answer = normalizer.normalize(answer)
|
54 |
+
|
55 |
+
tokens = tokenizer(knowledge, question + " " + answer, truncation=True, padding=True,
|
56 |
+
max_length=512, return_tensors='pt')
|
57 |
+
|
58 |
+
prob = round(model(tokens).item(), 2)
|
59 |
+
|
60 |
+
return {"Hallucinated": prob, "Not-Hallucinated": 1-prob}
|
61 |
+
|
62 |
+
demo = gr.Interface(fn=get_hallucination_label, inputs=[gr.TextArea(lines=7, placeholder="knowledge"), gr.TextArea(lines=3, placeholder="question"), gr.TextArea(lines=3, placeholder="answer")],
|
63 |
+
outputs=gr.Label(num_top_classes=2), examples=[example_1, example_2],
|
64 |
+
title="Hallucination Detection Demo for Persian Question Answering Task",
|
65 |
+
description="A straightforward binary classifier that determines whether the generated answer is hallucinated or not."
|
66 |
+
)
|
67 |
+
demo.launch()
|