Spaces:
Running
Running
bourdoiscatie
commited on
Commit
•
020655e
1
Parent(s):
86588a9
Upload 3 files
Browse files- Vaniila.png +0 -0
- app.py +63 -0
- requirements.txt +3 -0
Vaniila.png
ADDED
app.py
ADDED
@@ -0,0 +1,63 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
import streamlit as st
|
2 |
+
from transformers import pipeline
|
3 |
+
from PIL import Image
|
4 |
+
|
5 |
+
st.sidebar.header("**Instructions**")
|
6 |
+
st.sidebar.markdown("Démonstrateur du modèle [QAmembert](https://huggingface.co/CATIE-AQ/QAmembert) entraîné sur plus de 220 000 contextes/questions/réponses en français. Le modèle est capable d'indiquer si la réponse se situe ou non dans le texte fourni. Il est disponible en version *base* (110M de paramètres) et *large* (335M de paramètres). Pour l'essayer, sélectionnez la version de votre choix ci-dessous, puis renseignez un texte et une question à propos de celui-ci. Enfin appuyez sur le bouton « Appliquer le modèle » pour observer la réponse trouvée par le modèle. Pour ens avoir plus sur ce modèle, vous pouvez lire l'[article de blog](https://blog.vaniila.ai/QA/) détaillant la démarche suvie.")
|
7 |
+
version = st.sidebar.radio("Choix de la version du modèle :", ["version base", "version large"])
|
8 |
+
st.sidebar.markdown("---")
|
9 |
+
st.sidebar.markdown("Ce modèle a été entraîné via la plateforme [*Vaniila*](https://www.vaniila.ai/) du [CATIE](https://www.catie.fr/).")
|
10 |
+
|
11 |
+
image_path = 'Vaniila.png'
|
12 |
+
image = Image.open(image_path)
|
13 |
+
st.sidebar.image(image, caption=None, width=None, use_column_width=None, clamp=False, channels="RGB", output_format="auto")
|
14 |
+
|
15 |
+
@st.cache_resource
|
16 |
+
def load_model(version):
|
17 |
+
if version == "version base":
|
18 |
+
return pipeline('question-answering', model='CATIE-AQ/QAmembert', tokenizer='CATIE-AQ/QAmembert')
|
19 |
+
else:
|
20 |
+
return pipeline('question-answering', model='CATIE-AQ/QAmembert-large', tokenizer='CATIE-AQ/QAmembert-large')
|
21 |
+
|
22 |
+
def results():
|
23 |
+
col1, col2, col3 = st.columns(3)
|
24 |
+
if col2.button('Appliquer le modèle'):
|
25 |
+
result = model(question,context)
|
26 |
+
st.write("Résultat")
|
27 |
+
if result['score'] < 0.01:
|
28 |
+
st.info("La réponse n'est pas dans le contexte fourni.")
|
29 |
+
else :
|
30 |
+
st.info(result['answer'])
|
31 |
+
with st.expander("Voir le détail :"):
|
32 |
+
st.write("• Score :", result['score'])
|
33 |
+
st.write("• Début de la réponse :", result['start'])
|
34 |
+
st.write("• Fin de la réponse :", result['end'])
|
35 |
+
st.write("• Réponse :", result['answer'])
|
36 |
+
pass
|
37 |
+
|
38 |
+
|
39 |
+
st.markdown("<h2 style='text-align: center'>QAmembert", unsafe_allow_html=True)
|
40 |
+
st.markdown("<h4 style='text-align: center'>"+version, unsafe_allow_html=True)
|
41 |
+
model = load_model(version)
|
42 |
+
|
43 |
+
option = st.selectbox(
|
44 |
+
'Choix du mode',
|
45 |
+
('Texte libre', 'Exemple 1', 'Exemple 2'))
|
46 |
+
|
47 |
+
if option == "Exemple 1":
|
48 |
+
context = st.text_area("Votre texte", value="Le français est une langue indo-européenne de la famille des langues romanes dont les locuteurs sont appelés francophones. Elle est parfois surnommée la langue de Molière. Le français est parlé, en 2023, sur tous les continents par environ 321 millions de personnes : 235 millions l'emploient quotidiennement et 90 millions en sont des locuteurs natifs. En 2018, 80 millions d'élèves et étudiants s'instruisent en français dans le monde. Selon l'Organisation internationale de la francophonie (OIF), il pourrait y avoir 700 millions de francophones sur Terre en 2050.",height=175)
|
49 |
+
question = st.text_input("Votre question", value="Combien de personnes utilisent le français tous les jours ?")
|
50 |
+
if context and question:
|
51 |
+
results()
|
52 |
+
|
53 |
+
elif option == "Exemple 2":
|
54 |
+
context = st.text_area("Votre texte", value="Le français est une langue indo-européenne de la famille des langues romanes dont les locuteurs sont appelés francophones. Elle est parfois surnommée la langue de Molière. Le français est parlé, en 2023, sur tous les continents par environ 321 millions de personnes : 235 millions l'emploient quotidiennement et 90 millions en sont des locuteurs natifs. En 2018, 80 millions d'élèves et étudiants s'instruisent en français dans le monde. Selon l'Organisation internationale de la francophonie (OIF), il pourrait y avoir 700 millions de francophones sur Terre en 2050.",height=175)
|
55 |
+
question = st.text_input("Votre question", value="Quel est le meilleur vin du monde ?")
|
56 |
+
if context and question:
|
57 |
+
results()
|
58 |
+
|
59 |
+
else:
|
60 |
+
context = st.text_area("Votre texte", value="",height=175)
|
61 |
+
question = st.text_input("Votre question", value="")
|
62 |
+
if context and question:
|
63 |
+
results()
|
requirements.txt
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
torch --extra-index-url https://download.pytorch.org/whl/cpu
|
2 |
+
streamlit==1.23.0
|
3 |
+
transformers==4.30.1
|