File size: 1,504 Bytes
5dae37c
 
 
 
 
 
 
 
8ef783e
5dae37c
0a8849e
5dae37c
 
51dfa65
5dae37c
0a8849e
 
ea811d9
0a8849e
 
 
 
 
5dae37c
0a8849e
 
5dae37c
 
 
0a8849e
5dae37c
 
 
 
 
0a8849e
3903065
6429257
5dae37c
949f1ec
2a80a0c
5dae37c
 
 
 
 
1fabaac
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
"""
app.py
"""
import os

import gradio as gr
from groq import Groq

client = Groq(api_key=os.getenv('GROQ_API_KEY'))

def autocomplete(text):  
    if text != "":
        response = client.chat.completions.create(
            model='gemma-7b-it',
            messages=[
                {
                    "role": "system", 
                    "content": "Du bist Jens, ein deutscher KI-Assistent und antwortest auf die Fragen der User möglichst kurz, knapp aber immer freundlich. Du antwortest dem User immer auf deutsch und in du-form an. Deine Antworten sollen immer umgangsprachlich sein."
                },
                {
                    "role": "user", 
                    "content": text
                }],
            stream=True
            )
            
        partial_message = ""
        for chunk in response:
            if chunk.choices[0].delta.content is not None:
                partial_message = partial_message + chunk.choices[0].delta.content
                yield partial_message
              
# Create the Gradio interface with live updates
iface = gr.Interface(
    fn=autocomplete,
    inputs=gr.Textbox(lines=2,
                      placeholder="Moin! 👋",
                      label="Deine Eingabe"),
    outputs=gr.Markdown(),
    title="Turbo KI-Chat 🚀",
    description="Powered by Groq & Mistral",
    live=True,  # Set live to True for real-time feedback
    allow_flagging="never"  # Disable flagging
)

# Launch the app
iface.launch(share=True)