tclopess's picture
Update app.py
35e025a verified
raw
history blame
1.84 kB
import gradio as gr
import onnxruntime as rt
from transformers import AutoTokenizer
import torch, json
tokenizer = AutoTokenizer.from_pretrained("neuralmind/bert-large-portuguese-cased")
with open("genre_types_encoded.json", "r") as fp:
encode_genre_types = json.load(fp)
genres = list(encode_genre_types.keys())
inf_session = rt.InferenceSession('movie-classifier-quantized.onnx')
input_name = inf_session.get_inputs()[0].name
output_name = inf_session.get_outputs()[0].name
def classify_movie_genre(sinopse):
input_ids = tokenizer(sinopse)['input_ids'][:512]
logits = inf_session.run([output_name], {input_name: [input_ids]})[0]
logits = torch.FloatTensor(logits)
probs = torch.sigmoid(logits)[0]
return dict(zip(genres, map(float, probs)))
app_examples = [
["A história do cientista americano J. Robert Oppenheimer e seu papel no desenvolvimento da bomba atômica."],
["Uma equipe de exploradores viaja através de um buraco de minhoca no espaço, na tentativa de garantir a sobrevivência da humanidade."],
["Os invesitgadores de atividades paranormais, Ed e Lorraine Warren, trabalham para ajudar a uma familia aterrorizada por uma escura presença na sua casa."],
["Depois de chegar a Normandía, um grupo de soldados precisa encontrar o único irmão vivo de três que morreram na guerra."],
["Gandalf e Aragorn lideram o Mundo dos Homens contra o exército de Sauron para desviar o olhar de Frodo e Sam quando eles se aproximam á Montanha da Perdição com o Um Anel."]
]
app_title = "Movie Genre Classifier"
inputs = [
gr.Textbox(label="Text", value=app_examples[0][0]),
]
label = gr.outputs.Label(num_top_classes=4)
iface = gr.Interface(fn=classify_movie_genre, inputs=inputs, outputs=label, examples=app_examples, theme='gradio/monochrome')
iface.launch()