import gradio as gr import onnxruntime as rt from transformers import AutoTokenizer import torch, json tokenizer = AutoTokenizer.from_pretrained("neuralmind/bert-large-portuguese-cased") with open("genre_types_encoded.json", "r") as fp: encode_genre_types = json.load(fp) genres = list(encode_genre_types.keys()) inf_session = rt.InferenceSession('movie-classifier-quantized.onnx') input_name = inf_session.get_inputs()[0].name output_name = inf_session.get_outputs()[0].name def classify_movie_genre(sinopse): input_ids = tokenizer(sinopse)['input_ids'][:512] logits = inf_session.run([output_name], {input_name: [input_ids]})[0] logits = torch.FloatTensor(logits) probs = torch.sigmoid(logits)[0] return dict(zip(genres, map(float, probs))) app_examples = [ ["A história do cientista americano J. Robert Oppenheimer e seu papel no desenvolvimento da bomba atômica."], ["Uma equipe de exploradores viaja através de um buraco de minhoca no espaço, na tentativa de garantir a sobrevivência da humanidade."], ["Os invesitgadores de atividades paranormais, Ed e Lorraine Warren, trabalham para ajudar a uma familia aterrorizada por uma escura presença na sua casa."], ["Depois de chegar a Normandía, um grupo de soldados precisa encontrar o único irmão vivo de três que morreram na guerra."], ["Gandalf e Aragorn lideram o Mundo dos Homens contra o exército de Sauron para desviar o olhar de Frodo e Sam quando eles se aproximam á Montanha da Perdição com o Um Anel."] ] app_title = "Movie Genre Classifier" inputs = [ gr.Textbox(label="Text", value=app_examples[0][0]), ] label = gr.outputs.Label(num_top_classes=4) iface = gr.Interface(fn=classify_movie_genre, inputs=inputs, outputs=label, examples=app_examples, theme='gradio/monochrome') iface.launch()