teixeiramg commited on
Commit
ed6732f
·
verified ·
1 Parent(s): bbcd85b

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +16 -3
app.py CHANGED
@@ -45,9 +45,21 @@ def answer_question(question, max_length=200, temperature=0.7, top_k=50, top_p=0
45
  try:
46
  if not pdf_content:
47
  return "Por favor, carregue um PDF primeiro.", ""
48
- prompt = f"Conteúdo do PDF: {pdf_content}\nPergunta: {question}\nResposta em português:"
49
- print(f"Prompt: {prompt}") # Adicionar log para depuração
 
 
 
 
 
 
 
 
 
50
  inputs = tokenizer(prompt, return_tensors="pt")
 
 
 
51
  outputs = model.generate(
52
  inputs.input_ids,
53
  max_length=max_length,
@@ -56,12 +68,13 @@ def answer_question(question, max_length=200, temperature=0.7, top_k=50, top_p=0
56
  top_p=top_p,
57
  num_return_sequences=1
58
  )
 
59
  response = tokenizer.decode(outputs[0], skip_special_tokens=True)
60
  return response, prompt
61
  except Exception as e:
62
  print(f"Erro ao gerar resposta: {e}")
63
  print(traceback.format_exc())
64
- return "Erro ao gerar resposta.", prompt
65
 
66
  # Interface do Gradio para carregar PDF e fazer perguntas
67
  pdf_loader = gr.Interface(
 
45
  try:
46
  if not pdf_content:
47
  return "Por favor, carregue um PDF primeiro.", ""
48
+
49
+ # Limitar o tamanho do conteúdo do PDF para evitar exceder o número máximo de tokens
50
+ max_tokens = 1024 # O número máximo de tokens permitido para o GPT-2 é geralmente 1024
51
+ truncated_content = pdf_content[:max_tokens]
52
+
53
+ prompt = f"Conteúdo do PDF: {truncated_content}\nPergunta: {question}\nResposta em português:"
54
+
55
+ # Verificando o tamanho do prompt
56
+ print(f"Prompt gerado (tamanho {len(prompt)}):\n{prompt[:500]}...") # Imprime os primeiros 500 caracteres para depuração
57
+
58
+ # Tokenizando o prompt
59
  inputs = tokenizer(prompt, return_tensors="pt")
60
+ print(f"Tokens de entrada: {inputs.input_ids.shape[1]} tokens") # Verifica o número de tokens
61
+
62
+ # Gerar a resposta
63
  outputs = model.generate(
64
  inputs.input_ids,
65
  max_length=max_length,
 
68
  top_p=top_p,
69
  num_return_sequences=1
70
  )
71
+
72
  response = tokenizer.decode(outputs[0], skip_special_tokens=True)
73
  return response, prompt
74
  except Exception as e:
75
  print(f"Erro ao gerar resposta: {e}")
76
  print(traceback.format_exc())
77
+ return "Erro ao gerar resposta.", ""
78
 
79
  # Interface do Gradio para carregar PDF e fazer perguntas
80
  pdf_loader = gr.Interface(