Spaces:

teixeiramg
/

Teste

Sleeping

teixeiramg commited on Nov 6, 2024

Commit

6144f90

verified ·

1 Parent(s): 257f52e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -47,7 +47,7 @@ def answer_question(question, max_length=200, temperature=0.7, top_k=50, top_p=0
             return "Por favor, carregue um PDF primeiro.", ""
         # Limitar o tamanho do conteúdo do PDF para evitar exceder o número máximo de tokens
-        max_tokens = 1024  # O número máximo de tokens permitido para o GPT-2 é geralmente 1024
         truncated_content = pdf_content[:max_tokens]
         prompt = f"Conteúdo do PDF: {truncated_content}\nPergunta: {question}\nResposta em português:"
@@ -64,12 +64,14 @@ def answer_question(question, max_length=200, temperature=0.7, top_k=50, top_p=0
             return "Erro: O prompt gerado ultrapassou o limite de tokens do modelo. Tente um PDF menor.", prompt
         # Gerar a resposta com configurações ajustadas
-        print(f"Gerando resposta com max_new_tokens=200 e temperature={temperature}")
         outputs = model.generate(
             inputs.input_ids,
-            max_new_tokens=200,  # Gerar até 200 novos tokens (apenas a resposta)
             temperature=temperature,  # Temperatura para controlar a criatividade
             num_return_sequences=1,
         )
         # Decodificando a resposta

             return "Por favor, carregue um PDF primeiro.", ""
         # Limitar o tamanho do conteúdo do PDF para evitar exceder o número máximo de tokens
+        max_tokens = 512  # Limitar o número de tokens do conteúdo do PDF para evitar sobrecarga
         truncated_content = pdf_content[:max_tokens]
         prompt = f"Conteúdo do PDF: {truncated_content}\nPergunta: {question}\nResposta em português:"
             return "Erro: O prompt gerado ultrapassou o limite de tokens do modelo. Tente um PDF menor.", prompt
         # Gerar a resposta com configurações ajustadas
+        print(f"Gerando resposta com max_new_tokens=100 e temperature={temperature}")
         outputs = model.generate(
             inputs.input_ids,
+            max_new_tokens=100,  # Gerar até 100 novos tokens (apenas a resposta)
             temperature=temperature,  # Temperatura para controlar a criatividade
             num_return_sequences=1,
+            no_repeat_ngram_size=2,  # Evita repetições excessivas
+            pad_token_id=tokenizer.eos_token_id,  # Adiciona um token de padding adequado
         )
         # Decodificando a resposta