fixe
Browse files
app.py
CHANGED
@@ -53,7 +53,7 @@ logger =logging.getLogger(__name__)
|
|
53 |
# Définir le modèle de requête
|
54 |
class PredictionRequest(BaseModel):
|
55 |
text: str = None # Texte personnalisé ajouté par l'utilisateur
|
56 |
-
max_length: int = 2000 # Limite la longueur maximale du texte généré
|
57 |
|
58 |
@app.post("/predict/")
|
59 |
async def predict(request: PredictionRequest):
|
@@ -65,7 +65,7 @@ async def predict(request: PredictionRequest):
|
|
65 |
|
66 |
# Générer le texte à partir du prompt
|
67 |
inputs = tokenizer(prompt, return_tensors="pt").input_ids.to(model.device)
|
68 |
-
outputs = model.generate(inputs, max_length=
|
69 |
generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
|
70 |
|
71 |
return {"generated_text": generated_text}
|
|
|
53 |
# Définir le modèle de requête
|
54 |
class PredictionRequest(BaseModel):
|
55 |
text: str = None # Texte personnalisé ajouté par l'utilisateur
|
56 |
+
# max_length: int = 2000 # Limite la longueur maximale du texte généré
|
57 |
|
58 |
@app.post("/predict/")
|
59 |
async def predict(request: PredictionRequest):
|
|
|
65 |
|
66 |
# Générer le texte à partir du prompt
|
67 |
inputs = tokenizer(prompt, return_tensors="pt").input_ids.to(model.device)
|
68 |
+
outputs = model.generate(inputs, max_length=3000, do_sample=True)
|
69 |
generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
|
70 |
|
71 |
return {"generated_text": generated_text}
|