Spaces:

Shankarm08
/

llmademo

Runtime error

Shankarm08 commited on May 15, 2024

Commit

fba67f5

verified ·

1 Parent(s): f1cfe0e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,23 +1,10 @@
-from transformers import AutoTokenizer, AutoModelForCausalLM
-from fastapi import FastAPI, Body
-import huggingface_hub
-huggingface_hub.login(username="shankarm08", password="cskrockz123")
-app = FastAPI()
-# Load pre-trained model and tokenizer
 tokenizer = AutoTokenizer.from_pretrained("meta-llama/Meta-Llama-3-8B")
-model = AutoModelForCausalLM.from_pretrained("meta-llama/Meta-Llama-3-8B")
-@app.post("/generate")
-async def generate_text(input_text: str = Body(..., embed=True)):
-    input_ids = tokenizer.encode(input_text, return_tensors='pt')
-    output = model.generate(input_ids, max_length=50, num_beams=4)
-    generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
-    return {"generated_text": generated_text}
-if __name__ == "__main__":
-    import uvicorn
-    uvicorn.run(app, host="0.0.0.0", port=8000)

+import hf_api
+# Authenticate with Hugging Face
+hf_api.set_access_token(None)  # Use the default access token
+# Load model directly
+from transformers import AutoTokenizer, AutoModelForCausalLM
 tokenizer = AutoTokenizer.from_pretrained("meta-llama/Meta-Llama-3-8B")
+model = AutoModelForCausalLM.from_pretrained("meta-llama/Meta-Llama-3-8B")