Spaces:

Sreekan
/

FirstPoC

Sleeping

Sreekan commited on Feb 5

Commit

fae6640

verified ·

1 Parent(s): eec8b9f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -339,6 +339,11 @@ from langchain_huggingface import HuggingFacePipeline
 from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
 import gradio as gr
 # Define HuggingFace LLM
 def create_llm():
     model_name = "Qwen/Qwen2.5-7B-Instruct-1M"
@@ -348,7 +353,7 @@ def create_llm():
         task="text-generation",
         model=model,
         tokenizer=tokenizer,
-        device_map="auto",
         max_new_tokens=500,
     )
     return HuggingFacePipeline(pipeline=llm_pipeline)

 from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
 import gradio as gr
+import torch
+print(torch.cuda.is_available())  # Check if a GPU is available
+a = torch.Tensor([1]).cuda()  # Should succeed without errors
+print(a)
 # Define HuggingFace LLM
 def create_llm():
     model_name = "Qwen/Qwen2.5-7B-Instruct-1M"
         task="text-generation",
         model=model,
         tokenizer=tokenizer,
+        device=0,
         max_new_tokens=500,
     )
     return HuggingFacePipeline(pipeline=llm_pipeline)