Spaces:

Kr08
/

ASR

Build error

Kr08 commited on Nov 14, 2024

Commit

9bc426c

verified ·

1 Parent(s): e8ce33d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -19,7 +19,7 @@ logging.basicConfig(
 logger = logging.getLogger(__name__)
 def load_qa_model():
-    """Load question-answering model with support for long input contexts."""
     try:
         from transformers import AutoTokenizer, AutoModelForCausalLM
@@ -27,26 +27,26 @@ def load_qa_model():
         # Load tokenizer
         tokenizer = AutoTokenizer.from_pretrained(model_id, use_auth_token=os.getenv("HF_TOKEN"))
-        tokenizer.model_max_length = 8192  # Ensure the tokenizer can handle 8192 tokens
-        # Load the model
         model = AutoModelForCausalLM.from_pretrained(
             model_id,
             torch_dtype=torch.bfloat16,
             device_map="auto",
             rope_scaling={
-                "type": "dynamic",  # Ensure compatibility with long contexts
-                "factor": 8.0
             },
             use_auth_token=os.getenv("HF_TOKEN")
         )
-        # Load the pipeline
         qa_pipeline = pipeline(
             "text-generation",
             model=model,
             tokenizer=tokenizer,
-            max_new_tokens=4096,  # Adjust as needed for your use case
         )
         return qa_pipeline
@@ -55,6 +55,7 @@ def load_qa_model():
         logger.error(f"Failed to load Q&A model: {str(e)}")
         return None
 # def load_qa_model():
 #     """Load question-answering model"""
 #     try:

 logger = logging.getLogger(__name__)
 def load_qa_model():
+    """Load question-answering model with long context support."""
     try:
         from transformers import AutoTokenizer, AutoModelForCausalLM
         # Load tokenizer
         tokenizer = AutoTokenizer.from_pretrained(model_id, use_auth_token=os.getenv("HF_TOKEN"))
+        tokenizer.model_max_length = 8192  # Configure tokenizer for long inputs
+        # Load the model with simplified rope_scaling configuration
         model = AutoModelForCausalLM.from_pretrained(
             model_id,
             torch_dtype=torch.bfloat16,
             device_map="auto",
             rope_scaling={
+                "type": "dynamic",  # Simplified type as expected by the model
+                "factor": 8.0       # Scaling factor to support longer contexts
             },
             use_auth_token=os.getenv("HF_TOKEN")
         )
+        # Initialize the pipeline
         qa_pipeline = pipeline(
             "text-generation",
             model=model,
             tokenizer=tokenizer,
+            max_new_tokens=256,  # Limit generation as needed
         )
         return qa_pipeline
         logger.error(f"Failed to load Q&A model: {str(e)}")
         return None
 # def load_qa_model():
 #     """Load question-answering model"""
 #     try: