Spaces:

VikramSingh178
/

picpilot-server

Paused

App Files Files Community

VikramSingh178 commited on May 7

Commit

3e01790

•

1 Parent(s): 5e29265

Update SDXL-LoRA inference pipeline and model weights

Browse files

Former-commit-id: 550c615e6a453f0586ab834a0366c230320361d5

Files changed (7) hide show

product_diffusion_api/routers/__pycache__/sdxl_text_to_image.cpython-310.pyc +0 -0
product_diffusion_api/routers/sdxl_text_to_image.py +42 -7
scripts/__init__.py +0 -0
scripts/__pycache__/config.cpython-310.pyc +0 -0
scripts/config.py +1 -0
scripts/load_pipeline.py +25 -0
scripts/wandb/debug.log +1 -1

product_diffusion_api/routers/__pycache__/sdxl_text_to_image.cpython-310.pyc CHANGED Viewed

Binary files a/product_diffusion_api/routers/__pycache__/sdxl_text_to_image.cpython-310.pyc and b/product_diffusion_api/routers/__pycache__/sdxl_text_to_image.cpython-310.pyc differ

product_diffusion_api/routers/sdxl_text_to_image.py CHANGED Viewed

@@ -1,3 +1,7 @@
 from fastapi import APIRouter, HTTPException
 from pydantic import BaseModel
 import base64
@@ -6,9 +10,17 @@ from typing import List
 import uuid
 from diffusers import DiffusionPipeline
 import torch
 router = APIRouter()
 # Utility function to convert PIL image to base64 encoded JSON
 def pil_to_b64_json(image):
     # Generate a UUID for the image
@@ -19,6 +31,27 @@ def pil_to_b64_json(image):
     return {"image_id": image_id, "b64_image": b64_image}
 # SDXLLoraInference class for running inference
 class SDXLLoraInference:
     """
@@ -51,12 +84,7 @@ class SDXLLoraInference:
         num_inference_steps: int,
         guidance_scale: float,
     ) -> None:
-        self.pipe = DiffusionPipeline.from_pretrained(
-            "stabilityai/stable-diffusion-xl-base-1.0", torch_dtype=torch.float16
-        )
-        self.model_path = "VikramSingh178/sdxl-lora-finetune-product-caption"
-        self.pipe.load_lora_weights(self.model_path)
-        self.pipe.to('cuda')
         self.prompt = prompt
         self.negative_prompt = negative_prompt
         self.num_images = num_images
@@ -79,6 +107,7 @@ class SDXLLoraInference:
         ).images[0]
         return pil_to_b64_json(image)
 # Input format for single request
 class InputFormat(BaseModel):
     prompt: str
@@ -87,10 +116,12 @@ class InputFormat(BaseModel):
     negative_prompt: str
     num_images: int
 # Input format for batch requests
 class BatchInputFormat(BaseModel):
     batch_input: List[InputFormat]
 # Endpoint for single request
 @router.post("/sdxl_v0_lora_inference")
 async def sdxl_v0_lora_inference(data: InputFormat):
@@ -104,6 +135,7 @@ async def sdxl_v0_lora_inference(data: InputFormat):
     output_json = inference.run_inference()
     return output_json
 # Endpoint for batch requests
 @router.post("/sdxl_v0_lora_inference/batch")
 async def sdxl_v0_lora_inference_batch(data: BatchInputFormat):
@@ -122,7 +154,10 @@ async def sdxl_v0_lora_inference_batch(data: BatchInputFormat):
     MAX_QUEUE_SIZE = 64
     if len(data.batch_input) > MAX_QUEUE_SIZE:
-        raise HTTPException(status_code=400, detail=f"Number of requests exceeds maximum queue size ({MAX_QUEUE_SIZE})")
     processed_requests = []
     for item in data.batch_input:

+import sys
+sys.path.append("../scripts")  # Path of the scripts directory
+import config
 from fastapi import APIRouter, HTTPException
 from pydantic import BaseModel
 import base64
 import uuid
 from diffusers import DiffusionPipeline
 import torch
+import torch_tensorrt
+from functools import lru_cache
+torch._inductor.config.conv_1x1_as_mm = True
+torch._inductor.config.coordinate_descent_tuning = True
+torch._inductor.config.epilogue_fusion = False
+torch._inductor.config.coordinate_descent_check_all_directions = True
 router = APIRouter()
 # Utility function to convert PIL image to base64 encoded JSON
 def pil_to_b64_json(image):
     # Generate a UUID for the image
     return {"image_id": image_id, "b64_image": b64_image}
+@lru_cache(maxsize=1)
+def load_pipeline(model_name, adapter_name):
+    pipe = DiffusionPipeline.from_pretrained(model_name, torch_dtype=torch.bfloat16).to(
+        "cuda"
+    )
+    pipe.load_lora_weights(adapter_name)
+    pipe.unet.to(memory_format=torch.channels_last)
+    pipe.vae.to(memory_format=torch.channels_last)
+    # pipe.unet = torch.compile(
+    # pipe.unet,
+    # mode = 'max-autotime'
+    # )
+    pipe.fuse_qkv_projections()
+    return pipe
+loaded_pipeline = load_pipeline(config.MODEL_NAME, config.ADAPTER_NAME)
 # SDXLLoraInference class for running inference
 class SDXLLoraInference:
     """
         num_inference_steps: int,
         guidance_scale: float,
     ) -> None:
+        self.pipe = loaded_pipeline
         self.prompt = prompt
         self.negative_prompt = negative_prompt
         self.num_images = num_images
         ).images[0]
         return pil_to_b64_json(image)
 # Input format for single request
 class InputFormat(BaseModel):
     prompt: str
     negative_prompt: str
     num_images: int
 # Input format for batch requests
 class BatchInputFormat(BaseModel):
     batch_input: List[InputFormat]
 # Endpoint for single request
 @router.post("/sdxl_v0_lora_inference")
 async def sdxl_v0_lora_inference(data: InputFormat):
     output_json = inference.run_inference()
     return output_json
 # Endpoint for batch requests
 @router.post("/sdxl_v0_lora_inference/batch")
 async def sdxl_v0_lora_inference_batch(data: BatchInputFormat):
     MAX_QUEUE_SIZE = 64
     if len(data.batch_input) > MAX_QUEUE_SIZE:
+        raise HTTPException(
+            status_code=400,
+            detail=f"Number of requests exceeds maximum queue size ({MAX_QUEUE_SIZE})",
+        )
     processed_requests = []
     for item in data.batch_input:

scripts/__init__.py ADDED Viewed

File without changes

scripts/__pycache__/config.cpython-310.pyc CHANGED Viewed

Binary files a/scripts/__pycache__/config.cpython-310.pyc and b/scripts/__pycache__/config.cpython-310.pyc differ

scripts/config.py CHANGED Viewed

@@ -1,4 +1,5 @@
 MODEL_NAME="stabilityai/stable-diffusion-xl-base-1.0"
 VAE_NAME= "madebyollin/sdxl-vae-fp16-fix"
 DATASET_NAME= "hahminlew/kream-product-blip-captions"
 PROJECT_NAME = "Product Photography"

 MODEL_NAME="stabilityai/stable-diffusion-xl-base-1.0"
+ADAPTER_NAME = "VikramSingh178/sdxl-lora-finetune-product-caption"
 VAE_NAME= "madebyollin/sdxl-vae-fp16-fix"
 DATASET_NAME= "hahminlew/kream-product-blip-captions"
 PROJECT_NAME = "Product Photography"

scripts/load_pipeline.py ADDED Viewed

	@@ -0,0 +1,25 @@

+from config import MODEL_NAME,ADAPTER_NAME
+import torch
+from diffusers import DiffusionPipeline
+from wandb.integration.diffusers import autolog
+from config import PROJECT_NAME
+autolog(init=dict(project=PROJECT_NAME))
+def load_pipeline(model_name, adapter_name):
+        pipe = DiffusionPipeline.from_pretrained(model_name, torch_dtype=torch.float16).to(
+            "cuda"
+        )
+        pipe.load_lora_weights(adapter_name)
+        pipe.unet.to(memory_format=torch.channels_last)
+        pipe.vae.to(memory_format=torch.channels_last)
+        pipe.unet = torch.compile(pipe.unet, mode="max-autotune", fullgraph=True)
+        pipe.vae.decode = torch.compile(
+            pipe.vae.decode, mode="max-autotune", fullgraph=True
+        )
+        pipe.fuse_qkv_projections()
+        return pipe
+loaded_pipeline = load_pipeline(MODEL_NAME, ADAPTER_NAME)
+images = loaded_pipeline('toaster', num_inference_steps=30).images[0]

scripts/wandb/debug.log CHANGED Viewed

	@@ -1 +1 @@
1	- run-~~20240430_104236~~-~~lcgqwfyr~~/logs/debug.log


1	+ run-20240507_154024-2j1bt71e/logs/debug.log