Spaces:

adamelliotfields
/

diffusion

Running on Zero

App Files Files Community

diffusion / lib /loader.py

adamelliotfields

Rewrite loading and inference

9769856 verified 2 months ago

raw

history blame

11.4 kB

	import torch
	from DeepCache import DeepCacheSDHelper
	from diffusers import ControlNetModel
	from diffusers.models.attention_processor import AttnProcessor2_0, IPAdapterAttnProcessor2_0

	from .config import Config
	from .logger import Logger
	from .upscaler import RealESRGAN
	from .utils import timer


	class Loader:
	"""
	A lazy-loading resource manager for Stable Diffusion pipelines. Lifecycles are managed by
	comparing the current state with desired. Can be used as a singleton when created by the
	`get_loader()` helper.

	Usage:
	loader = get_loader(singleton=True)
	loader.load(
	pipeline_id="controlnet_txt2img",
	ip_adapter_model="full-face",
	model="XpucT/Reliberate",
	scheduler="UniPC",
	controlnet_annotator="canny",
	deepcache_interval=2,
	scale=2,
	use_karras=True
	)
	"""

	def __init__(self):
	self.model = ""
	self.pipeline = None
	self.upscaler = None
	self.controlnet = None
	self.annotator = "" # controlnet annotator (canny)
	self.ip_adapter = "" # ip-adapter kind (full-face or plus)
	self.log = Logger("Loader")

	def should_unload_upscaler(self, scale=1):
	return self.upscaler is not None and self.upscaler.scale != scale

	def should_unload_deepcache(self, cache_interval=1):
	has_deepcache = hasattr(self.pipeline, "deepcache")
	if has_deepcache and cache_interval == 1:
	return True
	if has_deepcache and self.pipeline.deepcache.params["cache_interval"] != cache_interval:
	# Unload if interval is different so it can be reloaded
	return True
	return False

	def should_unload_ip_adapter(self, ip_adapter_model=""):
	if not self.ip_adapter:
	return False
	if not ip_adapter_model:
	return True
	if self.ip_adapter != ip_adapter_model:
	# Unload if model is different so it can be reloaded
	return True
	return False

	def should_unload_controlnet(self, pipeline_id="", annotator=""):
	if self.controlnet is None:
	return False
	if self.annotator != annotator:
	return True
	if not pipeline_id.startswith("controlnet_"):
	return True
	return False

	def should_unload_pipeline(self, model=""):
	if self.pipeline is None:
	return False
	if self.model != model:
	return True
	return False

	# Copied from https://github.com/huggingface/diffusers/blob/v0.28.0/src/diffusers/loaders/ip_adapter.py#L300
	def unload_ip_adapter(self):
	# Remove the image encoder if text-to-image
	if isinstance(self.pipeline, Config.PIPELINES["txt2img"]):
	self.pipeline.image_encoder = None
	self.pipeline.register_to_config(image_encoder=[None, None])

	# Remove hidden projection layer added by IP-Adapter
	self.pipeline.unet.encoder_hid_proj = None
	self.pipeline.unet.config.encoder_hid_dim_type = None

	# Remove the feature extractor
	self.pipeline.feature_extractor = None
	self.pipeline.register_to_config(feature_extractor=[None, None])

	# Replace the custom attention processors with defaults
	attn_procs = {}
	for name, value in self.pipeline.unet.attn_processors.items():
	attn_processor_class = AttnProcessor2_0() # raises if not torch 2
	attn_procs[name] = (
	attn_processor_class
	if isinstance(value, IPAdapterAttnProcessor2_0)
	else value.__class__()
	)
	self.pipeline.unet.set_attn_processor(attn_procs)
	self.ip_adapter = ""

	def unload_all(
	self,
	pipeline_id="",
	ip_adapter_model="",
	model="",
	controlnet_annotator="",
	deepcache_interval=1,
	scale=1,
	):
	if self.should_unload_deepcache(deepcache_interval): # remove deepcache first
	self.log.info("Disabling DeepCache")
	self.pipeline.deepcache.disable()
	delattr(self.pipeline, "deepcache")

	if self.should_unload_ip_adapter(ip_adapter_model):
	self.log.info("Unloading IP-Adapter")
	self.unload_ip_adapter()

	if self.should_unload_controlnet(pipeline_id, controlnet_annotator):
	self.log.info("Unloading ControlNet")
	self.controlnet = None
	self.annotator = ""

	if self.should_unload_upscaler(scale):
	self.log.info("Unloading upscaler")
	self.upscaler = None

	if self.should_unload_pipeline(model):
	self.log.info("Unloading pipeline")
	self.pipeline = None
	self.model = ""

	def should_load_upscaler(self, scale=1):
	return self.upscaler is None and scale > 1

	def should_load_deepcache(self, cache_interval=1):
	has_deepcache = hasattr(self.pipeline, "deepcache")
	if not has_deepcache and cache_interval > 1:
	return True
	return False

	def should_load_controlnet(self, pipeline_id=""):
	return self.controlnet is None and pipeline_id.startswith("controlnet_")

	def should_load_ip_adapter(self, ip_adapter_model=""):
	has_ip_adapter = (
	hasattr(self.pipeline.unet, "encoder_hid_proj")
	and self.pipeline.unet.config.encoder_hid_dim_type == "ip_image_proj"
	)
	return not has_ip_adapter and ip_adapter_model != ""

	def should_load_scheduler(self, cls, use_karras=False):
	has_karras = hasattr(self.pipeline.scheduler.config, "use_karras_sigmas")
	if not isinstance(self.pipeline.scheduler, cls):
	return True
	if has_karras and self.pipeline.scheduler.config.use_karras_sigmas != use_karras:
	return True
	return False

	def should_load_pipeline(self, pipeline_id=""):
	if self.pipeline is None:
	return True
	if not isinstance(self.pipeline, Config.PIPELINES[pipeline_id]):
	return True
	return False

	def load_upscaler(self, scale=1):
	with timer(f"Loading {scale}x upscaler", logger=self.log.info):
	self.upscaler = RealESRGAN(scale, device=self.pipeline.device)
	self.upscaler.load_weights()

	def load_deepcache(self, cache_interval=1):
	self.log.info(f"Enabling DeepCache interval {cache_interval}")
	self.pipeline.deepcache = DeepCacheSDHelper(self.pipeline)
	self.pipeline.deepcache.set_params(cache_interval=cache_interval)
	self.pipeline.deepcache.enable()

	def load_controlnet(self, controlnet_annotator):
	with timer("Loading ControlNet", logger=self.log.info):
	self.controlnet = ControlNetModel.from_pretrained(
	Config.ANNOTATORS[controlnet_annotator],
	variant="fp16",
	torch_dtype=torch.float16,
	)
	self.annotator = controlnet_annotator

	def load_ip_adapter(self, ip_adapter_model=""):
	with timer("Loading IP-Adapter", logger=self.log.info):
	self.pipeline.load_ip_adapter(
	"h94/IP-Adapter",
	subfolder="models",
	weight_name=f"ip-adapter-{ip_adapter_model}_sd15.safetensors",
	)
	self.pipeline.set_ip_adapter_scale(0.5) # 50% works the best
	self.ip_adapter = ip_adapter_model

	def load_scheduler(self, cls, use_karras=False, **kwargs):
	self.log.info(f"Loading {cls.__name__}{' with Karras' if use_karras else ''}")
	self.pipeline.scheduler = cls(**kwargs)

	def load_pipeline(
	self,
	pipeline_id,
	model,
	**kwargs,
	):
	Pipeline = Config.PIPELINES[pipeline_id]

	# Load from scratch
	if self.pipeline is None:
	with timer(f"Loading {model} ({pipeline_id})", logger=self.log.info):
	if self.controlnet is not None:
	kwargs["controlnet"] = self.controlnet
	if model in Config.SINGLE_FILE_MODELS:
	checkpoint = Config.HF_REPOS[model][0]
	self.pipeline = Pipeline.from_single_file(
	f"https://huggingface.co/{model}/{checkpoint}",
	**kwargs,
	).to("cuda")
	else:
	self.pipeline = Pipeline.from_pretrained(model, **kwargs).to("cuda")

	# Change to a different one
	else:
	with timer(f"Changing pipeline to {pipeline_id}", logger=self.log.info):
	kwargs = {}
	if self.controlnet is not None:
	kwargs["controlnet"] = self.controlnet
	self.pipeline = Pipeline.from_pipe(
	self.pipeline,
	**kwargs,
	).to("cuda")

	# Update model and disable terminal progress bars
	self.model = model
	self.pipeline.set_progress_bar_config(disable=True)

	def load(
	self,
	pipeline_id,
	ip_adapter_model,
	model,
	scheduler,
	controlnet_annotator,
	deepcache_interval,
	scale,
	use_karras,
	):
	Scheduler = Config.SCHEDULERS[scheduler]

	scheduler_kwargs = {
	"beta_start": 0.00085,
	"beta_end": 0.012,
	"beta_schedule": "scaled_linear",
	"timestep_spacing": "leading",
	"steps_offset": 1,
	}

	if scheduler not in ["Euler a"]:
	scheduler_kwargs["use_karras_sigmas"] = use_karras

	pipeline_kwargs = {
	"torch_dtype": torch.float16, # defaults to fp32
	"safety_checker": None,
	"requires_safety_checker": False,
	"scheduler": Scheduler(**scheduler_kwargs),
	}

	# Single-file models don't need a variant
	if model not in Config.SINGLE_FILE_MODELS:
	pipeline_kwargs["variant"] = "fp16"
	else:
	pipeline_kwargs["variant"] = None

	# Prepare state for loading checks
	self.unload_all(
	pipeline_id,
	ip_adapter_model,
	model,
	controlnet_annotator,
	deepcache_interval,
	scale,
	)

	# Load controlnet model before pipeline
	if self.should_load_controlnet(pipeline_id):
	self.load_controlnet(controlnet_annotator)

	if self.should_load_pipeline(pipeline_id):
	self.load_pipeline(pipeline_id, model, **pipeline_kwargs)

	if self.should_load_scheduler(Scheduler, use_karras):
	self.load_scheduler(Scheduler, use_karras, **scheduler_kwargs)

	if self.should_load_deepcache(deepcache_interval):
	self.load_deepcache(deepcache_interval)

	if self.should_load_ip_adapter(ip_adapter_model):
	self.load_ip_adapter(ip_adapter_model)

	if self.should_load_upscaler(scale):
	self.load_upscaler(scale)


	# Get a singleton or a new instance of the Loader
	def get_loader(singleton=False):
	if not singleton:
	return Loader()
	else:
	if not hasattr(get_loader, "_instance"):
	get_loader._instance = Loader()
	assert isinstance(get_loader._instance, Loader)
	return get_loader._instance