qninhdt
/

ddpm_inversion

Model card Files Files and versions Community

ddpm_inversion / ddm_inversion /ddim_inversion.py

qninhdt's picture

Upload 32 files

6158711 verified 6 months ago

history blame contribute delete

2.14 kB


	from ddm_inversion.inversion_utils import encode_text
	from typing import Union
	import torch
	import numpy as np
	from tqdm import tqdm

	def next_step(model, model_output: Union[torch.FloatTensor, np.ndarray], timestep: int, sample: Union[torch.FloatTensor, np.ndarray]):
	timestep, next_timestep = min(timestep - model.scheduler.config.num_train_timesteps // model.scheduler.num_inference_steps, 999), timestep
	alpha_prod_t = model.scheduler.alphas_cumprod[timestep] if timestep >= 0 else model.scheduler.final_alpha_cumprod
	alpha_prod_t_next = model.scheduler.alphas_cumprod[next_timestep]
	beta_prod_t = 1 - alpha_prod_t
	next_original_sample = (sample - beta_prod_t ** 0.5 * model_output) / alpha_prod_t ** 0.5
	next_sample_direction = (1 - alpha_prod_t_next) ** 0.5 * model_output
	next_sample = alpha_prod_t_next ** 0.5 * next_original_sample + next_sample_direction
	return next_sample

	def get_noise_pred(model, latent, t, context, cfg_scale):
	latents_input = torch.cat([latent] * 2)
	noise_pred = model.unet(latents_input, t, encoder_hidden_states=context)["sample"]
	noise_pred_uncond, noise_prediction_text = noise_pred.chunk(2)
	noise_pred = noise_pred_uncond + cfg_scale * (noise_prediction_text - noise_pred_uncond)
	# latents = next_step(model, noise_pred, t, latent)
	return noise_pred

	@torch.no_grad()
	def ddim_loop(model, w0, prompt, cfg_scale):
	# uncond_embeddings, cond_embeddings = self.context.chunk(2)
	# all_latent = [latent]
	text_embedding = encode_text(model, prompt)
	uncond_embedding = encode_text(model, "")
	context = torch.cat([uncond_embedding, text_embedding])
	latent = w0.clone().detach()
	for i in tqdm(range(model.scheduler.num_inference_steps)):
	t = model.scheduler.timesteps[len(model.scheduler.timesteps) - i - 1]
	noise_pred = get_noise_pred(model, latent, t, context, cfg_scale)
	latent = next_step(model, noise_pred, t, latent)
	# all_latent.append(latent)
	return latent

	@torch.no_grad()
	def ddim_inversion(model, w0, prompt, cfg_scale):
	wT = ddim_loop(model, w0, prompt, cfg_scale)
	return wT