Spaces:

batmangiaicuuthegioi
/

StyleTransferDemo

Runtime error

App Files Files Community

batmangiaicuuthegioi commited on Dec 15, 2024

Commit

dca2470

verified ·

1 Parent(s): f631423

Upload 7 files

Browse files

Files changed (7) hide show

.gitattributes +35 -35
README.md +13 -13
app.py +46 -154
config.py +24 -0
model.py +359 -0
requirements.txt +9 -6
utils.py +29 -0

.gitattributes CHANGED Viewed

@@ -1,35 +1,35 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,14 +1,14 @@
----
-title: StyleTransferDemo
-emoji: 🖼
-colorFrom: purple
-colorTo: red
-sdk: gradio
-sdk_version: 5.0.1
-app_file: app.py
-pinned: false
-license: mit
-short_description: our deep learning project
----
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

+---
+title: StyleTransferDemo
+emoji: 🖼
+colorFrom: purple
+colorTo: red
+sdk: gradio
+sdk_version: 5.0.1
+app_file: app.py
+pinned: false
+license: mit
+short_description: our deep learning project
+---
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py CHANGED Viewed

@@ -1,154 +1,46 @@
-import gradio as gr
-import numpy as np
-import random
-# import spaces #[uncomment to use ZeroGPU]
-from diffusers import DiffusionPipeline
-import torch
-device = "cuda" if torch.cuda.is_available() else "cpu"
-model_repo_id = "stabilityai/sdxl-turbo"  # Replace to the model you would like to use
-if torch.cuda.is_available():
-    torch_dtype = torch.float16
-else:
-    torch_dtype = torch.float32
-pipe = DiffusionPipeline.from_pretrained(model_repo_id, torch_dtype=torch_dtype)
-pipe = pipe.to(device)
-MAX_SEED = np.iinfo(np.int32).max
-MAX_IMAGE_SIZE = 1024
-# @spaces.GPU #[uncomment to use ZeroGPU]
-def infer(
-    prompt,
-    negative_prompt,
-    seed,
-    randomize_seed,
-    width,
-    height,
-    guidance_scale,
-    num_inference_steps,
-    progress=gr.Progress(track_tqdm=True),
-):
-    if randomize_seed:
-        seed = random.randint(0, MAX_SEED)
-    generator = torch.Generator().manual_seed(seed)
-    image = pipe(
-        prompt=prompt,
-        negative_prompt=negative_prompt,
-        guidance_scale=guidance_scale,
-        num_inference_steps=num_inference_steps,
-        width=width,
-        height=height,
-        generator=generator,
-    ).images[0]
-    return image, seed
-examples = [
-    "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k",
-    "An astronaut riding a green horse",
-    "A delicious ceviche cheesecake slice",
-]
-css = """
-#col-container {
-    margin: 0 auto;
-    max-width: 640px;
-}
-"""
-with gr.Blocks(css=css) as demo:
-    with gr.Column(elem_id="col-container"):
-        gr.Markdown(" # Text-to-Image Gradio Template")
-        with gr.Row():
-            prompt = gr.Text(
-                label="Prompt",
-                show_label=False,
-                max_lines=1,
-                placeholder="Enter your prompt",
-                container=False,
-            )
-            run_button = gr.Button("Run", scale=0, variant="primary")
-        result = gr.Image(label="Result", show_label=False)
-        with gr.Accordion("Advanced Settings", open=False):
-            negative_prompt = gr.Text(
-                label="Negative prompt",
-                max_lines=1,
-                placeholder="Enter a negative prompt",
-                visible=False,
-            )
-            seed = gr.Slider(
-                label="Seed",
-                minimum=0,
-                maximum=MAX_SEED,
-                step=1,
-                value=0,
-            )
-            randomize_seed = gr.Checkbox(label="Randomize seed", value=True)
-            with gr.Row():
-                width = gr.Slider(
-                    label="Width",
-                    minimum=256,
-                    maximum=MAX_IMAGE_SIZE,
-                    step=32,
-                    value=1024,  # Replace with defaults that work for your model
-                )
-                height = gr.Slider(
-                    label="Height",
-                    minimum=256,
-                    maximum=MAX_IMAGE_SIZE,
-                    step=32,
-                    value=1024,  # Replace with defaults that work for your model
-                )
-            with gr.Row():
-                guidance_scale = gr.Slider(
-                    label="Guidance scale",
-                    minimum=0.0,
-                    maximum=10.0,
-                    step=0.1,
-                    value=0.0,  # Replace with defaults that work for your model
-                )
-                num_inference_steps = gr.Slider(
-                    label="Number of inference steps",
-                    minimum=1,
-                    maximum=50,
-                    step=1,
-                    value=2,  # Replace with defaults that work for your model
-                )
-        gr.Examples(examples=examples, inputs=[prompt])
-    gr.on(
-        triggers=[run_button.click, prompt.submit],
-        fn=infer,
-        inputs=[
-            prompt,
-            negative_prompt,
-            seed,
-            randomize_seed,
-            width,
-            height,
-            guidance_scale,
-            num_inference_steps,
-        ],
-        outputs=[result, seed],
-    )
-if __name__ == "__main__":
-    demo.launch()

+from flask import Flask
+import gradio as gr
+import torch
+from torchvision import transforms
+from PIL import Image
+from config import MODEL_CONFIG
+from model import CycleGAN
+# Load the CycleGAN models
+model_paths = {
+    "CycleGAN_Cezanne_Unet_300": "/checkpoints/checkpoints/cyclegan_cezanne_unet_300_epochs.ckpt",
+    "CycleGAN_Monet_Unet_250": "/checkpoints/checkpoints/cyclegan_monet_unet_250_epochs.ckpt",
+    "CycleGAN_Vangogh_Resnet_70": "/cyclegan_vangogh_resnet_70_epochs.ckpt",
+    "CycleGAN_Vangogh_Unet_70":"/cyclegan_vangogh_unet_70_epochs.ckpt"
+}
+models = {name: CycleGAN.load_from_checkpoint(path, **MODEL_CONFIG) for name, path in model_paths.items()}
+# Define the image transformation
+transform = transforms.Compose([
+    transforms.Resize((256, 256)),
+    transforms.ToTensor(),
+])
+# Define the image translation function
+def translate_image(input_image, style):
+    model = models[style]
+    image = transform(input_image).unsqueeze(0)
+    with torch.no_grad():
+        translated_image = model(image)
+    return transforms.ToPILImage()(translated_image.squeeze(0))
+# Initialize the Gradio interface
+iface = gr.Interface(
+    fn=translate_image,
+    inputs=[
+        gr.Image(type="pil"),
+        gr.Dropdown(choices=list(models.keys()), label="Select Style")
+    ],
+    outputs=gr.Image(type="pil"),
+    title="CycleGAN Image Translation",
+    description="Upload an image and select a style to translate it using CycleGAN."
+)
+if __name__ == "__main__":
+    iface.launch(debug=True)

config.py ADDED Viewed

	@@ -0,0 +1,24 @@

+import torch
+DEBUG = False
+MODEL_CONFIG = {
+    # the type of generator, and the number of residual blocks if ResNet generator is used
+    "gen_name": "unet", # types: 'unet', 'resnet'
+    "num_resblocks": 6,
+    # the number of filters in the first layer for the generators and discriminators
+    "hid_channels": 64,
+    # using DeepSpeed's FusedAdam (currently GPU only) is slightly faster
+    "optimizer": torch.optim.Adam,
+    # the learning rate and beta parameters for the Adam optimizer
+    "lr": 3e-6,
+    "betas": (0.5, 0.999),
+    # the weights used in the identity loss and cycle loss
+    "lambda_idt": 0,
+    "lambda_cycle": (10, 10), # (MPM direction, PMP direction)
+    # the size of the buffer that stores previously generated images
+    "buffer_size": 100,
+    # the number of epochs for training
+    "num_epochs": 30 if not DEBUG else 70,
+    # the number of epochs before starting the learning rate decay
+    "decay_epochs": 10 if not DEBUG else 70,
+}

model.py ADDED Viewed

	@@ -0,0 +1,359 @@

+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+import pytorch_lightning as L
+import numpy as np
+class Downsampling(nn.Module):
+    def __init__(self, in_channels, out_channels, kernel_size=4, stride=2, padding=1, norm=True, lrelu=True):
+        super().__init__()
+        self.block = nn.Sequential(
+            nn.Conv2d(in_channels, out_channels, kernel_size=kernel_size, stride=stride, padding=padding, bias=not norm),
+        )
+        if norm:
+            self.block.append(nn.InstanceNorm2d(out_channels, affine=True))
+        if lrelu is not None:
+            self.block.append(nn.LeakyReLU(0.2, True) if lrelu else nn.ReLU(True))
+    def forward(self, x):
+        return self.block(x)
+class Upsampling(nn.Module):
+    def __init__(self, in_channels, out_channels, kernel_size=4, stride=2, padding=1, output_padding=0, dropout=False):
+        super().__init__()
+        self.block = nn.Sequential(
+            nn.ConvTranspose2d(in_channels, out_channels, kernel_size=kernel_size, stride=stride, padding=padding, output_padding=output_padding, bias=False),
+            nn.InstanceNorm2d(out_channels, affine=True),
+        )
+        if dropout:
+            self.block.append(nn.Dropout(0.5))
+        self.block.append(nn.ReLU(True))
+    def forward(self, x):
+        return self.block(x)
+class ResBlock(nn.Module):
+    def __init__(self, in_channels, kernel_size=3, padding=1):
+        super().__init__()
+        self.block = nn.Sequential(
+            nn.ReflectionPad2d(padding),
+            Downsampling(in_channels, in_channels, kernel_size=kernel_size, stride=1, padding=0, lrelu=False),
+            nn.ReflectionPad2d(padding),
+            Downsampling(in_channels, in_channels, kernel_size=kernel_size, stride=1, padding=0, lrelu=None),
+        )
+    def forward(self, x):
+        return x + self.block(x)
+class UNetGenerator(nn.Module):
+    def __init__(self, hid_channels, in_channels, out_channels):
+        super().__init__()
+        self.downsampling_path = nn.Sequential(
+            Downsampling(in_channels, hid_channels, norm=False),
+            Downsampling(hid_channels, hid_channels*2),
+            Downsampling(hid_channels*2, hid_channels*4),
+            Downsampling(hid_channels*4, hid_channels*8),
+            Downsampling(hid_channels*8, hid_channels*8),
+            Downsampling(hid_channels*8, hid_channels*8),
+            Downsampling(hid_channels*8, hid_channels*8),
+            Downsampling(hid_channels*8, hid_channels*8, norm=False),
+        )
+        self.upsampling_path = nn.Sequential(
+            Upsampling(hid_channels*8, hid_channels*8, dropout=True),
+            Upsampling(hid_channels*16, hid_channels*8, dropout=True),
+            Upsampling(hid_channels*16, hid_channels*8, dropout=True),
+            Upsampling(hid_channels*16, hid_channels*8),
+            Upsampling(hid_channels*16, hid_channels*4),
+            Upsampling(hid_channels*8, hid_channels*2),
+            Upsampling(hid_channels*4, hid_channels),
+        )
+        self.feature_block = nn.Sequential(
+            nn.ConvTranspose2d(hid_channels*2, out_channels, kernel_size=4, stride=2, padding=1),
+            nn.Tanh(),
+        )
+    def forward(self, x):
+        skips = []
+        for down in self.downsampling_path:
+            x = down(x)
+            skips.append(x)
+        skips = reversed(skips[:-1])
+        for up, skip in zip(self.upsampling_path, skips):
+            x = up(x)
+            x = torch.cat([x, skip], dim=1)
+        return self.feature_block(x)
+class ResNetGenerator(nn.Module):
+    def __init__(self, hid_channels, in_channels, out_channels, num_resblocks):
+        super().__init__()
+        self.model = nn.Sequential(
+            nn.ReflectionPad2d(3),
+            Downsampling(in_channels, hid_channels, kernel_size=7, stride=1, padding=0, lrelu=False),
+            Downsampling(hid_channels, hid_channels*2, kernel_size=3, lrelu=False),
+            Downsampling(hid_channels*2, hid_channels*4, kernel_size=3, lrelu=False),
+            *[ResBlock(hid_channels*4) for _ in range(num_resblocks)],
+            Upsampling(hid_channels*4, hid_channels*2, kernel_size=3, output_padding=1),
+            Upsampling(hid_channels*2, hid_channels, kernel_size=3, output_padding=1),
+            nn.ReflectionPad2d(3),
+            nn.Conv2d(hid_channels, out_channels, kernel_size=7, stride=1, padding=0),
+            nn.Tanh(),
+        )
+    def forward(self, x):
+        return self.model(x)
+def get_gen(gen_name, hid_channels, num_resblocks, in_channels=3, out_channels=3):
+    if gen_name == "unet":
+        return UNetGenerator(hid_channels, in_channels, out_channels)
+    elif gen_name == "resnet":
+        return ResNetGenerator(hid_channels, in_channels, out_channels, num_resblocks)
+    else:
+        raise NotImplementedError(f"Generator name '{gen_name}' not recognized.")
+class Discriminator(nn.Module):
+    def __init__(self, hid_channels, in_channels=3):
+        super().__init__()
+        self.block = nn.Sequential(
+            Downsampling(in_channels, hid_channels, norm=False),
+            Downsampling(hid_channels, hid_channels*2),
+            Downsampling(hid_channels*2, hid_channels*4),
+            Downsampling(hid_channels*4, hid_channels*8, stride=1),
+            nn.Conv2d(hid_channels*8, 1, kernel_size=4, padding=1),
+        )
+    def forward(self, x):
+        return self.block(x)
+class ImageBuffer(object):
+    def __init__(self, buffer_size):
+        self.buffer_size = buffer_size
+        if self.buffer_size > 0:
+            self.curr_cap = 0
+            self.buffer = []
+    def __call__(self, imgs):
+        if self.buffer_size == 0:
+            return imgs
+        return_imgs = []
+        for img in imgs:
+            img = img.unsqueeze(dim=0)
+            if self.curr_cap < self.buffer_size:
+                self.curr_cap += 1
+                self.buffer.append(img)
+                return_imgs.append(img)
+            else:
+                p = np.random.uniform(low=0., high=1.)
+                if p > 0.5:
+                    idx = np.random.randint(low=0, high=self.buffer_size)
+                    tmp = self.buffer[idx].clone()
+                    self.buffer[idx] = img
+                    return_imgs.append(tmp)
+                else:
+                    return_imgs.append(img)
+        return torch.cat(return_imgs, dim=0)
+class CycleGAN(L.LightningModule):
+    def __init__(self, gen_name, num_resblocks, hid_channels, optimizer, lr, lambda_idt, lambda_cycle, buffer_size, num_epochs, decay_epochs, betas):
+        super().__init__()
+        self.save_hyperparameters()
+        self.optimizer = optimizer
+        self.automatic_optimization = False
+        self.gen_PM = get_gen(gen_name, hid_channels, num_resblocks)
+        self.gen_MP = get_gen(gen_name, hid_channels, num_resblocks)
+        self.disc_M = Discriminator(hid_channels)
+        self.disc_P = Discriminator(hid_channels)
+        self.buffer_fake_M = ImageBuffer(buffer_size)
+        self.buffer_fake_P = ImageBuffer(buffer_size)
+    def forward(self, img):
+        return self.gen_PM(img)
+    def init_weights(self):
+        def init_fn(m):
+            if isinstance(m, (nn.Conv2d, nn.ConvTranspose2d, nn.InstanceNorm2d)):
+                nn.init.normal_(m.weight, 0.0, 0.02)
+                if m.bias is not None:
+                    nn.init.constant_(m.bias, 0.0)
+        for net in [self.gen_PM, self.gen_MP, self.disc_M, self.disc_P]:
+            net.apply(init_fn)
+    def setup(self, stage):
+        if stage == "fit":
+            print("Model initialized.")
+    def get_lr_scheduler(self, optimizer):
+        def lr_lambda(epoch):
+            len_decay_phase = self.hparams.num_epochs - self.hparams.decay_epochs + 1.0
+            curr_decay_step = max(0, epoch - self.hparams.decay_epochs + 1.0)
+            val = 1.0 - curr_decay_step / len_decay_phase
+            return max(0.0, val)
+        return torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda=lr_lambda)
+    def configure_optimizers(self):
+        opt_config = {
+            "lr": self.hparams.lr,
+            "betas": self.hparams.betas,
+        }
+        opt_gen = self.optimizer(
+            list(self.gen_PM.parameters()) + list(self.gen_MP.parameters()),
+            **opt_config,
+        )
+        opt_disc = self.optimizer(
+            list(self.disc_M.parameters()) + list(self.disc_P.parameters()),
+            **opt_config,
+        )
+        optimizers = [opt_gen, opt_disc]
+        schedulers = [self.get_lr_scheduler(opt) for opt in optimizers]
+        return optimizers, schedulers
+    def adv_criterion(self, y_hat, y):
+        return F.mse_loss(y_hat, y)
+    def recon_criterion(self, y_hat, y):
+        return F.l1_loss(y_hat, y)
+    def get_adv_loss(self, fake, disc):
+        fake_hat = disc(fake)
+        real_labels = torch.ones_like(fake_hat)
+        adv_loss = self.adv_criterion(fake_hat, real_labels)
+        return adv_loss
+    def get_idt_loss(self, real, idt, lambda_cycle):
+        idt_loss = self.recon_criterion(idt, real)
+        return 0
+    def get_cycle_loss(self, real, recon, lambda_cycle):
+        cycle_loss = self.recon_criterion(recon, real)
+        return lambda_cycle * cycle_loss
+    def get_gen_loss(self):
+        adv_loss_PM = self.get_adv_loss(self.fake_M, self.disc_M)
+        adv_loss_MP = self.get_adv_loss(self.fake_P, self.disc_P)
+        total_adv_loss = adv_loss_PM + adv_loss_MP
+        lambda_cycle = self.hparams.lambda_cycle
+        idt_loss_MM = self.get_idt_loss(self.real_M, self.idt_M, lambda_cycle[0])
+        idt_loss_PP = self.get_idt_loss(self.real_P, self.idt_P, lambda_cycle[1])
+        total_idt_loss = idt_loss_MM + idt_loss_PP
+        cycle_loss_MPM = self.get_cycle_loss(self.real_M, self.recon_M, lambda_cycle[0])
+        cycle_loss_PMP = self.get_cycle_loss(self.real_P, self.recon_P, lambda_cycle[1])
+        total_cycle_loss = cycle_loss_MPM + cycle_loss_PMP
+        gen_loss = total_adv_loss + total_idt_loss + total_cycle_loss
+        return gen_loss
+    def get_disc_loss(self, real, fake, disc):
+        real_hat = disc(real)
+        real_labels = torch.ones_like(real_hat)
+        real_loss = self.adv_criterion(real_hat, real_labels)
+        fake_hat = disc(fake.detach())
+        fake_labels = torch.zeros_like(fake_hat)
+        fake_loss = self.adv_criterion(fake_hat, fake_labels)
+        disc_loss = (fake_loss + real_loss) * 0.5
+        return disc_loss
+    def get_disc_loss_M(self):
+        fake_M = self.buffer_fake_M(self.fake_M)
+        return self.get_disc_loss(self.real_M, fake_M, self.disc_M)
+    def get_disc_loss_P(self):
+        fake_P = self.buffer_fake_P(self.fake_P)
+        return self.get_disc_loss(self.real_P, fake_P, self.disc_P)
+    def training_step(self, batch, batch_idx):
+        self.real_M = batch["monet"]
+        self.real_P = batch["photo"]
+        opt_gen, opt_disc = self.optimizers()
+        self.fake_M = self.gen_PM(self.real_P)
+        self.fake_P = self.gen_MP(self.real_M)
+        self.idt_M = self.gen_PM(self.real_M)
+        self.idt_P = self.gen_MP(self.real_P)
+        self.recon_M = self.gen_PM(self.fake_P)
+        self.recon_P = self.gen_MP(self.fake_M)
+        self.toggle_optimizer(opt_gen)
+        gen_loss = self.get_gen_loss()
+        opt_gen.zero_grad()
+        self.manual_backward(gen_loss)
+        opt_gen.step()
+        self.untoggle_optimizer(opt_gen)
+        self.toggle_optimizer(opt_disc)
+        disc_loss_M = self.get_disc_loss_M()
+        disc_loss_P = self.get_disc_loss_P()
+        opt_disc.zero_grad()
+        self.manual_backward(disc_loss_M)
+        self.manual_backward(disc_loss_P)
+        opt_disc.step()
+        self.untoggle_optimizer(opt_disc)
+        metrics = {
+            "gen_loss": gen_loss,
+            "disc_loss_M": disc_loss_M,
+            "disc_loss_P": disc_loss_P,
+        }
+        wandb.log(metrics)
+        self.log_dict(metrics, on_step=False, on_epoch=True, prog_bar=True)
+    def validation_step(self, batch, batch_idx):
+        self.display_results(batch, batch_idx, "validate")
+    def test_step(self, batch, batch_idx):
+        self.display_results(batch, batch_idx, "test")
+    def predict_step(self, batch, batch_idx):
+        return self(batch)
+    def display_results(self, batch, batch_idx, stage):
+        real_P = batch
+        fake_M = self(real_P)
+        if stage == "validate":
+            title = f"Epoch {self.current_epoch+1}: Photo-to-Monet Translation"
+        else:
+            title = f"Sample {batch_idx+1}: Photo-to-Monet Translation"
+        show_img(
+            torch.cat([real_P, fake_M], dim=0),
+            nrow=len(real_P),
+            title=title,
+        )
+    def on_train_epoch_start(self):
+        curr_lr = self.lr_schedulers()[0].get_last_lr()[0]
+        self.log("lr", curr_lr, on_step=False, on_epoch=True, prog_bar=True)
+    def on_train_epoch_end(self):
+        for sch in self.lr_schedulers():
+            sch.step()
+        logged_values = self.trainer.progress_bar_metrics
+        print(
+            f"Epoch {self.current_epoch+1}",
+            *[f"{k}: {v:.5f}" for k, v in logged_values.items()],
+            sep=" - ",
+        )
+    def on_train_end(self):
+        print("Training ended.")
+    def on_predict_epoch_end(self):
+        predictions = self.trainer.predict_loop.predictions
+        num_batches = len(predictions)
+        batch_size = predictions[0].shape[0]
+        last_batch_diff = batch_size - predictions[-1].shape[0]
+        print(f"Number of images generated: {num_batches*batch_size-last_batch_diff}.")

requirements.txt CHANGED Viewed

@@ -1,6 +1,9 @@
-accelerate
-diffusers
-invisible_watermark
-torch
-transformers
-xformers

+flask
+gradio
+torch
+torchvision
+pytorch_lightning
+numpy
+Pillow
+matplotlib
+wandb

utils.py ADDED Viewed

	@@ -0,0 +1,29 @@

+import torch
+from PIL import Image
+import torchvision.transforms as T
+import matplotlib.pyplot as plt
+from model import CycleGAN
+# Load and preprocess the input image
+def load_image(image_path, device, image_size=(256, 256)):
+    transform = T.Compose([
+        T.Resize(image_size),
+        T.ToTensor(),
+        T.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])  # Normalize to [-1, 1]
+    ])
+    image = Image.open(image_path).convert("RGB")
+    image = transform(image).unsqueeze(0).to(device)
+    return image
+# Display the output image
+def display_image(tensor_image):
+    tensor_image = tensor_image.squeeze(0).cpu()  # Remove batch dimension
+    tensor_image = (tensor_image * 0.5 + 0.5).clamp(0, 1)  # Denormalize
+    plt.imshow(tensor_image.permute(1, 2, 0))  # CHW to HWC
+    plt.axis("off")
+    plt.show()
+# Load the input image
+device = "cuda" if torch.cuda.is_available() else "cpu"
+model = CycleGAN.load_from_checkpoint("/content/cyclegan_monet_unet_250_epochs.ckpt", **MODEL_CONFIG)