Spaces:

nicolas-dufour
/

Plonk

Running

App Files Files Community

Plonk / data /extract_embeddings /so_siglip.py

nicolas-dufour

squash: merge all unpushed commits

c4c7cee 7 days ago

raw

history blame contribute delete

1.63 kB

	import os, sys

	import torch.amp

	# Ajouter le répertoire racine au chemin
	root_dir = os.path.abspath(os.path.join(os.path.dirname(__file__), "../.."))
	sys.path.append(root_dir)

	from PIL import Image
	from pathlib import Path
	import torch
	from transformers import AutoProcessor, AutoModelForZeroShotImageClassification
	import numpy as np
	from tqdm import tqdm
	from data.extract_embeddings.dataset_with_path import ImageWithPathDataset


	device = "cuda" if torch.cuda.is_available() else "cpu"
	model = AutoModelForZeroShotImageClassification.from_pretrained(
	"google/siglip-so400m-patch14-384"
	).vision_model.to(device)
	processor = AutoProcessor.from_pretrained("google/siglip-so400m-patch14-384")

	input_path = Path("datasets/osv5m/images")
	output_path = Path("datasets/osv5m/embeddings/so_siglip")

	output_path.mkdir(exist_ok=True, parents=True)

	dataset = ImageWithPathDataset(input_path, output_path)
	model = torch.compile(model, fullgraph=True)

	batch_size = 64
	dataloader = torch.utils.data.DataLoader(
	dataset, batch_size=batch_size, num_workers=16, collate_fn=lambda x: zip(*x)
	)
	with torch.amp.autocast("cuda", enabled=True, dtype=torch.bfloat16), torch.no_grad():
	for images, output_emb_paths in tqdm(dataloader):
	inputs = processor(images=images, return_tensors="pt")
	inputs = {k: v.to(device) for k, v in inputs.items()}
	outputs = model(**inputs)
	embeddings = outputs.last_hidden_state[:, 0]
	numpy_embeddings = embeddings.cpu().numpy()
	for emb, output_emb_path in zip(numpy_embeddings, output_emb_paths):
	np.save(f"{output_emb_path}.npy", emb)