Spaces:

molokhovdmitry
/

landmark_recognition

Sleeping

App Files Files Community

Sergei commited on Dec 16, 2023

Commit

8f186c9

1 Parent(s): a2644fb

Переобученная модель + файл саспознания переделан, для запуска из другого файла

Browse files

Former-commit-id: dfb192eb464f22cd65b9f947a889aecd1d8d1243
Former-commit-id: 4e9ba30f7f67980b897d1269e0395aec18418448

Files changed (13) hide show

Test_photo/.DS_Store +0 -0
Test_photo/1.jpg +0 -0
Test_photo/2.jpg +0 -0
Test_photo/3.jpg +0 -0
Test_photo/4.jpg +0 -0
Test_photo/5.jpg +0 -0
Test_photo/6.jpg +0 -0
cat.csv +1 -0
check_photo.py +25 -0
check_photo_model_init.py +17 -0
check_photo_model_retrain.py +154 -0
pickle_model.pkl.REMOVED.git-id +1 -1
test_check_photo.py +21 -0

Test_photo/.DS_Store ADDED Viewed

Binary file (6.15 kB). View file

Test_photo/1.jpg ADDED Viewed

Test_photo/2.jpg ADDED Viewed

Test_photo/3.jpg ADDED Viewed

Test_photo/4.jpg ADDED Viewed

Test_photo/5.jpg ADDED Viewed

Test_photo/6.jpg ADDED Viewed

cat.csv ADDED Viewed

	@@ -0,0 +1 @@

+ Мемориальная квартира Пушкина на Арбате,Новый Арбат,Памятник Александру Пушкину и Наталье Гончаровой,Памятники Булату Окуджаве в Москве,"Художественный (кинотеатр, Москва)",Центральный Дом актёра имени А. А. Яблочкиной

check_photo.py ADDED Viewed

	@@ -0,0 +1,25 @@

+import torch
+import torchvision.transforms as transforms
+from PIL import Image
+import torchvision
+# Запуск модели для распознания фото
+def check_photo1(model, categorias, photo):
+    # Тот же формат фото, что и при обучении
+    normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
+                                     std=[0.229, 0.224, 0.225])
+    preprocess = transforms.Compose([
+    transforms.Resize([70, 70]),
+    transforms.RandomHorizontalFlip(),
+    transforms.RandomAutocontrast(),
+    transforms.RandomEqualize(),
+    transforms.ToTensor(),
+    normalize
+])
+    batch = preprocess(photo).unsqueeze(0)
+    prediction = model(batch).squeeze(0).softmax(0)
+    class_id = prediction.argmax().item()
+    score = prediction[class_id].item()
+    return categorias[class_id], score

check_photo_model_init.py ADDED Viewed

	@@ -0,0 +1,17 @@

+import pickle
+import csv
+# Файл инициализации модели
+def init_model():
+    # Загрузить модели из файла
+    pkl_filename = "pickle_model.pkl"
+    with open(pkl_filename, 'rb') as file:
+        model = pickle.load(file)
+    # Считывание категорий
+    file = open("cat.csv", "r")
+    cat1 = list(csv.reader(file, delimiter=","))
+    categorias = cat1[0]
+    file.close()
+    model.eval()
+    return model, categorias

check_photo_model_retrain.py ADDED Viewed

	@@ -0,0 +1,154 @@

+import os
+import torch
+import random
+import numpy as np
+import torchvision
+import matplotlib.pyplot as plt
+import torchvision.transforms as transforms
+import shutil
+import time
+import xml.etree.ElementTree as et
+import pickle
+import csv
+from tqdm import tqdm
+from PIL import Image
+from torchvision import models
+from torch.utils.data import DataLoader
+from torchvision.datasets import ImageFolder
+# Размер одного пакета
+BATCH_SIZE = 32
+use_gpu = torch.cuda.is_available()
+device = 'cuda' if use_gpu else 'cpu'
+print('Connected device:', device)
+# Датасет для тренировки
+train_dataset = ImageFolder(
+    root='Data/Train'
+)
+# Датасет для проверки
+valid_dataset = ImageFolder(
+    root='Data/Valid'
+)
+# augmentations (ухудшение качество чтобы не было переобучения)
+normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
+                                 std=[0.229, 0.224, 0.225])
+train_dataset.transform = transforms.Compose([
+    transforms.Resize([70, 70]),
+    transforms.RandomHorizontalFlip(),
+    transforms.RandomAutocontrast(),
+    transforms.RandomEqualize(),
+    transforms.ToTensor(),
+    normalize
+])
+valid_dataset.transform = transforms.Compose([
+    transforms.Resize([70, 70]),
+    transforms.ToTensor(),
+    normalize
+])
+# Определение выборки для обучения
+train_loader = DataLoader(
+    train_dataset, batch_size=BATCH_SIZE,
+    shuffle=True
+)
+# Определение выборки для проверки
+valid_loader = DataLoader(
+    valid_dataset, batch_size=BATCH_SIZE,
+    shuffle=False
+)
+# Указание на используемую модель
+def google(): # pretrained=True для tensorflow
+    model = models.googlenet(weights=models.GoogLeNet_Weights.IMAGENET1K_V1)
+    # Добавление линейного (выходного) слоя на основании которого идет дообучение
+    model.fc = torch.nn.Linear(1024, len(train_dataset.classes))
+    for param in model.parameters():
+        param.requires_grad = True
+    # Заморозка весов т.к. при переобучении модели они должны быть постоянны, а меняться будет только последний слой
+    model.inception3a.requires_grad = False
+    model.inception3b.requires_grad = False
+    model.inception4a.requires_grad = False
+    model.inception4b.requires_grad = False
+    model.inception4c.requires_grad = False
+    model.inception4d.requires_grad = False
+    model.inception4e.requires_grad = False
+    return model
+# Функция обучения модели. Epoch - количество итераций обучения (прогонов по нейросети)
+def train(model, optimizer, train_loader, val_loader, epoch=10):
+    loss_train, acc_train = [], []
+    loss_valid, acc_valid = [], []
+    # tqdm - прогресс бар
+    for epoch in tqdm(range(epoch)):
+        # Ошибки
+        losses, equals = [], []
+        torch.set_grad_enabled(True)
+        # Train. Обучение. В цикле проходится по картинкам и оптимизируются потери
+        model.train()
+        for i, (image, target) in enumerate(train_loader):
+            image = image.to(device)
+            target = target.to(device)
+            output = model(image)
+            loss = criterion(output,target)
+            losses.append(loss.item())
+            equals.extend(
+                [x.item() for x in torch.argmax(output, 1) == target])
+            optimizer.zero_grad()
+            loss.backward()
+            optimizer.step()
+        # Метрики отображающие резултитаты обучения модели
+        loss_train.append(np.mean(losses))
+        acc_train.append(np.mean(equals))
+        losses, equals = [], []
+        torch.set_grad_enabled(False)
+        # Validate. Оценка качества обучения
+        model.eval()
+        for i , (image, target) in enumerate(valid_loader):
+            image = image.to(device)
+            target = target.to(device)
+            output = model(image)
+            loss = criterion(output,target)
+            losses.append(loss.item())
+            equals.extend(
+                [y.item() for y in torch.argmax(output, 1) == target])
+        loss_valid.append(np.mean(losses))
+        acc_valid.append(np.mean(equals))
+    return loss_train, acc_train, loss_valid, acc_valid
+criterion = torch.nn.CrossEntropyLoss()
+criterion = criterion.to(device)
+model = google()
+print('Model: GoogLeNet\n')
+# оптимайзер - отвечает за поиск и подбор оптимальных весов
+optimizer = torch.optim.Adam(model.parameters(), lr=1e-4)
+model = model.to(device)
+loss_train, acc_train, loss_valid, acc_valid = train(
+model, optimizer, train_loader, valid_loader, 30)
+print('acc_train:', acc_train, '\nacc_valid:', acc_valid)
+# Сохранение модели в текущую рабочую директорию
+pkl_filename = "pickle_model.pkl"
+with open(pkl_filename, 'wb') as file:
+    pickle.dump(model, file)
+# Категории. Получаются из имен папок
+print(train_dataset.classes)
+# Экспорт категорий в CSV
+with open('cat.csv', 'w', newline='') as file:
+    writer = csv.writer(file)
+    writer.writerow(train_dataset.classes)

pickle_model.pkl.REMOVED.git-id CHANGED Viewed

	@@ -1 +1 @@
1	- ~~7f6f655ec6c2e6c5e3909cb0b10f718b1e648be5~~


1	+ ad5ecffeba11c98262cbe84ad38397d2accd8892

test_check_photo.py ADDED Viewed

	@@ -0,0 +1,21 @@

+from check_photo import *
+from check_photo_model_init import *
+model, cat = init_model()
+Puskin_pamiatnik = Image.open("Data/Test_photo/1.jpg")
+Nov_arbat1 = Image.open("Data/Test_photo/2.jpg")
+Pushkin_dom1 = Image.open("Data/Test_photo/3.jpg")
+CDA1 = Image.open("Data/Test_photo/4.jpg")
+Okudjava1 = Image.open("Data/Test_photo/5.jpg")
+Kinoteatr = Image.open("Data/Test_photo/6.jpg")
+test_photos_dict = {'Puskin_pamiatnik':Puskin_pamiatnik,
+                    'Nov_arbat1':Nov_arbat1,
+                    'Pushkin_dom1': Pushkin_dom1,
+                    'CDA1': CDA1,
+                    'Okudjava1': Okudjava1,
+                    'Kinoteatr': Kinoteatr,
+                    }
+for name in test_photos_dict:
+    res_cat, res_score = check_photo1(model, cat, test_photos_dict[name])
+    print(f"{res_cat}: {100 * res_score:.1f}%", "right answer", name)