Spaces:
Sleeping
Sleeping
from icrawler.builtin import BingImageCrawler | |
import os | |
imageFolder = 'images' | |
def download_images(imageFolder, query, limit): | |
imageFolder=os.path.join(imageFolder, query) | |
os.makedirs(name=imageFolder, | |
exist_ok=True) | |
google_crawler = BingImageCrawler(parser_threads=1, | |
downloader_threads=1, | |
storage={'root_dir': imageFolder}) | |
# Parameters can be found in the icrawler documentation | |
# https://icrawler.readthedocs.io/en/latest/builtin.html | |
filters = dict( | |
type="photo", | |
size='large', | |
date="pastyear") | |
google_crawler.crawl(keyword=query, | |
max_num=limit, | |
filters=filters) | |
return os.listdir(imageFolder) | |
# Задаем список достопримечательностей и количество изображений, которые нужно загрузить | |
sights = [ | |
"Кинотеатр Художественный на Арбате", | |
"Театр им. Вахтангова", | |
"Центральный Дом Актера на Арбате", | |
"Мемориальная квартира А.С. Пушкина на Арбате", | |
"Памятник Пушкину и Гончаровой на Арбате", | |
"Памятник Окуджаве на Арбате", | |
"Хард-рок кафе на Арбате", | |
"Дома-книжки на Новом Арбате" | |
] | |
num_images = 200 | |
for sight in sights: | |
print(f"Загрузка изображений достопримечательности '{sight}':") | |
image_paths=download_images(imageFolder, sight, num_images) | |
print(f"Загружено {len(image_paths)} изображений\n") | |