Spaces:

molokhovdmitry
/

landmark_recognition

Running

landmark_recognition / picturedownloader /main.py

KatriTaratuta

getting pictures

b404872 about 1 year ago

1.79 kB

	from icrawler.builtin import BingImageCrawler
	import os

	imageFolder = 'images'


	def download_images(imageFolder, query, limit):
	imageFolder=os.path.join(imageFolder, query)
	os.makedirs(name=imageFolder,
	exist_ok=True)
	google_crawler = BingImageCrawler(parser_threads=1,
	downloader_threads=1,
	storage={'root_dir': imageFolder})
	# Parameters can be found in the icrawler documentation
	# https://icrawler.readthedocs.io/en/latest/builtin.html
	filters = dict(
	type="photo",
	size='large',
	date="pastyear")
	google_crawler.crawl(keyword=query,
	max_num=limit,
	filters=filters)
	return os.listdir(imageFolder)


	# Задаем список достопримечательностей и количество изображений, которые нужно загрузить
	sights = [
	"Кинотеатр Художественный на Арбате",
	"Театр им. Вахтангова",
	"Центральный Дом Актера на Арбате",
	"Мемориальная квартира А.С. Пушкина на Арбате",
	"Памятник Пушкину и Гончаровой на Арбате",
	"Памятник Окуджаве на Арбате",
	"Хард-рок кафе на Арбате",
	"Дома-книжки на Новом Арбате"
	]
	num_images = 200

	for sight in sights:
	print(f"Загрузка изображений достопримечательности '{sight}':")
	image_paths=download_images(imageFolder, sight, num_images)
	print(f"Загружено {len(image_paths)} изображений\n")