YandexImagesParser icon indicating copy to clipboard operation
YandexImagesParser copied to clipboard

Python-модуль для парсинга фото с Яндекс.Картинок

Yandex Images Parser

Python-модуль для парсинга фото с Яндекс.Картинок

GitHub repo size GitHub Repo stars GitHub watchers GitHub last commit Codacy grade GitHub top language Yandex.Images Uptime

Навигация

  • Начало работы
    • Установка зависимостей
    • Инициализация скрипта
  • Поиск фото по ключевому слову
    • Возвращаемые параметры функцией YandexImage.search
  • Фильтры для поиска
    • Выборочный размер фото
      • Возвращаемые параметры функцией YandexImage.size

Начало работы

Для работы Вам нужно установить или скачать модуль. Установить модуль можно двумя способами:

  • Установка в качестве подмодуля:
$ git submodule add https://github.com/Ulbwaa/YandexImagesParser
  • Клонирование репозитория в Ваш проект:
$ git clone https://github.com/Ulbwaa/YandexImagesParser

Для удобной работы рекомендуется использовать первый способ.

Установка зависимостей

$ pip install -r requirements.txt

Инициализация скрипта

from ImageParser import YandexImage

parser = YandexImage()

print(parser.about, parser.version)
>>> Yandex Images Parser 1.0-release

Поиск фото по ключевому слову

from ImageParser import YandexImage

parser = YandexImage()

for item in parser.search("Hello world!"):
    print(item.title)
    print(item.url)
    print(item.preview.url)
    print("(", item.size, ")", sep='')
>>> Hello world! - SYNDICATE
>>> https://access.viasyndicate.com/wp-content/uploads/helloworld.jpg
>>> https://im0-tub-ru.yandex.net/i?id=f4c8a1308fd44579344172c874f228a4&n=13
>>> (1900*800)
Полученное изображение

Возвращаемые параметры функцией YandexImage.search

YandexImage.search возвращает список элементов, имеющих следующие параметры:

  • Заголовок материнского сайта - self.title (Сокращается до определенного количества символов)
  • Описание материнского сайта - self.description (Сокращается до определенного количества символов)
  • Домен материнского сайта - self.domain
  • URL полноразмерного изображения - self.url
  • Ширина полноразмерного изображения - self.width (В пикселях)
  • Высота полноразмерного изображения - self.height (В пикселях)
  • Размер полноэкранного изображения - self.size (Вид: 1280*720)
  • URL сжатого изображения - self.preview.url
  • Ширина сжатого изображения - self.preview.width (В пикселях)
  • Высота сжатого изображения - self.preview.height (В пикселях)
  • Размер сжатого изображения - self.preview.size (Вид: 1280*720)

Для получения информации в формате dict используйте self.__dict__

Фильтры для поиска

Для фильтрации поиска вы можете использовать следующие функции:

Выборочный размер фото

from ImageParser import YandexImage

parser = YandexImage()

for item in parser.search("Hello world!", sizes=parser.size.large):
    print(item.title)
    print(item.url)
    print(item.preview.url)
    print("(", item.size, ")", sep='')

Возвращаемые параметры функцией YandexImage.size

  • Большие фото - self.large
  • Средние фото - self.medium
  • Маленькие фото - self.small

Для получения информации в формате dict используйте self.__dict__

В будущем будут добавлены и другие фильтры.