Перейти к основному содержимому

🔎 Поиск и фиды

Этот раздел описывает задания, которые используют поисковые запросы или публичные фиды YouTube: поисковую выдачу, подсказки, тренды и Shorts.

Функции YouTube-Parser

🔍 Парсинг поисковой выдачи

Задание собирает видео, плейлисты или каналы по ключевым словам из 1_Search_Keywords.txt.

YouTube API

Доступные параметры:

  • Тип собираемых данных — видео, плейлист или канал.
  • Порядок выдачи — по релевантности, дате загрузки, числу просмотров, рейтингу, названию или количеству загруженных видео.
  • Опубликованные после / до — фильтр по дате. Для работы фильтра заполняются оба поля.
  • Тематика — скрытая тематическая классификация YouTube API. Использовать осторожно, потому что она может сильно сократить количество результатов.
  • Категория видео — транспорт, фильмы, музыка, животные, спорт, игры, люди и блоги, развлечения, новости, образование, наука и другие категории.
  • Разрешение видео — HD 1080 или стандартное.
  • Продолжительность видео — длинное, среднее или короткое.
  • Лицензия видео — YouTube License или Creative Commons.
  • Встраивание плеера — только видео, которые можно встраивать на сайты.
  • Просмотр на сайтах — только видео, доступные для просмотра на внешних сайтах.
  • Субтитры — только с субтитрами или без субтитров.
  • Измерение видео — 2D или 3D.
  • Трансляции — активные, завершенные или предстоящие.

InnerTube API

InnerTube API используется для поисковой выдачи видео и поддерживает:

  • Парсинг по хештегам — поиск по URL вида youtube.com/hashtag/keyword. Фильтры в этом режиме не применяются.
  • Порядок выдачи — релевантность, дата загрузки, число просмотров или рейтинг.
  • Дата загрузки — за последний час, сегодня, за эту неделю, за этот месяц или в этом году.

💬 Парсинг поисковых подсказок

Задание работает через InnerTube API и берет ключевые слова из 1_Search_Keywords.txt. На выходе формируется список подсказок YouTube по каждому запросу.

Этот режим полезен для расширения семантики перед основным парсингом поисковой выдачи.

📈 Парсинг трендов

Тренды собираются через InnerTube API. Доступны параметры:

  • Категория — без фильтра, новости, музыка, видеоигры или фильмы.
  • Страны — список стран через запятую в формате ISO 3166-1 alpha-2, например US, GB, AU, CA, DE, FR.

Для трендов используется однопоточный режим.

🎬 Парсинг Shorts

Задание собирает Shorts через InnerTube API. Основной параметр:

  • Количество Shorts — сколько элементов собрать, максимум 500.

🌍 Регион поиска

Во вкладке Дополнительно можно задать:

  • Страна — ISO 3166-1 alpha-2, по умолчанию US.
  • Язык — ISO 639-1, по умолчанию en.

Эти параметры влияют на эмуляцию региона и языка выдачи там, где это поддерживается выбранным заданием.