Перейти к основному содержимому

⚙️ Настройки и конфигурация

Подробное описание всех функций и параметров YouTube-Parser для эффективного извлечения данных с YouTube.


🔍 Парсинг поисковой выдачи

Основная функция для сбора данных по поисковым запросам. Позволяет находить видео, каналы и плейлисты по ключевым словам.

Парсинг поисковой выдачи

YouTube API метод

🎯 Входные данные

  • Тип: Выпадающий список
  • Значение: Поисковой запрос
  • Описание: Ключевые слова указываются в файле 1_Search_Keywords.txt построчно

📊 Тип собираемых данных

  • Варианты: Видео | Плейлист | Канал
  • По умолчанию: Видео
  • Назначение: Определяет какой тип контента будет найден по запросу

📋 Порядок выдачи

  • Варианты:
    • По релевантности (рекомендуется)
    • По дате загрузки
    • По числу просмотров
    • По рейтингу
    • По названию
    • По количеству загруженных видео
  • Применение: Влияет на приоритет результатов в поисковой выдаче

📅 Фильтры по дате

  • Опубликованные после: Формат DD.MM.YYYY
  • Опубликованные до: Формат DD.MM.YYYY
  • Примечание: Для работы фильтра необходимо заполнить оба поля

🎬 Дополнительные фильтры

  • Тематика: Музыка, Игры, Спорт, Технологии и др.
  • Категория видео: Развлечения, Образование, Новости и др.
  • Разрешение: HD 1080 | Стандартное
  • Продолжительность: Длинное | Среднее | Короткое
  • Субтитры: Только с субтитрами | Без субтитров

InnerTube API метод

🏷️ Парсинг по хештегам

  • Тип: Переключатель
  • Назначение: Поиск по хештегам вида #keyword
  • Особенность: Фильтры в этом режиме не применяются

⏰ Фильтр по дате загрузки

  • Варианты: За последний час | Сегодня | За неделю | За месяц | В этом году

📺 Парсинг метаданных видео

Сбор подробной информации о видео: просмотры, лайки, комментарии, описание и другие характеристики.

Парсинг видео

🎯 Входные данные

  • Варианты: Видео | Канал
  • Видео: Ссылки в файле 3_Video_Urls.txt
  • Канал: Ссылки в файле 2_Channels_Urls.txt

🔧 Параметры фильтрации

📊 Последние видео с канала

  • Тип: Число
  • По умолчанию: 10
  • Назначение: Ограничивает количество последних видео для анализа

👁️ Количество просмотров [от]

  • Тип: Число
  • По умолчанию: 10000
  • Применение: Отбирает видео с минимальным количеством просмотров

📅 Дата публикации [от]

  • Формат: DD.MM.YYYY
  • Пример: 01.01.2025
  • Назначение: Анализ только свежего контента

⏱️ Длина видео [от]-[до]

  • Формат: секунды
  • Примеры:
    • 120-500 (от 2 до 8 минут)
    • 120- (от 2 минут)
    • -500 (до 8 минут)

🎪 Парсинг метаданных каналов

Извлечение информации о каналах: подписчики, описание, контакты, статистика.

Парсинг каналов

📧 Извлечение контактов

✉️ Собирать адреса почт из описания

  • Тип: Переключатель
  • Назначение: Автоматический поиск email в описании канала
  • Применение: Полезно для поиска контактов для сотрудничества

🎯 Сохранять только каналы с почтами

  • Тип: Переключатель
  • Эффект: Фильтрует результаты, оставляя только каналы с найденными контактами

🚫 Исключать ранее собранные почты

  • Тип: Переключатель
  • Функция: Использует черный список для избежания дубликатов

🔍 Фильтрация каналов

👥 Количество подписчиков [от]

  • По умолчанию: 1000
  • Назначение: Отбор каналов с определенной аудиторией
  • Примечание: Скрытые данные исключаются

📊 Количество просмотров [от]

  • По умолчанию: 10000
  • Применение: Оценка популярности канала

📅 Год создания [до]

  • По умолчанию: 2012
  • Цель: Поиск опытных или новых каналов

🌍 Страны [через запятую]

  • Формат: ISO 3166-1 alpha-2
  • Пример: US, GB, CA, DE, FR, AU
  • Назначение: Географическая фильтрация

📋 Парсинг плейлистов

Анализ плейлистов и видео в них для изучения тематического контента.

🎯 Источники данных

  • Плейлист: Файл 4_Playlists_Urls.txt
  • Канал: Файл 2_Channels_Urls.txt (все плейлисты канала)

📊 Получаемые данные

  • Название и описание плейлиста
  • Количество видео
  • Дата создания
  • Список всех видео в плейлисте

💬 Парсинг комментариев

Извлечение комментариев для анализа аудитории и обратной связи.

🎯 Источники

  • К видео: Файлы 3_Video_Urls.txt или 2_Channels_Urls.txt
  • К постам: Файлы 5_Posts_Urls.txt или 2_Channels_Urls.txt

🔍 Параметры поиска

🔎 Поиск комментария [содержит]

  • Тип: Текст
  • Поддержка: Regex выражения
  • Применение: Поиск упоминаний брендов, ключевых слов

👍 Количество лайков [от]

  • По умолчанию: 5
  • Назначение: Отбор популярных комментариев

📅 Дата публикации [от]

  • Формат: DD.MM.YYYY HH:MM
  • Применение: Анализ свежих обсуждений

🚫 Исключить ответы

  • Тип: Переключатель
  • Эффект: Собирать только основные комментарии

💾 Скачивание контента

Загрузка видео, аудио, субтитров и обложек для офлайн использования.

Скачивание

🎬 Скачивание видео

🎯 Источники данных

  • Видео: Файл 3_Video_Urls.txt
  • Плейлист: Файл 4_Playlists_Urls.txt
  • Канал: Файл 2_Channels_Urls.txt

📹 Тип видео

  • Варианты: Любые | Видео | Трансляции | Shorts
  • Применение: Для каналов - выбор типа контента для скачивания

🎞️ Тип потока

  • Видео: Видеоряд + звук
  • Аудио: Только звуковая дорожка

🔧 Качество видео

  • 360p/720p Muxed: Быстрое скачивание без склейки
  • 1080p/1440p/2160p: Высокое качество с последующей склейкой
  • Max: Максимальное доступное качество

🖼️ Дополнительные опции

  • Скачивать обложки: Сохранение превью видео
  • Количество видео: Ограничение для массового скачивания

📝 Скачивание субтитров

🌐 Язык субтитров

  • Формат: ISO 639-1 (двухбуквенный код)
  • Пример: en для английского, ru для русского

📄 Тип субтитров

  • Загруженные автором: Качественные, созданные вручную
  • Автосгенерированные: Машинный перевод YouTube
  • Любые: Приоритет авторским субтитрам

✏️ Форматирование

  • Тип: Переключатель
  • Эффект: Преобразование в обычный текст без временных меток

🌐 Дополнительные настройки

Дополнительные настройки

🔑 API управление

🔄 Перемешивать API ключи

  • Назначение: Равномерное распределение нагрузки
  • Эффект: Повышение скорости парсинга

🌐 Прокси настройки

🔒 Использовать прокси

  • Применение: Необходимо для InnerTube API
  • Функция: Обход ограничений YouTube

🔄 Ротация прокси

  • Режим: Циклическое использование
  • Предупреждение: Возможно зависание при исчерпании лимитов

🛡️ Защита от блокировок

⏱️ Задержка между запросами

  • Время: 1 секунда
  • Назначение: Предотвращение капчи при работе без прокси

🌍 Региональные настройки

🌎 Страна

  • Формат: ISO 3166-1 alpha-2
  • По умолчанию: US
  • Влияние: Эмуляция региональной выдачи

🗣️ Язык

  • Формат: ISO 639-1
  • По умолчанию: en
  • Эффект: Локализация результатов

💡 Рекомендации по использованию

🚀 Для начинающих

  1. Начните с YouTube API - более стабильный и быстрый
  2. Используйте простые поисковые запросы без сложной фильтрации
  3. Тестируйте на небольших объемах данных

⚡ Для опытных пользователей

  1. Комбинируйте методы API для получения максимального объема данных
  2. Настраивайте фильтрацию для точного таргетинга
  3. Используйте прокси для масштабного парсинга через InnerTube

⚠️ Важные ограничения

  • YouTube API: Максимум 600 результатов на запрос
  • Фильтрация: Применяется после получения данных
  • Региональность: Результаты зависят от выбранной страны и языка