Парсер поисковой выдачи seznam.cz

Hitachi

Creators Template
Регистрация
25.09.2019
Сообщения
384
Благодарностей
347
Баллы
63
Описание

Шаблон открывает сайт search.seznam.cz, вводит поисковой запрос.
Далее для каждой страницы решает капчу, если она возникает, проверяет загрузку нужной страницы, парсит все результаты в список.
После этого берёт результаты по одному, из каждого парсит заголовок, ссылку, домен из ссылки, проверяет на рекламу. Добавляет строку в таблицу.
Когда спаршено нужное количество страниц, сохраняет таблицу в файл.

Как пользоваться?

Во входных настройках ввести поисковые запросы, выбрать капча-модуль и указать количество страниц, которое нужно спарсить.
Для работы через прокси, добавить их в файл proxy.txt.

Результаты сохраняются в папку Results в .csv файл с названием "Запрос_дата_время" в формате "Домен;Заголовок;Ссылка;Реклама".
В последний столбец записывается слово "Reklama", если ссылка рекламная
 
Категория
Парсинг, SEO
Тип шаблона
Открытый
Многопоточность
Нет
Дата обновления
20.08.2020
Описание обновления
Добавлено решение капчи при загрузке первой страницы.
Обновлена проверка рекламных ссылок

Вложения

Для запуска проектов требуется программа ZennoPoster.
Это основное приложение, предназначенное для выполнения автоматизированных шаблонов действий (ботов).
Подробнее...

Для того чтобы запустить шаблон, откройте программу ZennoPoster. Нажмите кнопку «Добавить», и выберите файл проекта, который хотите запустить.
Подробнее о том, где и как выполняется проект.

Последнее редактирование:

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)