Яндекс.XML – инструмент, разрешающий передавать поисковые запросы в «Яндекс», собирать результаты в формате XML и публиковать выдачу на сайте.
Перед использованием разработчики предлагают просмотреть ряд ссылок с дополнительной информацией:
- Официальная документация по Яндекс.XML с рекомендациями.
- Правила использования Яндекс.XML.
- Статьи из блога «Яндекса», посвященные автоматизации и часовым ограничениям.
Яндекс.XML доступен бесплатно и применяется вебмастерами для организации поиска по сайтам или во время подготовки тематических приложений, способных определять позиции в поисковой выдаче или анализа действий конкурентов. Вне зависимости от выбранного «режима» использования, начинать знакомство с сервисом предстоит с официального сайта. Там доступна или регистрация, или авторизация через аккаунт Яндекс.
После ввода конфиденциальной информации на экране сразу появятся «Настройки». Где важно заранее рассмотреть поля, которые пригодятся в дальнейшем. Речь о параметре user (определяет никнейм, который вводился при регистрации), и key (генерируется автоматически, тоже понадобится при подготовке парсера).
А вот текстовое поле «Основной IP-адрес» заполняется уже вручную – придется заглянуть в настройки домена и скопировать IP сайта. Из дополнительных и важных настроек – тип поиска. Вариантов в Яндекс.XML три: русский, турецкий и международный. Какой выбрать – зависит от поставленных задач и желаемого результата. Но в сегменте российского интернета за пределы вариант «русский» вебмастера выбираются редко. К тому же «отечественный» тип поиска редко вынуждает разбираться с всплывающими капчами.
Ограничения Яндекс.XML
Лимиты Яндекс.XML – специальные ограничения, выставляемые на количество запросов, отправляемых к базе поисковика. У каждого вебмастера показатель обращений свой – высчитывается значение по сложной формуле, где главный коэффициент – качество сайта, добавленного в систему.
Подробнее разобраться в сути поможет практический пример:
- Просмотреть «Лимиты» поможет тематический раздел, представленный в сервисе Яндекс.XML в левой части интерфейса в контекстном меню.
- Дальше сверху появятся пункты «Общий лимит», а чуть ниже – «Использовано сегодня». Отображаемая статистика обновляется несколько раз в сутки (а порой и в режиме реального времени).
- Дневная норма в Яндекс.XML – не единственное ограничение. Еще сложнее дела обстоят с запросами в зависимости от времени суток (географическое местоположение на подобные мелочи влияет сильнее всего). Поздно ночью разрешено больше запросов, чем днем или начиная с 9 утра. А потому важно заранее определить, когда приступать к делу, а в какой момент – брать перерыв.
Искусство применять. Как настроить парсер поисковой выдачи Яндекс.XML
Сфера SEO во многом сосредоточена вокруг сбора и анализа информации из закрытых и официально доступных источников. Сайты конкурентов, результаты поисковой выдачи, форумы со статистикой – докопаться до истины с каждом годом легче, но и времени приходится тратить в разы больше. С Яндекс.XML анализ начнет занимать меньше времени, но придется сначала разобраться в настройке. Понадобятся минимальные знания языка программирования PHP, специальная библиотека PHP Simple HTML DOM Parser, и место на хостинге для хранения подготовленных скриптов.
Шаг №1: Первичные настройки
Авторизация на сайте Яндекс.XML и переход в рабочий режим.
Далее – переход к «Настройкам» и заполнение текстового поля «Основной IP-адрес», который указывает IP сайта, отправляющего запросы. Обязательно выбор «Русского» типа поиска и галочка напротив пункта с правилами и соглашениями.
Шаг №2: Формирование запросов
Базовых параметров достаточно для перехода к следующему этапу настройки Яндекс.XML – формированию запросов в разделе «Тест».
В качестве примера ссылка, https://yandex.ru/search/xml?user=Login&key=Api-key&query=Test&lr=93, содержащая ряд важных запросов. Например, Login – никнейм пользователя, API-ключ, текст передаваемого в «Яндекс» поискового запроса», а также идентификатор страны или региона (в примере – 193, город «Воронеж»). Составленный запрос применяется и в браузере – ссылку достаточно скопировать, а затем – просмотреть появившийся результат.
Шаг №3: Создание страницы
После теста пора переходить на сайт и на страницах хостинга сгенерировать новую страницу – Yandex.php с кодом следующего содержания.
Шаг №4: Подключение парсера
Далее в папку со страницей добавляется файл парсера с названием, вроде simple_html_dom.php, а вместе с тем генерируется еще один Yandex-result.php.
Шаг №5: Финал
В результате на хостинге должен появится каталог со следующим набором файлов – yandex.php, yandex-result.php, simple_html_dom.php. Если все на месте – необходимо обратиться к файлу, хранящемуся на хостинге (ссылка следующего вида: название_сайта/название_каталога/yandex.php).
Если нажать на кнопку «Отправить», то в браузере появится результаты по введенному запросу.
Полученную выдачу сложно разобрать даже под микроскопом, а потому результаты необходимо отфильтровать, используя ряд ограничений. Например, можно скрыть ссылки (тег URL), спрятать заголовок (Title), ограничиться лишь hlword и даже отказаться от passage (текста сниппета).
Скорректировать фильтрацию поможет уже добавленный ранее текстовый файл yandex-result.php, куда необходимо добавить скорректированный код.
Если попытаться повторить ввод ссылки следующего вида: «название_сайта/название_каталога/yandex.php» в браузер, то в результате выдача изменится – исчезнут ссылки, описание и заголовки, останутся лишь необходимые запросы.
Поставленная цель достигнута. Если с некоторыми действиями возникли проблемы, то добраться до истины быстрее поможет архив со скриптами. Запакованные файлы необходимо переместить в отдельную папку на хостинге, а уже после – приступить к экспериментам, связанным с анализированием поисковой выдачи.