- Що таке Яндекс.Каталог?
- Що таке парсер?
- Навіщо потрібен парсер каталогу Яндекса?
- Завантажити парсер ЯК з інструкціями
У мережі існує досить багато розроблених серверних скриптів і десктопних додатків для вилучення інформації (парсинга) каталогу Яндекса (ЯК). У даній статті не є метою навести приклади онлайн сервісів для парсинга ЯК, їх можна знайти в пошуковій системі по ключу парсер яндекс каталогу . Обстеживши сторінку, нижче ви знайдете посилання для скачування серверної версії граббера, яку можна встановити на Денвері.
Що таке Яндекс.Каталог?
Яндекс Каталог , Або просто ЯК, це збірка найкращих, якісних (на думку редакторів самого каталогу) ресурсів російського інтернету, згрупованих за тематичними категоріями. В каталозі ЯК ресурси відсортовані в порядку убування їх тематичного індексу цитування (тІЦ), який серед SEOшніков вважається одним з показників якісного сайту. Більш докладно про яндекс-каталозі ви можете почитати тут .
Що таке парсер?
Парсер - це синтаксичний аналізатор. У нашому випадку парсер, або граббер, це аналізатор коду. Зазвичай це програма, або частина програми, яка витягує з заданої структури необхідні дані. Парсер яндекс каталогу це програма, яка витягує зі сторінок Яка урли сайтів в заданій тематиці (категорії).
Навіщо потрібен парсер каталогу Яндекса?
Є кілька цілей використання інформації про сайтах, отриманих в результаті парсинга каталогу. Нижче наводиться дві найбільш поширених з них.
- Купівля посилань в сапі з сайтів саме вашої тематики або суміжній для ефективного збільшення тИЦ свого ресурсу.
- Пошук контактної інформації з сайтів (часто за допомогою спеціальних програм) і зв'язок з адміністраторами або веб-майстрами для реклами, співпраці або тематичного обміну посиланнями або користувачами.
Напевно, коментарі зайві. Якщо вам потрібен парсер каталогу ЯК, ви потрапили саме туди, куди слід.
Завантажити парсер ЯК з інструкціями
Для скачування парсеру натисніть посилання нижче:
YacaParser.zip [11.39KB]
ВИМОГИ
- PHP 4+
- бібліотека cURL
- Підтримка функцій роботи з файлами (fopen, fwrite)
ВСТАНОВЛЕННЯ
Перепишіть папку YacaParser на свій сервер в будь-яке місце, доступне з web. Папка files повинна бути доступна для запису. Якщо ви записали на сайт site.ru, тоді запустіть парсер, ввівши в рядок браузера шлях http://site.ru/YacaParser/
ВИКОРИСТАННЯ
При використанні скрипта необхідно задати категорію, яку потрібно Спарс. Підтримується два формати категорії:
1. Категорія / Будь
Наприклад, для парсинга категорії "Нерухомість", необхідно ввести шлях
Business / Realty
2. Повний шлях
наприклад,
http://yaca.yandex.ru/yca/cat/Business/Realty/
При переході по сторінках Яндекс Каталогу використовується затримка в 1 секунду (рядок 48 файлу class.Grabber.php). Цей параметр можна змінювати, задаючи ціле число секунд. Регулярні вирази для роботи зі структурою коду сторінок каталогу можна змінювати у файлі config.php.
УВАГА
При великій кількості запитів до яндекс каталогу ваш IP адреса може бути забанений на добу. Зазвичай, не більше 1000 запитів (сторінок) в годину це нормально.
Всі зауваження з приводу скрипта ви можете залишати в коментарях до даного посту. Скрипт поширюється вільно, але якщо ви захочете віддячити автора, він завжди радий. Реквізити можна знайти на сторінці контактів . Успіхів в просуванні!
Каталог?Що таке парсер?
Навіщо потрібен парсер каталогу Яндекса?
Каталог?
Що таке парсер?
Навіщо потрібен парсер каталогу Яндекса?