Серверный парсер (google,yahoo,live)

YJ
На сайте с 23.09.2004
Offline
110
2496

Здравствуйте Уважаемые Вебмастера!

Представляю вашему вниманию новый продукт GParser - парсер поисковых систем (google, yahoo, live) с некоторыми функциональными особенностями.

Парсер:

* Парсинг Google

* Парсинг msn (search.live.com)

* Парсинг yahoo

* Многопоточность (с прокси, количество потоков задаётся)

* Возможность парсить без прокси (в один поток)

* Парсинг со словарём. (пара штук в комплекте)

* Парсинг по языкам.

* Поиск и проверка прокси на заданных ресурсах

* Возможность экспортировать список прокси-ресурсов с заданными параметрами

* Возможность вручную задавать паузы между запросами и время бана

* Парсинг с filter=0 и без него

* Сбор сниппетов и текста с найденных ресурсов

* Возможность добавить свою базу url'ов для дальнейшего прогона по фильтрам.

* Отображение времени сначала работы.

* Хранилище баз.

Фильтры:

* Удалить ссылки по REGEXP

* Оставтьить ссылки по REGEXP

* Замена в тексте ссылки по REGEXP

* Удаление дублей - по домену, по адресу (без имени файла и запроса), не удалять

* Удаление по BLACKLIST

* Сбор Google PR и последующая сортировка по нему

* Поиск форм на страницах

- поиск только на данной странице,

- на данной + (если не найдена форма) обследование заданного количества страниц данного сайта (ссылки собираются на данной странице по заданным признакам:

GOOD LINK PART - "хорошая" часть ссылки,

BAD LINK PART - "плохая" часть ссылки,

GOOD ANCHOR PART - "хорошая" анкора часть ссылки,

BAD ANCHOR PART - "плохая" часть анкора ссылки,)

Для поиска формы, тоже существуют фильтры:

GOOD FORM FIELD PART - "хорошая" часть имени поля формы,

BAD FORM FIELD PART - "плохая" часть имени поля формы,

- не осуществлять поиск форм

* Отсеивание страниц на которых превышен заданный % ссылок с NOFOLLOW

* Отсеивание страниц с найденным на них "плохим текстом" (массив BAD TEXT)

* Отсеивание страниц с найденным в ссылке "плохим текстом" (массив BAD PATH)

* Отсеивание страниц которые дали плохой ответ (не 200)

Требования:

* PHP4 +

* Zend Optimizer

* MySql

* curl

* pcntl

* сокеты

Отзывы:

http://klikforum.com/viewtopic.php?t=7736

Теперь о цене:

Стоимость одной копии скрипта 30$

Принимается epassporte, WMZ, new fethard, old fethard цена (50$)

Что планируется:

* Поддержка SOCKS 4,5 (под PHP4)

* "Умный парсер" - автоподбор словарей.

icq: 243-524-239

email: balkanbetbox(у)gmail.com

Пишите вопросы, предложения.

Самым заинтерисованным даю потестить.

Спасибо за внимание! С весной всех !

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий