- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
У меня проблема - не могу понять логику строки запроса в Я.
Как я понял у него есть 2 варианта : text=... и qs=...
в первом случае понятно utf8, а во втором варианте что-то похожее, но не то...
Никогда не встречал у Яндекса в строке запроса параметр qs
Что касается text, то это не UTF-8, а URL-Encoded
Тогда как поясните этот запрос :
http://www.yandex.ru/yandpage?q=1249003200&p=2&ag=d&qs=text%3D%25D2%25D9%25CE%25CF%25CB%2B%25D0%25C9%25D7%25C1%26stype%3D%26nl%3D0
то, что и сказал
А ты в чем парсить хочешь? Не на "коленке"?
Посмотрев в логи на рефереры с Яндекса делаю вывод, что страницы вида
http://www.yandex.ru/yandsearch?rpt=rad&text=bla-bla-bla
суть есть первая страница результатов. А страницы вида
http://www.yandex.ru/yandpage?q=956925184&p=1&ag=d&qs=textBLA-BLA-BLA
суть есть последующие страницы (&p порядковый номер после первой страницы).
Те который яндпейдж - они просто дважды перекодированы.
Как декодировать - тут в форуме даже куски кода приводились (мною в т.ч. - но сейчас лениво поиском искать :) )
🚬
парсить хочу в php, но в данном случае функция UrlDecode не помагает.
А вот если я хочу распарсить, к примеру,
http://www.yandex.ru/yandsearch?rpt=rad&text=%EE%E1%EE%F0%F3%E4%EE%E2%E0%ED%E8%E5+%E4%EB%FF+%F0%E0%E7%EB%E8%E2%E0+%EF%E8%E2%E0,
то переменная text после UrlDecode будет равна "оборудование для разлива пива". То есть все ок.
парсить хочу в php, но в данном случае функция UrlDecode не помагает.
О пользе медитации в программировании.
Посмотри, что эти строки отличаются не только yandsearch и yandpage, но и видом закодированного текста. Например, посчитай сколько буковок бывает между процентами в обоих случаях. И подумай над тем, что это ж-ж-ж неспроста.
Попробуй "нераскодировавшуюся" строчку пропустить через продедуру декодирования еще раз.
Блин, вот поискала поиском - там примеры
Думаю, если еще поискать, еще про это можно найти.
Учите матчасть.
qs на второй и далее стр. поиска, раскодировывать надо примерно так же как и в первом случае, но дополнительно перевести то ли koi->win, то ли win->koi.
За приведенные ссылки спасибо, но я в перле не силен...
Что касается простого двойного декодирования, то близко, но что-то не то. Последний совет, кажется очень близок, вот только я не знаю как перекодировать из кои в win...
Как я нашел в других форумах это есть 7 битная кодировка, отсюда вопрос как декодировать ее?