Как распарсить строку запроса в Я?

S

2

Sharm

16 марта 2004, 10:40

2072

У меня проблема - не могу понять логику строки запроса в Я.

Как я понял у него есть 2 варианта : text=... и qs=...

в первом случае понятно utf8, а во втором варианте что-то похожее, но не то...

Я не крутильщик я только учусь

151

Back Door Man

16 марта 2004, 14:23

#1

Никогда не встречал у Яндекса в строке запроса параметр qs

Что касается text, то это не UTF-8, а URL-Encoded

Дмитрий

S

2

Sharm

16 марта 2004, 14:45

#2

Тогда как поясните этот запрос :

http://www.yandex.ru/yandpage?q=1249003200&p=2&ag=d&qs=text%3D%25D2%25D9%25CE%25CF%25CB%2B%25D0%25C9%25D7%25C1%26stype%3D%26nl%3D0

W

22

woffs

16 марта 2004, 14:51

#3

то, что и сказал

Back Door Man

- URL-Encoded. в PERL одной строчкой раскрывается.

А ты в чем парсить хочешь? Не на "коленке"?

Инструментарий Оптимизаторов (http://www.seomaster.ru/)

139

Lenka

16 марта 2004, 14:54

#4

Посмотрев в логи на рефереры с Яндекса делаю вывод, что страницы вида

http://www.yandex.ru/yandsearch?rpt=rad&text=bla-bla-bla

суть есть первая страница результатов. А страницы вида

http://www.yandex.ru/yandpage?q=956925184&p=1&ag=d&qs=textBLA-BLA-BLA

суть есть последующие страницы (&p порядковый номер после первой страницы).

Те который яндпейдж - они просто дважды перекодированы.

Как декодировать - тут в форуме даже куски кода приводились (мною в т.ч. - но сейчас лениво поиском искать :) )

🚬

S

2

Sharm

16 марта 2004, 14:59

#5

парсить хочу в php, но в данном случае функция UrlDecode не помагает.

А вот если я хочу распарсить, к примеру,

http://www.yandex.ru/yandsearch?rpt=rad&text=%EE%E1%EE%F0%F3%E4%EE%E2%E0%ED%E8%E5+%E4%EB%FF+%F0%E0%E7%EB%E8%E2%E0+%EF%E8%E2%E0,

то переменная text после UrlDecode будет равна "оборудование для разлива пива". То есть все ок.

139

Lenka

16 марта 2004, 15:04

#6

Как писал Sharm
парсить хочу в php, но в данном случае функция UrlDecode не помагает.

О пользе медитации в программировании.

Посмотри, что эти строки отличаются не только yandsearch и yandpage, но и видом закодированного текста. Например, посчитай сколько буковок бывает между процентами в обоих случаях. И подумай над тем, что это ж-ж-ж неспроста.

Попробуй "нераскодировавшуюся" строчку пропустить через продедуру декодирования еще раз.

139

Lenka

16 марта 2004, 15:08

#7

Блин, вот поискала поиском - там примеры

Думаю, если еще поискать, еще про это можно найти.

Учите матчасть.

[Удален]

16 марта 2004, 15:12

#8

qs на второй и далее стр. поиска, раскодировывать надо примерно так же как и в первом случае, но дополнительно перевести то ли koi->win, то ли win->koi.

S

2

Sharm

16 марта 2004, 15:20

#9

За приведенные ссылки спасибо, но я в перле не силен...

Что касается простого двойного декодирования, то близко, но что-то не то. Последний совет, кажется очень близок, вот только я не знаю как перекодировать из кои в win...

S

2

Sharm

16 марта 2004, 15:24

#10

Как я нашел в других форумах это есть 7 битная кодировка, отсюда вопрос как декодировать ее?

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Зачем быть уникальным в мире, где все можно скопировать