Просмотр полной версии : Генерация дискрипшина
По какому алгоритму лучше сделать автоматизацию дискрипшина? Кейвордсы у нас автоматически генерируются по популярным словам с отбросом стоп-слов. А вот как бы получше сделать дискрипшин? Вот если туда включить название статьи (которое также в титле) + кейвордсы, которые не уместились в кейвордсах.. Или такой алгоритм грубый. Кто нить занимался генерацией дискрипшинов?
Да. description должен быть читабельным и понимабельным, поскольку часто выводится в выдаче, даже если не учитывается. Алгоритм - это твои проблемы.
Professor
09.11.2002, 16:59
Можно сделать набор описаний и выдавть их по мере соответствия ключевым словам под документ ... но это как-то не по русски - с темой можно ошибиться ... не хватает ссылки на сайт, на котором ты это будешь делать - может и подскажем чего ... но вообщего это гиблая задача , сродни искуственному интелекту ... у Яндекса вроде есть робот, который пишет (редактор имеет право вето) описания для сайтов - позаимствуй ;-))
Сайт вот http://impression.ru/prag/ и ему подобные (по куче стран). А можно поподробнее о роботе.. ?
Как писал Longer
По какому алгоритму лучше сделать автоматизацию дискрипшина?
Можно выдергивать начало текста или 2-3 идущих подряд предложения, в которых процент ключевых слов максимален. Это еще не искусственный интеллект, но, по крайней мере, метод дает читаемое описание.
С уважением,
Александр Садовский.
Как писал funsad
Можно выдергивать начало текста или 2-3 идущих подряд предложения, в которых процент ключевых слов максимален. Это еще не искусственный интеллект, но, по крайней мере, метод дает читаемое описание.
Я примерно так и предложил сделать. Т.е. я думаю выдергивать даже не предложение, а кусок текста до запятой, где имеются ключевые слова с наибольшей повторяемостью + в начало дискрипшина я думаю вставлять название статьи, которое также повторяется в заголовке. Что касается выдергивания начала текста.. то это будет в принципе смотрется лучше.. Но там не всегда будет очень "густо" с поисковыми словами.. :smoke:
Как писал Longer
Но там не всегда будет очень "густо" с поисковыми словами..
Description учитывает (из российских) только Яндекс, но не учитывает в нем ключевых слов - лишь пользует как описание страницы для показа в результатах поиска... Есть ли смысл налегать на наличие ключевых слов?
хм.. В таком случае проще начало документа подсунуть.. Впрочем насколько я понимаю если дискрипшина нет, то поисковик начало документа и возьмет..?
В идеале, стоило бы взять на вооружение принцип Google - он при индексации сооружает для каждой страницы "отрывки" (snippets), которые потом используются вместо description.
Что касается выдергивания начала текста.. то это будет в принципе смотрется лучше.. Но там не всегда будет очень "густо" с поисковыми словами..
А вот это зря - рекомендация употреблять ключевые слова в первой трети страницы не с потолка взята.
Как писал Gray
В идеале, стоило бы взять на вооружение принцип Google - он при индексации сооружает для каждой страницы "отрывки" (snippets), которые потом используются вместо description.
А вот это зря - рекомендация употреблять ключевые слова в первой трети страницы не с потолка взята.
Что касается отрывков, я так и предлагаю.. Искать предложения с избытком ключевых вслов и брать куски до запятой, до точки, или определенное кол-во слов справа и слева от ключевого слова..
Относительно первой трети.. Это то ясно, так как учитывается положение слова к началу документа (только вопрос? а зачем это поисковым системам далось? или люди так типа пишут?), но тут то дело в дискрипшине, который как сказано выше будет не учитываться, а демонстрироваться при выдаче. Ну так пусть люди нормально что-то почитают..
или люди так типа пишут
типа нормальные пацаны письма так не пишут :)
Но вот в документах научного типа в начале всегда abstract идёт.
Как писал AiK
типа нормальные пацаны письма так не пишут :)
Но вот в документах научного типа в начале всегда abstract идёт.
А ещё поисковые слова.. За которые прищучить могут, подумав, что спам.. ;)
Как писал Longer
хм.. В таком случае проще начало документа подсунуть.. Впрочем насколько я понимаю если дискрипшина нет, то поисковик начало документа и возьмет..?
Отнюдь. Если не будет description'а, он просто НЕ БУДЕТ выводиться... :)
Кроме description'а Яндекс еще выводит отрывки фраз из документа. Останутся лишь они...
vBulletin® v3.8.6, Copyright ©2000-2012, Jelsoft Enterprises Ltd. Перевод: zCarot