Жанровые классификации и алгоритмы ранжирования
Виктория Игоревна Рубинер
Докладчик
специалист
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
193
2019-03-22
16:00 -
16:20
Ключевые слова, аннотация
Информационно-поисковые системы, ранжирование,
информационная потребность, жанровые классификации, переоптимизация, поисковые алгоритмы.
Тезисы
В современном мире ежедневно идет борьба между
рекламодателем, которому необходимо продать свои товары максимально дорого и
наибольшему количеству покупателей, и условным клиентом. Особенно ярко и
эксплицитно эта борьба проявляется при рассмотрении выдачи в
информационно-поисковых системах: рекламодатели стимулируют появление рекламных
(платных) ссылок наверху выдачи, пытаются искусственно «подстроить» страницы
своих компаний под алгоритмы поисковых роботов; пользователи же наоборот, как
правило, хотят получить выдачу, соответствующую их ситуативной информационной
потребности.
Своеобразным рефери в этой борьбе является сама
информационно-поисковая система. Одним из основных инструментов контроля
маркетинговой составляющей в работе информационно-поисковых машин являются
разнообразные алгоритмы ранжирования, которые подразумевают добавление
определенных текстовых фильтров: «переспам», «переоптимизация» и т. п. В рамках
этой фильтрации тексты страниц подвергаются оценке с точки зрения их
последовательности, отсутствия избыточного количества чистых вхождений запроса
на странице, наличия синонимов.
При определении того, является ли текст
«переоптимизированным», полезно изначально знать его жанровую принадлежность. В
нашей работе мы рассмотрим варианты применения жанровых классификаций в
алгоритмах ранжирования.