Асессоры появились в Яндекесе давно.  Идея была заимствована у Гугля (наверняка многие из вас слышали, что выдачу в Гугле ранжируют толпы индусов :) ) и сама по себе она была не плохой – с помощью асессора очень удобно отлавливать дорвеи, холвеи, клоаки и прочий SEO-спам, а так же обучать алгоритмы вычислять общие признаки сайтов, не достойных находиться в SERP’е.


Но яндексоиды пошли дальше  – они стали с помощью асессоров  обучать алгоритмы ранжировать хорошие сайты.  Это был Epic Fail №1, сейчас объясню почему.


Широкой публике в деталях  работа асессора стала известна с публикацией условий конкурса Интернет-математика 2009.  Асессор даёт оценку паре запрос – документ по пятибальной шкале. Кстати, обратите внимание на тотальную невнимательность яндексоидов, что в принципе свойственно талантливым людям: в условиях конкурса оценки от асессоров лежат в диапазоне от 0 до 4,  но средняя оценка выдачи победителей – выше 4-х.  Чего принципиально быть не может, если только реальная оценка асессоров не лежит в диапазоне от 1 до 5 ;) За год это несоответствие так никто и не заметил.


Итак, у асессора есть 5 оценок.  1 и 2 – это для спама и нерелевантных результатов.  3-ка – это нейтральная оценка – типа слова из запроса в документе присутствуют, но вобще документ не об этом (см.  скриншот предудущей заметки – красным обведены именно документы – троечники)  5-ка  – суперрелевантный результат, витальный. Чтобы было понятно – по запросу Спорт-Экспресс витальным будет сайт одноимённой газеты.  Для всех остальных сайтов – четвёрки.


Вы ещё подвоха не заметили?  А зря. Что происходит в результате такой дискретной оценки? Любой коммерческий запрос, не связанный с брендом, не имеет  витальных сайтов. Со спамом  Яндекс борется хорошо. В итоге,  алгоритм обучается  ранжировать сайты по коммерческим запросам на одних четвёрках.


Вы скаже ну и чё? (Видимо примерно такие же мысли бродят в голове абстрактного яндексоида). А вот чё.


Во-первых, между двумя соседними целыми числами умещается бесконечное множество чисел рациональных.  В переводе на русский это означает, что по любому коммерчески привлекательному запросу найдётся бесконечное множество (если не ограничивать вебмастеров во времени – точно бесконечное :) ) сайтов, оцененных одинаково, но на самом деле достаточно сильно отличающихся  своей ценностью для пользователя поисковой системы.    То есть, выдача, состоящая из документов  соответствующих запросу почти на 5 и выдача, состоящая из документов, соответствующих запросу почти на3 с точки зрения оценивающего качество выдачи алгоритма будут  одинаково идеальны,  хотя одна из них будет казатся пользователям   тихим ужасом.


Именно поэтому Яндекс считает свою выдачу хорошей – ну там же одни четвёрки, не хуже чем в Гугле. Причём ситуация не изменится ровным счётом никак, даже если в реальной жизни Яндекс использует, допустим, десятибальную шкалу оценок.


Потому что,  во-вторых, асессор не даёт оценку бизнесу, стоящему за сайтом. Поэтому,  что сателлит,  не являющийся таковым только по формальным критериям, что лидер в нише, что просто старый заброшенный сайт или сайт-для-бизнеса-на-коленке для асессора, а вместе с ним и для яндекса выглядят одинаково релевантными  запросу. Это естественно, потому что асессоры не являются экспертами в оцениваемой ими области.


И чем это нам грозит, спросите вы, ведь даже если  сателлиты и заброшенные сайты попадут в топ случайно, то алгоритм  дообучится и всё исправит?  Беда заключается в том, что асессор-то даст таким сайтам хорошие оценки.  А это значит, что   алгоритм скорее всего дообучится ещё лучше находить подобные  сателлиты и заброшенные сайты, вместо сайтов богатых компаний, вкладывающих деньги в рекламу вообще и в SEO в частности.  Что мы и можем наблюдать в выдаче.


Хотите примеров? Их есть у меня.  Москва.   Запрос мебель для ванной. Первое место сайт http://www.mebel-vanna.ru/:



30-секундный анализ сайта потенциальным покупателем:
1. Логотипа нет
2. Адреса нет
3. Телефон в картинке


Вывод: в лучшем случае это бизнес-на-коленке, в худшем – сателлит, т.к. нормальный сайт телефон в картинку не прячет, нормальный бизнес не боится указать своё физическое месторасположение, а фирма, которая давно существует на рынке обязательно обзаводится логотипом. У каждого из пунктов могут быть исключения, но все вместе они наводят на мысль, что сайт, а точнее бизнес за сайтом – плохонький. А с точки зрения яндекса – он хорошист,  а потому всё в порядке.


Я могу привести и ещё примеры. Но, тут случилось забавное совпадение – именно сегодня директор некой инфокомуники лизнул яндекс в попу по самые гланды, озаглавив свой опус так:  Яндекс планомерно улучшает контент Рунета. Я не знаю, что это за дядя и что это за компания – видимо несколько отбился от современной SEO-тусовки. Но в статье приводятся цитаты представителей других SEO-компаний из старичков,  которые дружно и радостно уверяют нас, как всё в яндексе хорошо, ажно гламурно.  Поэтому у меня к вам большая просьба:  покажите этим странным дядям и тётям из seo-компаний, а так же яндексоидам (пара-тройка из них точно это сообщение прочитает, а если повезёт, то ссылку скинут и начальству ;) ),  какой трэш  иногда присутствует в яндексе на топовых позициях.  Лучше – со скриншотами, чтобы было меньше шансов отвертеться  :D   Спасибо!


продожение следует







Обсудить  

Читайте также


Комментарии Кто голосовал Похожие новости

Комментарии