15 июля 2007 г. Автор: Михаил Дубицкий

Учебник по SEO. Урок 2. Основы поисковых машин.


Основые поисковых системОсновы поисковых машин

Для поиска информации в сети в основном используются поисковые системы и каталоги.

Поисковые машины используют специальное ПО, которое автоматически просматривает сеть. Страницы индексируются и попадают в базу данных. Существует великое множество поисковых систем. Самыми популярными являются Google, Yahoo, Яндекс и Rambler.

Каталоги – базы данных, пополнение которых осуществляется владельцами сайтов вручную. Некоторые поисковые системы совмещают в себе и поисковую машину, и каталог.

Индексирование

?Как говорилось выше, поисковые системы с помощью специального ПО автоматически сканируют сеть, индексируют страницы и добавляют их в базу данных. При этом паук сохраняет ключевые слова каждой страницы, чтобы потом сопоставлять их с пользовательскими запросами.

Ранжирование

Нужно учитывать два фактора сортировки выдачи. Это релевантность и число и качество внешних ссылок на ваш сайт. Последний фактор известен как ссылочная цитируемость, ссылочная популярность или индекс цитирования.

Релевантность и факторы, влияющие на нее

В каждой поисковой машине есть собственный механизм, определяющий релевантность той или иной ссылки. Этот механизм представляет из себя математическую формулу с сотнями параметров, которые могут меняться. Это делает практически невозможным взлом алгоритма.

Укажем факторы, влиящие на увеличение ранга в поисковой системе: Checklist
• наличие ключевых слов в тэге TITLE;
• наличие ключевых слов в URL;
• количество ключевых слов в основном тексте страницы;
• наличие ключевых слов в заголовках и подзаголовках (Н1, Н2 и т.д.);
• наличие ключевых слов в текстовых ссылках на странице;
• наличие ключевых слов в текстовых ссылках, указывающих на данную страницу;
• наличие ключевых слов в атрибуте Alt тэга IMG;
• наличие ключевых слов в названиях файлов-рисунков;
• "Важность" сайтов, которые ссылаются на данный сайт;
• релевантность страниц, которые ссылаются на данный сайт;

Кроме повышающих рейтинг факторов, есть и понижающие:
• использование технологий, которые ПС рассматривает как спам;
• Ворованный контент;
• переадресация URL;
• другие факторы.

Большая часть негативных факторов – это элементы дизайна, которые мешают поисковому роботу проиндексировать сайт. Чем меньше на сайте элементов, затрудняющих индексацию, тем более он совместим с поисковой машиной и тем выше его шансы получить высокий рейтинг по определенному запросу.

Главное в оптимизации не переборщить. Это помешает, как и недостаток оптимизации. Необходим тонкий баланс.

Индекс цитируемости и PageRank

Элементарный подсчет числа внешних ссылок не дает нам достаточной информации для оценки сайта. Сравнивать популярность сайтов лишь по числу внешних ссылок нельзя - необходимо учитывать важность ссылок.

Для оценки числа и качества внешних ссылок на сайт поисковые системы ввели понятия индекса цитирования Яндекса и PageRank от Google.
Индекс цитирования - это общее обозначение численных показателей, оценивающих популярность какого-либо ресурса.

ТИЦ рассчитывается для сайта в целом и показывает авторитетность ресурса относительно других. На практике ТИЦ можно использовать для оценки раскрученности сайта и оценки уровня конкуренции по заданному поисковому запросу. Сайты, имеющие ТИЦ больше 20, имеют возможность разместить кнопку, которая будет отображать значение ТИЦ ресурса.

Google PR

Первый патент на систему учета внешних ссылок зарегистрировала компания Google. Их алгоритм получил название PageRank. Google использует один из наиболее сложных алгоритмов. Часть алгоритма включает Google PageRank TM – систему ранжирования web -страниц, разработанную основателями Google. PageRank использует структуру ссылок для определения релевантности.

Соблюдая несколько простых правил, Вы можете рассчитывать на высокие позиции Вашего сайта при соответствующем запросе. Для того, чтобы получить высокий рейтинг в поисковых системах, Вы должны понять общую концепцию рейтинга.

Профессиональные оптимизаторы специально конфигурируют презентацию своей страницы для лучшего восприятия людьми. Если презентация успешна, люди щелкают на ссылку и создают результат рейтинга. Поисковые машины отображают заголовок страниц и Мета описание страницы.

Оптимизация в Яндексе

Поисковая система Яндекс содержит в своем индексе о каждом слове текста номер документа, номер предложения, номер слова в предложении и вес каждого слова.

YandexВся эта информация используется при поиске. При каждом запросе ищутся фразы, точно совпадающие с запросом, затем предложения, содержащие все слова запроса и так далее. Важную роль играет относительное положение слов.

Моменты, необходимые для высокого рейтинга в Яндексе:
1. Текст входящей ссылки
2. Использование ключевых слов в тэге Title
3. Качество и релевантность внешних ссылок
4. Общая ссылочная популярность ссылающегося сайта
5. Общая ссылочная популярность сайта
6. Соответствие текста в body ключевым словам
7. Взвешенный индекс цитирования (вИЦ) Яндекса
8. Тематическая релевантность входящих ссылок
9. Внутренняя ссылочная структура
10. Ключевые слова в заголовках H1, h2, h3, h(x)

Оптимизация в Рамблере

Ключевые и важные для тематики сайта слова необходимо заключать теги TITLE, H1...H4, B, STRONG и U.

RamblerЧем чаще слово встречается в этих полях тем более вероятно, что поисковая система Рамблер выдаст ссылку в рейтинг на этот документ выше других. Программа индексирования обрабатывает переадресацию, если переадресация выполняется в зону .ru или в домены стран СНГ. Поисковая машина Рамблер умеет извлекать ссылки из объектов Flash и потому может обрабатывать сайты, построенные на flash-технологии. При индексации учитываются лишь та информация, которую пользователь может увидеть на странице. Поиск учитывает данные Tоп100. Если сайт зарегистрирован в Топ100, то он будет доступен по некоторым словам, даже в случае удаления информации из индекса базы.

Индексация поисковой системой WebAlta

WebaltaДля повышения точности ответов в Вебальтe использован целый ряд собственных разработок. Это учет русской морфологии, новый механизм индексирования документов, модернизированная процедура отбора и сортировки результатов. Сейчас пользователи могут искать украинские и белорусские интернет-страницы на русском языке. Также в Вебальте есть собственная система контекстной рекламы и ряд других сервисов, таких как почта и новости. Индексация сайтов и добавление их в базу данных поисковика происходит автоматически. За регистрацией в каталоге Open.WebAlta.Ru автоматически следует добавление в очередь на индексацию сайта.

Индексация поисковой системой Google

GoogleGoogle считается самым лучшей поисковой системой в мире. В его индексе находятся более 3 млрд. документов, Google переведен на 26 языков мира. Крупнейшие компании выбрали Google в качестве поискового инструмента. Технология PageRank позволила создать качественный поиск и выдавать при запросе более релевантные результаты.

Что индексируется поисковой системой Google? Текст в теге TITLE, тексты ссылок, текст между тегом NOFRAMES, даже если на сайте фреймы не используются и текст между тегом OPTION, текст в параметре тега IMG ALT="текст".

Google не индексирует текст между тегом STYLE.

Поисковый результат, выдаваемый Google складывается из PageRank'а страницы, ключевых слов в Anchor text, плотности ключевых слов на странице и близости ключевых слов на странице.

Что ж, на сегодня все. Увидимся в следующем уроке ;)!

Читать другие похожие записи:

RSS-подписка

Powered by FeedBurner

Мы рекомендуем

Searchengines.Ru - Первый сайт о SEO.

Sape.Ru - Лучшая биржа ссылок за 2007 год.

Yazzle.Ru - Программа для оценки бюджетов и анализа конкурентов.