четверг, 16 октября 2008 г.

PageRank

Последовательность оценки релевантности страницы в Google следующая: сначала проводится ранжирование сайтов в зависимости от внутренних факторов (ключевые слова, HTML-код), затем учитывается тематика (текст) внешних ссылок на страницы сайта, и только потом полученные результаты корректируются данными PageRank.

Показатель PageRank рассчитывается для каждой страницы сайта, проиндексированной Google. Расчет основан на следующей логике: если страница А ссылается на страницу Б, то страница А считает В важной страницей. Если на страницу ссылается много важных страниц, то важность этой страницы возрастает, и ссылки с данной страницы становятся более сильными.

PageRank рассчитывается по специальным формулам, в основе которых лежит определение относительной вероятности посещения страницы пользователем. Иными словами, PageRank представляет собой не что иное, как показатель вероятности нахождения пользователя на той или иной странице. У каждой страницы изначально есть некоторый ненулевой PageRank, даже в том случае, если на нее не ведут никакие ссылки.

От страницы, содержащей ссылки, PageRank передается страницам, на которые эти ссылки ведут. Передаваемая величина PageRank находится в обратной зависимости от количества ссылок на странице. Чем больше на странице ссылок, тем меньшее значение PageRank достанется каждой из "пролинкованных" страниц. Подобная схема позволяет добиться максимальной полезности для честных односторонних ссылок.

Оперировать весами достаточно неудобно, поэтому для наглядности показатель PageRank конвертируется в оценку по десятибалльной шкале. Именно эту оценку можно узнать, используя специальные программные продукты, например Google ToolBar. Для детального анализа шкала Google Toolbar подходит слабо, поскольку одна и та же оценка может присваиваться ресурсам, имеющим разницу в десятки и даже сотни тысяч единиц действительного веса.

При расчете показателя PageRank учитываются не только внешние ссылки, но и ссылки с внутренних страниц. Важной характеристикой PageRank является то, что он не учитывает текста ссылок, указывающих на страницу.

Какую роль при выдаче поисковых результатов играет показатель PageRank? С его помощью возможна корректировка результатов сортировки релевантных текстовому запросу документов. Роль далеко не главная, и именно поэтому бессмысленно "затачивать" сайт исключительно под достижение высокого значения PageRank. Сколько бы ссылок ни выкупили, сколько бы схем по круговому обмену ссылками ни организовали, если сайт не наполнен хорошим оптимизированным контентом, высоких позиций в Google вам не получить. Высокий показатель PageRank будет крайне полезен для сайта, прошедшего все остальные стадии оптимизации. Грубо говоря, чем выше PageRank, тем эффективнее вы сможете бороться за место под поисковым солнцем со столь же хорошо оптимизированными сайтами-конкурентами.

Хотите знать все о современных графических ускорителях? Не проходите мимо ;)

Тематический индекс цитирования (тИЦ)

Показатель тИЦ применяется для определения релевантности сайтов в собственном каталоге Яндекса и не оказывает прямого влияния на позиции сайтов в выдаче по поисковым запросам пользователей.

Величина индекса рассчитывается для сайта в целом и зависит от количества и тематики ссылающихся на него сайтов. Таким образом, наряду с количественным показателем применяется и качественный показатель — значимость, или "вес" ссылки. Данный показатель рассчитывается по специально разработанному поисковой системой Яндекс алгоритму. Большое значение в нем уделяется показателю тематической близости — тому, насколько сходна тематика сайта, для которого рассчитывается тИЦ, с тематикой ссылающихся на него ресурсов. Величина тИЦ определяется как сумма весов всех поставленных на сайт ссылок, учтенных поисковиком. Таким образом, данный индекс предназначен для того, чтобы помочь пользователю ориентироваться в авторитетности ресурсов сходной тематики в рубриках каталога Яндекса за счет их правильного ранжирования. При расчете показателя тИЦ не учитываются:

  • ссылки, сделанные с Интернет-ресурсов, не проиндексированных поисковой системой Яндекс (находящиеся вне русскоязычного сегмента Интернета);
  • внутренние перекрестные ссылки (ссылки с одной страницы сайта на другую);
  • ссылки с форумов, немодерируемых каталогов и иных ресурсов, на которых ссылки могут быть размещены без участия владельца ресурса;
  • ссылки с сайтов, размещенных на бесплатных хостингах, не зарегистрированных в каталоге Яндекса.


Искусственное завышение тИЦ сайта его владельцем с помощью масштабного увеличения ссылок на сайт может быть расценено как "обман поисковой системы" — в данном случае тИЦ ресурса может быть обнулен. Подобные активные действия по "разгону" тИЦ, как и любые другие способы прямого обмана поисковика, куда более опасные, нежели полезные, — и это правило должно быть известно владельцу любого Интернет-ресурса.

Что такое SEO-текст?

SEO-текст - это текст, с определенной плотностью насыщенный ключевыми словами из семантического ядра сайта. Причем насыщение это проводится не наобум, а согласно строгим правилам, над тщательным и приближенным к действительности выведением которых постоянно трудятся оптимизаторы всего Интернета.

Семантическое ядро — совокупность поисковых запросов (ключевых слов), по которым целесообразно проводить поисковую оптимизацию, чтобы привлечь на сайт целевую аудиторию.

Тут надо сразу отметить, что алгоритмы поиска держатся создателями поисковых машин в секрете либо же попадают в свободный доступ в виде, крайне трудно поддающемся какому-либо практическому анализу. Поэтому все работы по выявлению алгоритмов работы поисковиков ведутся по методу изучения "системы черного ящика". Этот принцип базируется на том, что необязательно знать внутренние законы и механизмы функционирования какой-либо системы для того, чтобы предугадать ее типовые реакции на воздействия определенных внешних факторов. Проще говоря, мало кто знает, как устроен современный телевизор, но зато все понимают, что прибор включится после нажатия на кнопку "Вкл".

Разумеется, со взаимоотношениями контента и поисковых алгоритмов дело обстоит гораздо сложнее, однако общий принцип "раскрытия тайны черного ящика" остается тем же. Оптимизаторы и SEO-копирайтеры "скармливают" поисковым роботам определенным образом подготовленные и структурированные сайты, а затем (не исключая всех поправок, учитывающих влияние внешних факторов на ранжирование) анализируют данные, которые поисковый алгоритм выдает по запросам, входящим в семантическое ядро, с которым в данное время ведется работа. Результатом многих итераций с варьированием параметров как раз и будут эмпирические законы создания самого эффективного с точки зрения взаимодействия с поисковыми роботами SEO-текста.