Из рубрики: "Школа выживания" - SEO для новичков. Cтатьи по раскрутке сайта
- Ссылочное ранжирование
- Спам
- Индексация
- Опыты без взрывов
Когда на сайт ссылаются десятки страниц словами «а эти козлы не вернули мне деньги», это, как правило, означает, что по ссылке действительно можно найти козлов. Правда, этот же сайт будет находится и по слову «деньги», что, в принципе, тоже верно, потому что деньги остались у козлов. Так вот, это и называется ссылочным ранжированием. Написать на своей странице можно что угодно, но когда на нее все ссылаются теми же словами, поисковик начинает доверять.
Что тут делать? До того, как начнете регистрироваться в каталогах и обмениваться ссылками, выберите краткое название своего сайта, включающее слова, под которые он оптимизируется. Тогда, с большой вероятностью, ссылка будет выглядеть так, как вам хочется. Несмотря на простоту, алгоритм имеет огромное значение при вычислении релевантности, и ему нужно уделять самое пристальное внимание.
Многие поисковики имеют при себе каталоги. Как они используют их?
1. Сайт поднимается в результатах, если слова запроса совпадают с описанием из каталога. В некоторых искалках дополнительный вес сайту дает сам факт присутствия в каталоге, так как в него попадают ссылки только на качественные страницы.
2. Если сайт отсутствует в каталоге, а пользователь ограничивает поиск какой-то темой (такое позволяет Яндекс), то даже при совпадении с темой сайта он показан не будет.
3. Однословные запросы обычно навигационные (пользователь хочет не найти какой-то факт, а получить «что-то на эту тему»). И тут как нельзя лучше подходят сайты из соответствующей категории каталога. Посмотрите на выдачу Яндекса по популярным однословным запросам — сплошь главные страницы сайтов и сайты из каталога.
Как можно это использовать? А что тут думать, регистрируйтесь!
- Ссылочное ранжирование
- Спам
- Индексация
- Опыты без взрывов
Ссылочное ранжирование
Когда на сайт ссылаются десятки страниц словами «а эти козлы не вернули мне деньги», это, как правило, означает, что по ссылке действительно можно найти козлов. Правда, этот же сайт будет находится и по слову «деньги», что, в принципе, тоже верно, потому что деньги остались у козлов. Так вот, это и называется ссылочным ранжированием. Написать на своей странице можно что угодно, но когда на нее все ссылаются теми же словами, поисковик начинает доверять.
Что тут делать? До того, как начнете регистрироваться в каталогах и обмениваться ссылками, выберите краткое название своего сайта, включающее слова, под которые он оптимизируется. Тогда, с большой вероятностью, ссылка будет выглядеть так, как вам хочется. Несмотря на простоту, алгоритм имеет огромное значение при вычислении релевантности, и ему нужно уделять самое пристальное внимание.
Присутствие в каталоге
Многие поисковики имеют при себе каталоги. Как они используют их?
1. Сайт поднимается в результатах, если слова запроса совпадают с описанием из каталога. В некоторых искалках дополнительный вес сайту дает сам факт присутствия в каталоге, так как в него попадают ссылки только на качественные страницы.
2. Если сайт отсутствует в каталоге, а пользователь ограничивает поиск какой-то темой (такое позволяет Яндекс), то даже при совпадении с темой сайта он показан не будет.
3. Однословные запросы обычно навигационные (пользователь хочет не найти какой-то факт, а получить «что-то на эту тему»). И тут как нельзя лучше подходят сайты из соответствующей категории каталога. Посмотрите на выдачу Яндекса по популярным однословным запросам — сплошь главные страницы сайтов и сайты из каталога.
Как можно это использовать? А что тут думать, регистрируйтесь!
Пользовательская оценка
Есть такая интересная система DirectHit. Ее идея оценки качества сайтов основана на предположении, что если пользователь переходит по ссылке, значит, он счел ее хорошей, и если долго не возвращается на страницу поисковика, значит, его ожидания подтвердились. Именно эти критерии — число переходов по ссылке, время нахождения на странице и возвраты к поисковику — легли в основу корректора релевантности, который DirectHit предлагает другим сайтам.
Рамблер до пяти первых сайтов в результатах поиска берет из рейтинга Top100 (а посещаемость — своего рода пользовательская оценка). У Яндекса есть «Популярные находки» — раздел, в котором отображаются сайты с относительно небольшой релевантностью, но часто выбираемые пользователями.
И что, совсем-совсем нельзя повлиять на это? Повлиять можно. Представьте, на основе каких критериев пользователи решают перейти на сайт. Заголовок, раз. Описание, два. URL, три. Заголовки должны учитывать психологию восприятия. Что касается описаний, то поисковики берут их из мета-тега description или выдергивают из текста страницы отрывки со словами запроса. Позаботьтесь, чтобы такие отрывки привлекали внимание.
Спам
Если вы пробовали сунуть руку в пчелиный улей, то знаете, что это может быть больно. Теперь представьте обратную ситуацию: пчел в улее десяток-другой, а вот рук, тянущихся к меду, сотни тысяч. Естественно, что пчелы — сотрудники поисковиков — не любят спамеров! Пока есть масса легальных методов улучшить позицию страницы в результатах поиска, заниматься спамом, по-моему, не стоит, но знать о нем надо.
Какие виды спама бывают?
Какие виды спама бывают?
- Избыточное число ключевых слов на странице или в мета-тегах. Используется редко, потому что поисковики легко вылавливают такие страницы.
- Дорвей (doorway) — страница, нашпигованная ключевыми словами, которая, как только пользователь переходит на нее, тут же делает редирект — перенаправляет его на другой сайт. Встречаются дорвеи без редиректа, дающие пользователю возможность перейти на сайт или уйти. Корректно сделанный дорвей без редиректа является, по сути, обычной оптимизированной страницей и может не рассматриваться как спам.
- Невидимый или слабовидимый текст, цвет которого совпадает с цветом фона страницы, либо шрифт очень мелкий.
- Клоакинг (cloaking) — если известны IP-адреса индексирующих роботов поисковиков, можно выдавать пользователю одну страницу, а поисковику другую — усыпанную ключевыми словами. И хотя IP роботов постоянно меняются, ряд фирм продает свежие базы адресов.
Индексация
Как ускорить переиндексацию?
Чем чаще сайт переиндексируется, тем более свежая информация доступна пользователю при поиске и, самое главное, можно проводить значительно больше экспериментов по оптимизации. Как же ускорить переиндексацию?
1. Поднять вес страницы — Google и другие поисковики, использующие алгоритм PageRank, индексируют новые страницы в порядке убывания их весов, а страницы с большим весом чаще переиндексируют. Посмотрите на диаграмму — страницы с малым числом ссылающихся на них сайтов могут никогда так и не быть проиндексированы.
2. Обновлять сайт регулярно. Поисковики стараются определить период обновления сайта, чтобы не приходить слишком часто.
3. Заплатить деньги. Например, Inktomi обещает после оплаты переиндексировать сайт каждые 48 часов в течение года.
4. Если сайт относится к СМИ, можно зарегистрировать его как новостное агентство. Сайты новостных агентств переиндексируются очень часто (Яндексом — каждые 15 минут).
5. Переименовать страницы, которые нужно срочно переиндексировать, и добавить их в поисковик заново, а старые удалить. Работает только в тех случаях, когда поисковик индексирует быстро и имеет возможность удаления старых страниц (например, Яндекс, Google).
Особенности интернациональной индексации
- Если оптимизация сайта ведется для каждого поисковика индивидуально, т. е. для каждого из них есть своя копия страниц, чтобы их не сочли дублями, «скормите» каждому роботу свои страницы, пользуясь файлом robots.txt.
- Как узнать, сколько страниц сайта проиндексировано и какие именно? Почти все искалки имеют соответствующие команды.
- Поисковики при индексации могут споткнуться на фреймах, динамических страницах, Flash, JavaScript, Image Maps и т. д. Поэтому, когда используете что-то кроме статического HTML, подумайте об индексации.
Опыты без взрывов
Можно ли, поставив эксперимент, узнать алгоритм поисковика или его часть? Конечно!
Эксперимент без проблем
Если вы решились на эксперимент с поисковиком, чтобы не ломать потом голову над тем, что же означают полученные данные, следует строго придерживаться ряда правил.
1. Нужно определить цель эксперимента до его начала. Должно быть ясно, какие данные следует получить и будет ли их достаточно для требуемых выводов.
2. Все посторонние факторы, по возможности, должны быть исключены. Если, например, необходимо узнать, учитывает ли поисковик при вычислении релевантности теги «alt» изображений, то гораздо точнее будет создание и изучение двух идентичных во всем, кроме тегов alt, страниц, чем сравнение чужих страницы, отличающихся, в том числе, alt-тегами.
3. Необходимо исключить все шумы, влияющие на результат поиска. Шумы, связанные с нестабильностью работы поисковиков, можно уменьшить, если проводить эксперимент ночью или в выходные дни. Измерения должны учитывать особенности алгоритмов поисковика. Например, когда подсчитывается число слов на странице, нужно исключать стоп-слова, игнорируемые поисковиком; когда подсчитывается число вхождений слова, надо учитывать все его грамматические формы, если поисковик понимает морфологию.
4. Для выводов требуется статистическая достоверность. Нельзя делать выводы, исследовав пять сайтов или нерепрезентативную выборку сайтов (например, сайты, выдаваемые по одному запросу). Стоит ли данные накапливать быстро или лучше их получать в разные дни и разное время суток? Теоретически второй подход более корректен. На практике же встречается ситуация, когда поисковики, чтобы сбить с толку спамеров, немного меняют алгоритм вычисления релевантности ежедневно или даже чаще. Если известно о таком поведении поисковика, то лучше получить несколько порций данных в разные дни и обработать каждую их них отдельно.
5. Методы анализа полученных данных должны быть адекватны данным, и учитывать, что реальные зависимости могут иметь сложный нелинейный характер. Например, оценка корреляции в неоднородной группе может быть очень неточной, как и в случае, когда зависимость нелинейна.
Метод деления пополам
Допустим, вас заинтересовал какой-либо показатель, влияющий на релевантность страницы, и вы предполагаете, что у него есть оптимум — меньшее значение делает страницу менее релевантной, а большее уже рассматривается как спам. Условно будем считать таким показателем процент ключевых слов на странице.
Для эксперимента создаются три страницы, в одной из которых процент ключевых слов близок к нулю, во второй — таков, что гарантированно будет сочтен спамом, а третья находится ровно посередине. Регистрируем и ждем индексации страниц. В зависимости от того, первая или вторая страница оказалась более релевантной, отсекаем половину исследуемого диапазона сверху или снизу. Повторяем до тех пор, пока оптимум не найден с нужной точностью.
Примечания:
1. Страницы надо располагать на разных доменах, потому что большинство поисковиков в результатах поиска выдают сайты, а не страницы.
2. Запрос, по которому ведется исследование, не должен быть редким, иначе даже при большой разнице в релевантности страницы могут оказаться в результатах поиска рядом.
3. Некоторые поисковики проверяют текст на «естественность», поэтому соотношение числа глаголов, прилагательных, существительных и др. должно быть обычным. С этой целью можно использовать отрывок любого текста, в котором заменять своими словами нужные части речи.
Недостатков у метода два, но больших. Во-первых, никто не говорил про простой и линейный характер зависимости. Во-вторых, метод требует многократной переиндексации страницы, что обычно слишком долго, да и алгоритм поисковика тем временем может измениться. Как избежать недостатков?
Метод дроби
Зная, как и в предыдущем случае, примерный диапазон изменения процента ключевых слов, можно сделать не одну страницу, а 10-20, где процент ключевых слов изменяется с шагом, например, в 1%. Когда среди них станут известны 2-3 наиболее релевантные страницы, чтобы точнее выяснить оптимальный процент ключевых слов, можно будет добавить еще 10-20 страниц с шагом исследуемого показателя в 0,1%. Когда поисковики их зарегистрируют, в любой момент, взглянув на их положение в результатах, можно будет сказать, какой процент ключевых слов на данный момент оптимален. Недостаток, касающийся сложного характера зависимости, остался. Что же делать с ним?
Аналитические методы
В случаях, когда характер зависимости не ясен даже примерно, либо на исследуемые показатели нет возможности влиять, следует изучать зависимости на основе чужих сайтов. В такой ситуации резко возрастает влияние посторонних факторов и шумов, поэтому появляется необходимость использовать методы интеллектуального анализа данных (data mining, статистические пакеты и др.).
Учитывая сложность получения данных (например, веса страницы по алгоритму PageRank), на первом этапе сбор информации может касаться относительно небольшого числа страниц и запросов (десятки), для которых будет собрано максимальное число показателей, известных вам. После предварительного анализа информации можно выделить показатели, наиболее сильно связанные с интересующим вас параметром, и на следующих этапах собирать данные только о них. Эта тема достойна отдельной книги, и, увы, никак не может вместиться в объем статьи.
Выводы
Мы прошлись по основным алгоритмам поисковиков, посмотрели, как надо оптимизировать сайт, где брать информацию и с чего начинать. Что дальше? Мой совет остается неизменным: давайте думать и работать, и превосходный результат обязательно появится!
P. S. Благодарю Илью Сегаловича (Яндекс) за ценные замечания по статье.
Титовец Андрей
руководитель проекта
http://webfocus.ru
Метки: seo для новичков статьи по раскрутке сайта раскрутка продвижение оптимизация сео сеошнику seo pr тиц
| < Предыдущая | Следующая > |
|---|