воскресенье, 26 июля 2009 г.

Как поисковые машины формируют подсказки для поиска. Часть 2.

Продолжение статьи: Как поисковые машины формируют подсказки для поиска. Часть 1.

Поисковыми предположениями могут быть:
1) Единичные ключевые слова
2) Комбинации ключевых слов
3) Популярные фразы
4) Связанные запросы

Запросы считаются связанными если:
1) Включают в себя термины поданного запроса
2) Встречаются в значительном количестве сессий поиска
3) Содержат высокочастотные термины или фразы из результата выдачи

Поисковое предположение может быть отображено:
1) Вместе с результатами поиска как «похожие запросы»
2) Вместе с результатами поиска как «наиболее часто ищут»
3) В виде списка во время набора поискового запроса под строкой ввода
4) Другими способами

Вот еще несколько «классификаций» поисковых предположений, упоминаемых в патенте Microsoft:
Похожие запросы - запросы, которые считаются наиболее релевантными из наиболее часто используемых запросов с тем же термином.
Наиболее искомые - релевантные термины и фразы из наиболее часто используемых (в отличии от предыдущего случая, здесь ударение ставится на частоту запросов). Их чаще всего располагают вверху страницы выдачи.
Уточнение по запросу - эти предположения сужают область основного поиска. К примеру, запрос «морская рыбалка» может быть сужен до «морская рыбалка Флорида».
Расширение по запросу - противоположные предыдущим предположения, расширяющие область основного поиска. К примеру, запрос «морская рыбалка Флорида» может быть расширен до «морская рыбалка».
«Также попробуйте» - связанные запросы, содержащие лишь одну часть или не содержащие вообще элементов оригинального запроса. Например, поиск по «Derek Jeter» может дать предположение «попробуйте также» поиск по «Alex Rodriguez», так как это игроки одной команды, которые часто упоминаются вместе.

Группировка поисковых предположений
В патенте приводится хороший пример группировки поисковых предположений на основе поиска слова «prada».
Предположения могут быть организованы следующим образом:
[Линии продуктов] prada для женщин, prada спорт, partum spray
[Сумки Prada] женская сумочка, рюкзак, сумка на ремне, prada vela
[Материал] кожа, кожаный ремень, пластик, черная кожа
[Стили] темный, красный
[Prada в культуре] дьявол носит prada, herzog meuron.

Такая организация должна облегчить пользователю понимание поисковых предположений и причин, по которым они были предоставлены.

Мобильный поиск и автозаполнение
В патенте указывается, что для поиска с мобильных устройств было бы оптимальным предоставлять поисковые предположения в выпадающем меню под строкой ввода поискового запроса, так как это позволит уменьшить необходимое время работы с менее удобной, нежели обычная, клавиатурой мобильных устройств.
Впрочем, сейчас этот метод используется практически всеми поисковыми машинами и для всех пользователей.

Выводы
В патенте описываются три алгоритма для определения поисковых предположений. К сожалению, их описание недостаточно детализировано для того, чтобы понять, как они ранжируются между собой.

Поисковые предположения могут быть расположены в различных частях поисковой страницы в зависимости от типа предположения. Предположения, основанные на популярности или частоте выдачи, чаще всего выводятся верху страницы. В то же время предположения, основанные на релевантности или похожести, чаще всего выводятся внизу страницы.

Как поисковые машины формируют подсказки для поиска. Часть 1.

Выбрать нужные слова для поиска не всегда просто. Особенно если вы ищете информацию по малознакомой теме. Но когда вы вводите поисковый запрос, вам довольно часто предлагают аналогичные запросы, которые могут быть релевантны. Подсказки могут располагаться в различных частях страницы, но они все же есть.

Если вы так же любопытны, как и я, то вам наверняка интересно как поисковик находит альтернативные запросы. Если вы ищете что-то, в чем не очень разбираетесь, то вам точно хотелось бы знать помогут ли эти альтернативные запросы. Если же у вас свой сайт, то вас может заинтересовать вопрос о том, что возможно стоит оптимизировать сайт и для этих альтернатив.

Недавно опубликованный патент, принадлежащий Microsoft, раскрывает несколько подходов к формированию поисковых предположений и их представлению.

Многие описания патентов включают в себя раздел, описывающий проблемы, которые данная разработка решит. Вот проблемы, упомянутые в патенте Microsoft:
1) Ограниченное пространство для презентации поисковых предположений
2) Определение наилучшей организации поисковых предположений и релевантных запросов
3) Исключение возможности отвлечения пользователя и создания помех в его поиске
4) Перегрузка пользователей излишним количеством возможностей выбора (в самом патенте это называется «когнитивная нагрузка»)
5) Необходимость убедиться в том, что предоставленные предположения релевантны и могут помочь.

В описании патента более подробно раскрываются способы презентации и организации поисковых предположений. Именно эту информацию мы и рассмотрим далее.

К оптимизации поисковых предположений: Пользовательские интерфейсы и алгоритмы
Изобретатели: Feng Jing, Shuo Wang, Yang Jiangming, Lei Zhang
Принадлежит Microsoft
US Patent Application 20090171929
Опубликовано 2 июля 2009
Подано на рассмотрение 26 декабря 2007

Метод формирования поисковых предположений включает:
1) Использование алгоритмов для поиска возможных запросов связанных с тем, который вводится в данный момент.
2) Вычисление релевантности и частоты использования потенциальных кандидатов.
3) Выдача поисковых предположений, основанная на ранжировании оценок.
4) Организованная группировка поисковых предположений.
5) Описание связей между поисковыми предположениями и текущим запросом для удобства пользователя.

Вот некоторые алгоритмы, которые могут быть использованы Microsoft для определения поисковых предположений:

1) Алгоритм поисковой строки и частоты - Определяет запросы-кандидаты, связанные с текущим запросом к поисковой системе. Кандидаты могут быть связаны с текущим запросом, если они содержат все его термины. Для связанных запросов считается, что они более релевантны, если они чаще запрашиваются. Этот алгоритм концентрируется на частоте запросов.

2) Алгоритм лог-сессии запросов - Этот алгоритм тоже рассматривает логи запросов, но он также учитывает термины, которые искались в одной сессии с запрашиваемым. Этот алгоритм концентрируется на том, чтобы предоставить пользователю результаты релевантные «его намерениям», и при этом термины в запросе пользователя и поисковом предположении могут не совпадать.

3) Алгоритм контента поисковой выдачи - Просматриваются результаты поиска по термину и из них выделяются ключевые термины или фразы. Этот подход может быть использован, если в логах запросов слишком мало данных для использования двух предыдущих алгоритмов.

Продолжение следует

суббота, 25 июля 2009 г.

Индексация, ее ускорение и запрет

Индексация сайта (индексирование) – это процесс сканирования содержимого его страниц поисковыми роботами, после которого они могут попасть поисковый индекс (поиск).

Индексация сайта происходит в автоматическом режиме поисковыми роботами, которые считывают текст, находящийся на страницах, заносят его в базу, где с ним проводятся различные манипуляции (проверка на изменения, проверка на плагиат, оценка релевантности поисковым запросам и т.д.).

Чтобы проиндексировать Ваш сайт обычно ничего делать не требуется, робот поисковой системы сам найдёт его по внешним ссылкам, если такие имеются. Если же он совсем новый, то необходимо провести процедуру регистрации.

Чтобы добавить для индексации в Яндекс необходимо вписать адрес Вашего сайта на странице webmaster.yandex.ru, ввести символы на картинке и нажать “добавить”. Если вместо надписи “Адрес http://site.ru/ успешно добавлен. По мере обхода робота он будет проиндексирован и станет доступным для поиска .Если Вы получили, что-то вроде “Ваш хостинг не отвечает”, повторите попытку. После успешного добавления Вам остаётся лишь дождаться появления в Яндексе, на которое уходит от 3 до бесконечного числа дней (тут уж как повезёт). Проверить индексацию сайта в Яндексе можно на странице webmaster.yandex.ru/check.xml. Если Ваш сайт не появляется в поиске yandex в течение месяца, то можете написать сообщение им в суппорт и спросить, в чём может быть проблема.

проиндексироваться в Рамблере,по-моему,тяжелей всего,поскольку вы делаете заявку,которую впоследствии будут тщательно проверять.Для подачи заявки необходимо заполнить несколько полей на странице robot.rambler.ru/cgi-bin/addsite.cgi. Эта процедура обязательна для всех международных зон. Сайты доменных зон .ru и .su могут попасть в Rambler автоматически. Индексация в Рамблере происходит обычно дольше, чем в других поисковиках. Ходят слухи, что для ускорения индексации нужно зарегистрироваться в top100.rambler.ru, хотя я считаю это только слухом. Проверить на проиндексированность в Рамблере можно на странице rambler.ru/doc/add_site.shtml.

Добавлять сайты в Google, в принципе, нет необходимости, они индексируются даже без ссылок, причём достаточно быстро. Вообще, Google по скорости индексирования является лидером. Но, если Вы желаете, то можете пройти на страницу google.com/addurl, и добавить главную страницу. Проверка сайта на проиндексированность гуглом осуществляется на странице Google.ru, путем запроса вида allinurl:site.ru/ site:site.ru.

Для удобства проверки разных параметров рекомендую использовать бесплатный сервис be1.ru/stat.

Ускорение индексации.


Для ускорения индексации сайта поисковиками можно разместить ссылки на него на хорошо индексируемых площадках (по возможности на главных страницах), которые можно определить, к примеру, по высоким пузомеркам. И вообще, чем больше ссылок на Ваш сайт, тем быстрее он проиндексируется, регистрируйте сайт в каталогах, социальных закладках, покупайте ссылки с сайтов. Так же для сайтов с большим количеством страниц рекомендуется создать карту сайта (sitemap) на которой содержатся ссылки на все страницы. Подробнее о карте сайта можно прочитать тут. Не забывайте и про правильную внутреннюю перелинковку.

Как запретить индексацию.

Иногда возникает необходимость запретить индексацию сайта, или каких-то отдельных разделов и страниц (или частей страниц). Запрещать стоит информацию из секретных разделов, дубли страниц. Многие форумы, блоги, гостевые книги и т.д. содержат служебные каталоги, которые так же стоит запрещать к индексации, чтобы уменьшить нагрузку на хостинг.

Для закрытия части страницы от индексации достаточно заключить её в теги . Правда, этот тег действует только для Яндекса.

Для запрета страниц и разделов создаётся файл robots.txt, использование которого описано на странице help.yandex.ru/webmaster/?id=996567.
Ну вот вроде бы и все...

четверг, 23 июля 2009 г.

10 SEO-рекомендаций, обязательных к воплощению до запуска сайта


Чтобы как следует спроектировать сайт, подготовить его к запуску, требуются месяцы, сотни или даже тысячи человеко-часов. И в итоге Вы должны быть уверены, что сайт начнет работать сразу после завершения работ над ним.

Каждый, даже хорошо разработанный, сайт нуждается в оптимизации. Другой вопрос в том, правильно ли спроектирован сайт, не помешает ли что-нибудь Вашей работе по его оптимизации…

В данной статье я хочу поделиться с Вами 10 seo-рекомендациями, которые должны в обязательном порядке быть усвоены веб-дизайнерами, веб-разработчиками и копирайтерами во избежание в дальнейшем конфликтов с seo-оптимизаторами.

1. Вынесение JavaScript’ов и CSS со страниц сайта в отдельные файлы

Вынесение JavaScript’ов и CSS со страниц сайта в отдельные файлы дает нам 2 преимущества.

Во-первых, мы сделаем код веб-страниц сайта более простым, прозрачным и легким.

Во-вторых, что наиболее важно, мы уменьшим вес кода. Т.е., если например поисковый робот возьмет и съест первые 20Кб кода веб-страницы, 15Кб из которых будут выделены под JavaScript и CSS, то полезного кода поисковик получит всего 5Кб… Согласитесь, что это не то, что Вам нужно!

2. Следите за тем, чтобы все страницы сайта были сверстаны по веб-стандартам

Всегда проверяйте каждую страницу сайта на соответствие веб-стандартам W3C. Ошибки в коде веб-страниц обычно приводят к значительному снижению их доступности, что плохо как для посетителей сайта, так и для поисковых систем.

Последние этого очень не любят, т.к. хотят направлять свою аудиторию исключительно на сайты, обладающие качественным контентом и высокой степенью доступности.

3. Доступность ссылок абсолютно для всех пользователей и поисковых роботов

Крайне не рекомендуется реализовывать внутрисайтовую ссылочную структуру сайта на Flash или JavaScript. Вы не можете быть уверены в том, что все поисковики найдут и правильно поймут эти ссылки. Поэтому самым разумным и эффективным способом организации внутрисайтовой ссылочной структуры сайта было бы с помощью HTML.

4. Придерживайтесь иерархичности контента на сайте

Данный способ – верный шаг к успеху. Размещайте контент на сайте иерархически, например, так: создайте главный раздел, в нем ряд подразделов, раскрывающих суть главного раздела. В каждом из подразделов создайте определенное количество статей, раскрывающих главную тему соответствующего подраздела.

Как видите, все предельно просто!

5. Используйте на всех сайтах ЧПУ (Человеко-Понятные Урлы)

Несмотря на то, что сейчас поисковые системы могут спокойно взаимодействовать с не ЧПУ, пользоваться этим не стоит. Приведение всех URL’ов к нормальному человеко-понятному виду даст Вам ряд преимуществ.

Во-первых, если URL можно запомнить, то посетитель сможет по памяти вернуться на необходимую ему страницу.

Во-вторых, некоторые поисковые системы при ранжировании учитывают ключевые слова, находящиеся в URL’е.

В зависимости от того, какой CMS (системой управления контентом) Вы пользуетесь, реализация ЧПУ будет выглядеть по-разному: либо Вы будете иметь возможность собственноручно прописывать URL’ы, либо URL’ы будут автоматически создаваться с помощью какого-либо плагина, либо это будет делаться автоматически при помощи mod_rewrite.

6. Постарайтесь не использовать Flash, разве что только в случае реальной необходимости

Постарайтесь при создании сайта избегать использования Flash. Помимо того, что это доставляет неудобства определенному количеству посетителей Вашего сайта по ряду причин, это еще и препятствует нормальной оптимизации сайта.

Используйте Flash по его прямому назначению, т.е. для создания точечных элементов, которые динамично используются на веб-страницах сайта. Сам же сайт необходимо делать с помощью xhtml+css.

7. Пишите тексты для представителей своей целевой аудитории

Повторяйте за мной: «Я буду писать исключительно качественные тексты для представителей моей целевой аудитории! Я не буду нашпиговывать свои тексты ключевыми словами!» Мне (что уж говорить про поисковые системы) неописуемо осточертело время от времени натыкаться на сайты, контент которых контентом назвать нельзя…

Это просто предложения, не сочетающиеся друг с другом, по-максимуму напичканные ключевыми фразами, выделенными жирным, курсивом и подчеркиванием.

Уясните, наконец, что нынче одного оптимизированного контента для попадания в ТОП-10 по какому-либо частотному запросу уже недостаточно. Что уж и говорить про переоптимизированные тексты…

Пишите тексты для представителей своей целевой аудитории, пишите их максимально качественно, не забывайте про структуру каждого из текстов (заголовок, подзаголовки…).

Запомните! Что хорошо для посетителей, то хорошо и для поисковых систем.

8. Добавьте на сайт точную и подробную контактную информацию

Сделайте страницу с контактной информацией по-максимуму информативной для своих посетителей. Например, если Вы продаете ноутбуки в Москве, Ваша контактная информация должна содержать полный и точный адрес Вашего офиса, магазина + либо скриншот карты проезда к Вам, либо ссылка на сервис карт Яндекса или Google’а.

Таким образом, Вы создадите максимум удобств для своих посетителей!

9. Избегайте НЕуникального контента на страницах своего сайта

Ни в коем случае не используйте на сайте веб-страницы с НЕуникальным контентом по 2-ум причинам.

Во-первых, современные поисковые системы активно борются с НЕуникальным контентом с помощью фильтров. Например, у Google этот фильтр называется так – “Duplicate Content Filter”.

Во-вторых, каждая страница каждого сайта имеет свою собственную уникальную и неповторимую цель. Данная цель описывается текстом, который и называется «контентом веб-страницы».

В связи с этим просто непонятно, как можно описать уникальную и неповторимую цель страницы своего сайта, взяв это описание с другого сайта…

И, напоследок, хочу порекомендовать отличный бесплатный сервис, определяющий степень схожести веб-страниц.

10. Обязательно тестируйте каждый сайт перед запуском

Содержит ли Ваш сайт такие необходимые:

  • robots.txt
  • XML-sitemap
  • RSS-feed

Перед запуском каждого нового сайта Вы должны протестировать каждый из них. Ниже я привожу несколько вопросов, которые должен включать этот тест:

  • Корректно ли отображаются страницы сайта?
  • Совместим ли сайт со всеми основными браузерами?
  • Присутствуют ли такие необходимые элементы, как заголовки, meta-теги, alt-теги и т.д.?
  • Смогут ли поисковые роботы добраться до всех страниц сайта?
  • Корректно ли составлен файл robots.txt?
  • Корректно ли составлен и работает файл sitemap.xml(.gz)?

Ответив на эти вопросы, Вы в самом начале сможете уберечься от ряда серьезных ошибок и запустить отлично подготовленный к дальнейшему развитию сайт!

среда, 22 июля 2009 г.

О проекте

Идея этого проекта вынашивалась мной довольно-таки давно, а именно с того момента, как я стал серьёзно заниматься поисковой оптимизацией (SEO). Сперва это было для меня увлечением, т.к. у меня был один сайт, на который мне требовалось направлять исключительно целевой трафик. С тех пор я стал искать и на регулярной основе посещать тематические сайты и форумы.

Но вскоре я разочаровался в подавляющем большинстве подобных Рунетовских проектов, т.к. действительно уникального, полезного и бесплатного контента практически не было. Путешествуя от сайта к сайту, я встречал одни и те же бездарные, по моему мнению, публикации. Изучая данные публикации и применяя изложенное в них на практике, я не продвигался ни на шаг.

Чуть позже я стал понимать, что эти статьи в прямом смысле слова генерировались с одной целью - воздействовать на неопытных новичков, а также некомпетентных в этих вопросах клиентов, ведь подавляющая доля подобных сайтов предлагает коммерческие услуги продвижения сайтов. Т.е. они показывали подобной категории Интернет-пользователей свою “высочайшую компетенцию и квалификацию” в той области, в которой они получают весьма приличный доход, путём генерации ряда публикаций, наполненных заумными профессиональными терминами.

Естественно, я не собирался платить деньги за их услуги, т.к. честно говоря, сомневаюсь в их профессионализме.

Изучив ряд публикаций, я применил полученные знания на практике на своём сайте. И был просто шокирован в хорошем смысле этого слова. PageRank Googl’a поднялся с нуля до трёх. А я всего применил несколько методик. Т.е. я считаю, что этого примера достаточно, чтобы описать качество публикуемого бесплатно в буржуйнете контента.

Спустя некоторое время, я решил пройти курс по Web-маркетингу в сертифицированном центре “Специалист”. Там я проходил до этого ряд курсов, качество которых на высоте. Записался на курс, прошёл его. Что могу сказать - узнал достаточно много нового, а уже имевшиеся знания разложил по полочкам. В общем, польза от пройденного курса огромная.

Изучая очередную статью, я подумал, а почему бы не поделиться ценнейшей бесплатной информацией, с пользователями Рунета? Эта идея очень хорошая, поэтому я решил воплотить её в жизнь и создать первый в Рунете подобный проект. Конечно же, кто-то воскликнет, что он далеко не первый, что я пою себе дифирамбы… Но я считаю, что первый, хотя бы по тем планам, которые я собираюсь воплотить в рамках этого проекта. Я просто уверен, что такого обилия уникальной, качественной, полезной и работающей на практике информации Вы вряд ли где ещё в Рунете найдёте.

Вот вкратце история возникновения Этого блога.