Как создать страничку на яндексе. Основные «фишки» справочников. Польза регистрации в сервисах Google и Яндекса

Проверка индексации сайта является тем мероприятием, которое позволяет предупредить снижение уровня заработка вебмастера. Дело в том, что существует такое понятие, как «выпадение» страниц, по разным причинам приводящее к потере трафика.

Недостаточное количество контента на странице, организационные моменты при «переселении» на другой домен, спам – эти и другие причины сводят на «нет» все усилия вебмастеров. Опытный оптимизатор ни за что не допустит такой ситуации, впрочем, как и понижения рейтинга у площадки, продающей «вечные» ссылки. Проверять индексирование веб-сайта – не прихоть, а вынужденная необходимость!

Существует несколько типов поисковых запросов Google, позволяющих увидеть проиндексирована страница или нет

Проиндексированные страницы сайта

Страницы сайта, прошедшие индексацию Google, можно просмотреть, воспользовавшись оператором «site:». Следует учитывать, что индексация является геозависимой, поэтому может выпадать разное число страниц в индексе для и google.com.

Итак, к указанному оператору добавляем нужный url, причем, между оператором и самой ссылкой на сайт не должно быть пробелов:

site: google.ru

Кроме того, можно провести поиск по целому домену или по отдельно взятому подкаталогу:

site: google.com/ webmasters

Для избирательного поиска с целью исключения ненужных страниц нужно поставить перед оператором знак «-». Наглядно это будет выглядеть так:

site:google.ru -site: adwords. google.com

Подобный поиск выдаст результат, в котором будут содержаться все проиндексированные страницы в домене google.ru, за исключением страниц adwords. google.ru.

link:google.ru или link:www

Кроме того, целенаправленный поиск ссылок на определенные страницы выполняется по запросу:

link:google.ru/webmasters

Текущий кэш вашего сайта

Оператор «cache:» информирует об архивированной копии страницы, которая проиндексирована Google. К примеру, cache:google.ru воссоздает новейшую проиндексированную версию главной сайта, а также выдает информацию о дате создания КЭШа, что дает возможность просмотра версии страницы с обычным текстом. Это чрезвычайно удобно, т.к. становится понятно, как именно робот Googlebot может увидеть страницу.

Используя команду «метатег noarchive», можно ограничить доступ пользователей в результатах поиска к кэшированной версии любой страницы. Между тем, страница будет сканироваться и индексироваться поисковиком Google:

Похожие страницы

Оператор «related:» позволяет увидеть ресурсы, подобные искомому сайту. Такой поиск применяется, как правило, для пересекающихся ресурсов.

В Google может быть использовано целый ряд показателей для выявления схожести, но качество возвращаемых сайтов никоим образом не влияет на процесс индексации страниц поисковой системой Google. Рекомендую почитать пост про гугла, там могут быть страницы которых нет в основном поиске.

Привет, друзья! В сегодняшнем посте я затрону тему индексации сайта в поисковой системе Google. Какие проблемы возникают с ней? Существует ли сейчас основной и дополнительный индекс? Все мои наблюдения на этот счет ниже.

Не знаю как у вас, а у меня Google индексирует меньше страниц, чем Яндекс. По крайней мере он показывает это по таким запросам:

Кстати в этой записи все буду разбирать на примере блога. Он находится в , на нем авторские уникальные статьи, теги, архивы и другие, дублирующие контент страницы (кроме категорий и нумерации страниц по средствам плагины PageNavi) запрещены в robots.txt. Что на такой запрос говорит Яндекс?

Тут уже 281 страница. Причем вообще в sitemap записано примерно 200 страниц + примерно 80 - это как раз те, которые создаются постраничной навигацией. Эти цифры ближе к реальности .

Вернемся опять к гуглу. Получилось, что сейчас он знает только о 172 страницах моего блога. Что же на самом деле? У меня получилась следующая картина:

Сейчас я объясню всю эту таблицу .

Что же получается? Google оказывается знает о 187 страницах + несколько десятков навигационных, а не о 172. По-моему кто-то что-то скрывает или прячет .

Выводы по поводу индексации в Google


До проведения данного анализа я считал, что у моих сайтов проблемы с индексацией страниц в Google. На самом же деле проблемы с тем, что некоторые документы попадают в дополнительный индекс, а о других Google знает, но молчит .

Почему Google отправляет страницы в дополнительный индекс?

  1. Как я уже написал выше, причиной может служить дублирование контента. Для этого можно запретить к индексации дублирующие страницы: теги, архивы и так далее.
  2. Часто страницы с копированным контентом тоже отправляются в сопли, либо просто с незначительным его количеством или низким качеством.
  3. Ошибки поисковой системы. Поисковой робот может неправильно проанализировать страницу, несмотря на то, что она будет являться первоисточником с уникальным и интересным контентом.

Как же вывести страницы из соплей? А вот этим я и буду заниматься. В одном из последующих постов опубликую результаты эксперимента, который должен будет вытащить некоторые страницы блога в основной индекс. Не пропустите . Что вы думаете по поводу индексации ваших сайтов в гугл? Какие особенности были замечены?

  • Googlebot или инструмент Google для индексации страниц – это название поисковой программы (бота), обязанность которого – сбор данных о документации в Интернете для дальнейшего её включения в поисковый индекс Google.
  • Процедура посещений ботами веб-сайтов (как новых, так и старых) в поисках нового и обновленного контента для дальнейшей передачи информации Google называется сканированием. Откуда бот знает, что сканировать? Этот процесс обуславливается ссылками!
  • Индексация – это следующий шаг, совершающийся при обработке документов, собранных на этапе сканирования. Если контент идентифицируется как качественный, то как только обработка завершена, информация добавляется в индекс поиска Google. Рассмотрение слов на определенной странице в ходе индексации является обязательным. Кроме того, на этом этапе также происходит анализ и .

Но как же ботам удается обнаружить новый материал, будь то обновленное содержание страницы, блога или какого-либо абсолютно нового сайта? Это происходит благодаря ранее собранной в Интернете информации о страницах, проиндексированных Google, и информацией с , предлагаемой веб-мастером. Ключевой вопрос – как проиндексировать страницы быстрее?

Методы ускорения индексации сайта

  • Создание Sitemap . Документ Sitemap XML представляет список страниц на сайте, хранящийся на сервере сайта. Когда вы добавляете новые страницы на сайт, он информирует поисковую систему об этом и дает инструкции относительно желаемого графика проверки изменений на определенных страницах. Вы вправе выбирать частоту. Если необходимо, можете заставить проверять ваши страницы на наличие обновленной информации (новые товары, посты или любой другой контент) каждый день. Если же нет, выберите другую частоту проверок. В случае с WordPress, установка плагина Google XML Sitemaps позволяет автоматизировать создание и обновление карты сайта, передавая необходимые данные поисковым системам. Еще один вариант – плагин Yoast SEO .
  • Предоставьте Google Indexing Tool свою карту сайта . Итак, у вас есть карта сайта. Как только она будет создана, перейдите в Google Webmaster Tools в аккаунт сайта. Если у вас его нет, создайте бесплатную учетную запись в Google и зарегистрируйтесь в Webmaster Tools. Далее, добавьте свой сайт в Webmaster, откройте папку «Сканирование», выберите «Sitemaps» и вставьте ссылку на свой файл Sitemap. Таким образом вы сообщаете поисковой системе Google о новых страницах. Чтобы получить еще лучший результат, дополнительно используйте консоль Bing. Там есть возможность создать другую учетную запись, войти в систему и включить свою карту сайта с помощью Webmaster Tools. Как поисковый бот знает, что сканировать? Это благодаря ссылкам! Не забудьте запустить файла, чтобы убедиться, что все необходимые страницы разрешены для индексации.
  • Используйте Google Analytics . Установка Google Analytics используется в основном для отслеживания источников трафика и анализа поведения пользователей. Но само добавление кода на новый сайт и настройка аккаунта в системе аналитики уже уведомляет Google о появлении нового сайта, который необходимо просканировать.
  • Добавьте вручную . Это один из подходов, которым большинство людей пренебрегают, когда ищут возможности заставить поисковые системы просканировать страницы быстрее. Инструменты Google для индексирования не требуют дополнительных усилий или ресурсов и, безусловно, не наносят никакого вреда! Что необходимо сделать, так это, лишь войти в свой Google аккаунт и выбрать «Отправить URL» в Webmaster Tools.
  • Создавайте и обновляйте свои социальные профили . Теперь, когда вы знаете, что ссылки служат для привлечения ботов на сайт, вы понимаете еще одну полезную функцию социальных сетей. Создайте профили в LinkedIn, Twitter, Pinterest, Facebook, YouTube и Google+. Используйте как можно больше соцсетей. После публикации страницы сразу публикуйте ссылку на неё в ваших соцсетях.
  • Разместите ссылки на новую страницу на внешних ресурсах . Блоги, статьи, пресс-релизы, посты посетителей и другие варианты значительно ускоряют индексирование страницы.

Век живи, век учись. Отличная поговорка, которая еще раз напоминает нам о том, что невозможно объять необъятное и узнать все сразу. Надо сказать спасибо, что об этом способе я все-таки узнала, лучше поздно, чем никогда. Если вы еще не знаете, как быстро проиндексировать новую статью, то читайте внимательно и не пропустите эту фишку: «Как ускорить индексацию статьи в Google».

Для начала выложу свой результат ускорения попадания статьи в Google. Сразу скажу, что 4 минуты — не самый быстрый результат, так как я совершенно случайно вспомнила о том, что нужно об этой фишке рассказать своим читателям, и только после того, как я проделала все действия по расшариванию статьи, решила проверить ее в поиске Гугла. Очень была обрадована, что на третьей странице поиска я нашла свежую, только что написанную статью.

Что нужно сделать?

Нужно зайти в инструменты веб-мастера Google, и найти слева, на панели управления раздел «Сканирование». Выберите в этом разделе пункт «Посмотреть как googlebot».

Введите адрес страницы или сайта без названия домена и нажмите «Сканировать», затем — «Добавить в индекс». После этого в появившейся форме нажмите «Сканировать только этот URL».

Еще раз обращаю ваше внимание: если адрес страницы https://сайт/internet-uroki-soveti/kak-uskorit-in…stati-v-google, вводить нужно только internet-uroki-soveti/kak-uskorit-in…stati-v-google. После проделанных вами действий страница отобразится в панели со статусом «готово». Если вы на картинке заметили статус «частично выполнено», то это как раз следствие неправильно введенного адреса страницы. Ошиблась)) Бывает и такое.

Еще одна фишка

Но это еще не все. Ускорить можно и индексацию всего сайта. Целиком. Вы наверное видели в панели инструментов вебмастера диаграмму с количеством проиндексированных страниц сайта. На картинке данные двух сайтов:

Больше всего пугает первая картинка, где количество проиндексированных страниц сильно отличается от количества отправленных в индекс. То есть, я их отправляю в индекс, а индексироваться они не хотят категорически. Что будем делать? Будем лечить, а именно, отправим в индекс карту sitemap.xml. Точно так же, как мы это сделали со страницей сайте в разделе «Посмотреть как googlebot». Таким образом, мы попробуем обратить внимание поисковика на наш сайт и будем внимательно следить за изменением ситуации.

Если Google не желает самостоятельно заглядывать на наши сайты, отправим ему личные приглашения, верно? Ведь вовремя проиндексированные статьи направят к нам посетителей, страждущих найти ответы на свои вопросы, чего, собственно, мы и добиваемся — увеличения посетителей из поисковых систем.

Если вы уже убедились в том, что ваша статья или сайт проиндексированы, то можно и отдохнуть. Предлагаю вам посмотреть классное видео про Северную Корею. Просто красиво!

Чтобы проиндексировать сайт в Google, нужно авторизоваться в google-аккаунте и перейти по адресу https://www.google.com/webmasters/tools/submit-url . Там вы должны будете ввести адрес главной страницы своего сайта и пройти проверку на то, что вы не робот. Собственно, этих действий достаточно для того, чтобы ваш интернет-портал индексировался в Гугле – другое дело, что для продвижения в ТОПе выдачи придется приложить гораздо больше усилий.

Теоретически возможны две ситуации, при которых индексация в гугл не пройдет:

    В случае проблем с сервером. Вы увидите сообщение о том, что ваш хостинг не отвечает на запросы системы, и, соответственно, не сможете выполнить процедуру в этот конкретный момент времени. Однако вы можете повторить попытку позже, когда ваш сайт снова заработает. Впрочем, если проблемы с хостингом у вас возникают систематически, то стоит задуматься о смене провайдера. Стабильная работа интернет-портала важна и в контексте «симпатий» поисковых систем, и в связи с необходимостью удовлетворять пожелания и запросы посетителей, а не раздражать их.

    При попадании под санкции. В подобной ситуации на странице появится сообщение о том, что адрес вашего сайта запрещен к добавлению на индексацию. Санкции могут быть разными, и выданы они могут быть по разным причинам. Если вы уверены, что не сделали ничего плохого за время владения сайтом – то, возможно, санкции были наложены за то время, что им управлял предыдущий собственник. Поэтому очень важно проверять сайты на бан поисковиков перед тем, как покупать их. Если же вы узнаете о санкциях уже по факту, то вы можете попробовать узнать их причину на форуме Google. Но для того, чтобы добиться индексации в системе Гугл как можно быстрее, проще будет развивать проект на другом домене.

Быстрая индексация в Google

Далеко не всегда вебмастеру хочется ждать, пока робот поисковой системы сам зайдет на его сайт и проиндексирует новые страницы. Чтобы ускорить этот процесс, можно прибегнуть к нескольким эффективным способам:

    Через панель вебмастера Google. Для этого в разделе «Сканировать» необходимо выбрать пункт «Посмотреть как Googlebot». В соответствующее поле понадобится вставить адрес новой страницы, причем без адреса самого сайта (то есть из URL необходимо удалить эту часть). Далее необходимо нажать на кнопку «Сканировать», а по завершении процесса – на кнопку «Добавить в индекс». Появление сканированной страницы в индексе займет от нескольких минут до получаса. Единственный недостаток такого способа заключается в том, что его необходимо выполнять вручную, и он требует достаточно большого количества времени.

    С использованием файла SiteMap.XML. Это файл, в котором содержатся ссылки на все страницы сайта, информация о датах их изменения, приоритетности просмотра. Он, во многом, определяет то, насколько быстро индексируются новые страницы. Поэтому ссылки на них нужно сразу же добавлять в такой файл, чтобы роботы находили их быстрее. При этом крайне желательно использовать динамический SiteMap.XML, а не обновлять его вручную после каждой корректировки сайта.

    Путем оптимизации файла robots.txt. Этот файл позволяет задать директивы, в соответствии с которыми будут работать поисковые роботы и, соответственно, выполняться индексация сайта в системе Гугл. В контексте скорости этого процесса особое значение имеет директива Disallow, задающая те файлы, страницы и разделы, которые не должны быть проиндексированными. Благодаря ей роботы экономят время и быстрее доходят до новых страниц.

    С помощью RSS-канала и социальных сетей. Увеличить скорость, с которой индексируется новый материал на сайте, можно и посредством добавления наиболее часто пополняемых разделов на RSSканал. Кроме того, вы можете добавлять ссылки на новые страницы в социальные сети (особенно полезна в контексте индексации сайта роботами Google соцсеть Twitter). Еще лучше, если вы сделаете кросспостинг из RSS-ленты в Твиттер.

Таким образом, индексация сайта в Google – это задача, для решения которой достаточно потратить несколько мгновений и сделать пару кликов. Однако быстрая индексация, и тем более – эффективное продвижение сайта в Гугл, требует гораздо более комплексной и продолжительной работы.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: