Как заставить Google индексировать ваш сайт с помощью отчета об охвате - Семальт знает ответ



Пришло время углубиться в отчет об индексировании в Search Console, чтобы понять, как мы можем заставить Google быстрее сканировать и индексировать ваш сайт. В Semalt есть несколько профессиональных технических специалистов по поисковой оптимизации, и все они знакомы с отчетом о покрытии индекса Google Search Console.

Если у вас есть технический специалист по SEO, который не использует и не разбирается в этом инструменте, найдите нового. Отчет GSCIC дал глубокое понимание:
  • Какие URL-адреса на вашем веб-сайте просканированы и проиндексированы Google, а какие еще предстоит просканировать.
  • Это также объясняет, почему поисковая система выбрала, какой URL сканировать или нет.
Отчет выглядит относительно простым, поскольку для представления результатов в нем используется цветовая схема светофоров.
  • Красный свет (ошибка): показывает, что страница не проиндексирована.
  • Желтый (действительно с предупреждением): это указывает на то, что могут быть некоторые проблемы, которые необходимо исправить. Если у вас есть время, вы можете их исправить. Однако они не критичны, и страницу можно проиндексировать.
  • Зеленый (действительный): это означает, что все в порядке и ваша страница проиндексирована.
Еще один результат - большая серая зона, которая была исключена.

Читая дальше, мы понимаем, что правила дорожного движения, кажется, написаны на языке Googlish. Однако мы могли бы преобразовать типы статуса в индексирование и повысить нашу органическую производительность.

Проблемы, влияющие на SEO, в отчете об индексировании

Главное здесь - убедиться, что вы не сосредотачиваетесь только на ошибках. Чаще всего значительные успехи SEO будут похоронены в упомянутой выше серой зоне. Вот некоторые проблемы с отчетом об индексировании, которые действительно важны для SEO. Эти элементы перечислены в порядке приоритета, поэтому вы знаете, что и где требует вашего внимания больше всего.

Обнаруженный контент в настоящее время не индексируется

Это происходит потому, что URL-адрес известен Google по ссылкам или XML-карте сайта и находится в очереди сканирования. Проблема здесь в том, что робот Googlebot еще не просканировал URL. Это означает, что есть проблема с бюджетом сканирования.

Как мы можем это исправить? Если в эту категорию попадает всего несколько страниц, мы можем запустить сканирование вручную, отправив URL-адреса в Google Search Console. Если существует значительное количество URL-адресов, мы потратим больше времени на долгосрочное исправление архитектуры вашего веб-сайта. Это будет включать таксономию сайта, структуру URL и структуру внутренних ссылок. Это решит проблемы вашего краулингового бюджета из их источников.

Просканировано - в настоящее время не проиндексировано

Иногда робот Googlebot сканирует URL-адрес и обнаруживает, что его содержание не заслуживает включения в его индекс. Это распространено из-за проблем, связанных с качеством, таких как наличие устаревшего контента, тонкого или нерелевантного контента, ведущих страниц или спама, создаваемого пользователями. Если ваш контент признан достойным, но он не проиндексирован, скорее всего, проблема возникла в результате рендеринга.

Как мы можем это исправить? Быстрое решение - просмотреть содержимое ваших страниц. Когда вы понимаете, что думает робот Googlebot, содержание вашей страницы становится достаточно ценным, чтобы его можно было проиндексировать. Затем вы выясняете, должна ли страница существовать на вашем сайте.

Предположим, веб-страница бесполезна для вашего веб-сайта, 301 0r 410, URL. Если это важно, измените содержимое на странице и добавьте неиндексный тег, пока не решите проблему. Если у вас есть URL-адрес, основанный на модели параметров, вы можете предотвратить сканирование страницы, используя некоторые практические методы обработки параметров.
Если качество содержимого кажется приемлемым, проверьте, как он отображается без JavaScript. Google может индексировать контент, созданный с помощью JavaScript, но это сложнее, чем индексирование HTML. Это потому, что у JavaScript есть две волны индексации. Первая волна индексирует эту страницу на основе исходного HTML-кода с сервера, и вы можете увидеть это, щелкнув правой кнопкой мыши, чтобы просмотреть исходный код страницы.

Второй индекс основан на модели DOM. Это включает в себя как HTML, так и визуализированный JavaScript со стороны клиента. Вы увидите это, щелкнув правой кнопкой мыши и проверив.

Основная проблема с индексированием JavaScript возникает во второй волне индексации, которая ограничена до тех пор, пока у Google не появятся доступные ресурсы для рендеринга. Вот почему индексирование содержимого, зависящего от JavaScript, занимает больше времени, чем содержимого только HTML. Индексирование JavaScript может занять от нескольких дней до нескольких недель с момента сканирования.

Чтобы избежать таких задержек, вы можете использовать рендеринг на стороне сервера. Это позволяет представить все основные компоненты контента в исходном HTML. Это должно включать критические элементы вашего SEO, такие как заголовки страниц, структурированные данные, ваш основной контент и ссылки, заголовки и канонические элементы.

Дублированный контент без канонического выбранного пользователем

Это происходит, когда Google считает страницу дублированным контентом, но она не отмечена явным каноническим содержанием. Здесь Google решил, что эта страница не должна быть канонической, и по этой причине она была исключена из индекса.

Чтобы исправить это, вам нужно будет явно указать правильные канонические символы. Убедитесь, что вы используете правильные теги rel=canonical для каждого просматриваемого URL на вашем веб-сайте. Это позволяет вам понять, какие страницы выбраны Google как канонические, нам нужно будет проверить URL-адрес в Search Console.

Дублированный отправленный URL, который не выбран как канонический

Это вызвано аналогичной ситуацией, указанной выше. Единственная разница здесь в том, что вы специально запросили индексирование URL.

Чтобы исправить это, вам нужно будет пометить правильный канонический файл с помощью ссылки rel=canonical. Его следует использовать для каждого доступного для сканирования URL вашего веб-сайта. Вы также должны убедиться, что вы включаете только канонические страницы в XML-карту сайта.

Google выбирает другой канонический

В этом случае вы разместили свои ссылки rel=canonical, но Google не считает это предложение подходящим, поэтому он предпочитает индексировать другой URL-адрес в качестве канонического.

Чтобы исправить это, вам нужно будет проверить URL-адрес, чтобы увидеть канонический URL-адрес, выбранный Google. Если вы считаете, что Google сделал правильный выбор, измените ссылку rel=canonical. В противном случае вам придется поработать над архитектурой сайта и уменьшить количество дублированного контента. Вам также следует посылать более сильные сигналы ранжирования на страницу, которую вы хотите сделать канонической.

Отправленный URL не найден (404)

Запрос, сделанный для страницы, не существует. Чтобы исправить это, вам нужно будет создать URL-адрес или полностью удалить его из XML-карты сайта. Этой проблемы легко избежать, следуя нашему руководству по XML-карте сайта.

Ошибка перенаправления

Здесь у роботов Google возникли проблемы с перенаправлением. В основном это вызвано наличием цепочки перенаправления из пяти или более URL-адресов, чрезмерно длинных циклов перенаправления или пустого URL-адреса.

Мы можем исправить это, используя инструменты отладки, такие как маяк. Инструмент кода состояния, такой как httpstatus.io, также можно использовать, чтобы понять, что мешает перенаправлению работать должным образом, и показать, как можно решить выявленные проблемы.

Важно убедиться, что ваши 301 редиректы всегда указывают прямо на конечный пункт назначения. Если вам нужно отредактировать старые редиректы, лучше их отредактировать.

Ошибка сервера (5xx)

Это происходит, когда сервер возвращает код ответа HTTP 500 или код внутренней ошибки сервера, когда им не удается загрузить отдельные страницы. Это может быть вызвано множеством проблем с сервером, но чаще всего это вызвано коротким отключением сервера, из-за которого роботы Google не могут сканировать URL-адрес.

То, как вы подходите, частично зависит от того, как часто это происходит. Если такое случается очень долго, беспокоиться не о чем. Через некоторое время ошибка исчезнет. Если страница важна для вас, вы можете вернуть Googlebot на страницу после ошибки, запросив индекс по URL-адресу.

Если ошибка повторяется, поговорите со своим инженером, научите команду и хостинговую компанию совершенствовать свои услуги. Если проблема не исчезнет, ​​подумайте о смене хостинговой компании.

Заключение

В целом, мы верим в предотвращение проблемы, а не в ее решение. Благодаря хорошо продуманной архитектуре веб-сайтов и работе с роботами мы часто составляем абсолютно чистые и понятные отчеты об индексировании в Google Search Console. Однако иногда мы берем клиентов, сайт которых был создан другими, поэтому мы не можем разработать сайт с нуля. По этой причине мы регулярно проверяем этот отчет и смотрим, в какой степени Google просканировал и проиндексировал сайт, после чего мы делаем заметки о ходе работы.

В Семальт, у нас есть команда экспертов, которые готовы вам помочь. У вас есть проблемы, связанные с любым из перечисленных выше пунктов? Или у вас есть вопросы по SEO и индексации сайта? Мы более чем рады помочь вам уточнить детали. Наши услуги также распространяются на обслуживание вашего сайта, что предполагает устранение этих проблем.