9, Июн 2022
Исправление отчета о покрытии Google Search Console «Исключенные страницы»


Google Search Console позволяет вам взглянуть на свой сайт глазами Google.

Вы получаете информацию о производительности вашего веб-сайта, а также сведения о работе страницы, проблемах безопасности, сканировании или индексации.

Исключенная часть отчета об индексировании Google Search Console предоставляет информацию о статусе индексации страниц вашего веб-сайта.

Узнайте, почему некоторые страницы вашего веб-сайта попадают в отчет «Исключенные» в Google Search Console и как это исправить.

Что такое отчет о покрытии индекса?

Отчет о покрытии Google Search Console показывает подробную информацию о статусе индекса веб-страниц вашего веб-сайта.

Ваши веб-страницы могут попасть в одну из следующих четырех групп:

  • Ошибка: страницы, которые Google не может индексировать. Вам следует просмотреть этот отчет, поскольку Google считает, что вы можете захотеть проиндексировать эти страницы.
  • Действует с предупреждениями: страницы, которые индексирует Google, но есть некоторые проблемы, которые необходимо решить.
  • Действительный: страницы, которые индексирует Google.
  • Исключенный: страницы, исключенные из индекса.

Что такое исключенные страницы?

Google не индексирует страницы в корзинах ошибок и исключений.

Основное различие между ними заключается в следующем:

  • Google считает, что страницы с ошибкой должны быть проиндексированы, но не может из-за ошибки, которую вы должны проверить. Например, неиндексируемые страницы, отправленные через XML-карту сайта, попадают в категорию «Ошибка».
  • Google считает, что страницы из корзины «Исключенные» действительно должны быть исключены, и это ваше намерение. Например, неиндексируемые страницы, не отправленные в Google, появятся в отчете об исключении.
    Исключенные страницы в GSCСкриншот из Google Search Console, май 2022 г.

Однако Google не всегда понимает это правильно, и страницы, которые должны быть проиндексированы, иногда попадают в список исключенных.

К счастью, Google Search Console предоставляет причину для помещения страниц в определенное ведро.

Вот почему рекомендуется тщательно просматривать страницы во всех четырех корзинах.

Теперь давайте погрузимся в сегмент «Исключенные».

Возможные причины исключенных страниц

Есть 15 возможных причин, по которым ваши веб-страницы находятся в группе исключений. Давайте подробнее рассмотрим каждый из них.

Исключено тегом «noindex»

Это URL-адреса с тегом «noindex».

Google считает, что вы на самом деле хотите исключить эти страницы из индексации, потому что вы не указываете их в XML-карте сайта.

Это могут быть, например, страницы входа, страницы пользователей или страницы результатов поиска.

Консоль поиска Google Исключено тегом noindex

Предложенные действия:

  • Просмотрите эти URL-адреса чтобы быть уверенным, что ты хотите исключить их из индекса Google.
  • Проверьте, действительно ли присутствует тег «noindex» по этим URL-адресам.
READ  США миновали точку невозврата в процессе перехода на электромобили • Interpult Studio

Просканировано – пока не проиндексировано

Google просканировал эти страницы и до сих пор не проиндексировал их.

Как говорит Google в своем документация, URL-адрес в этом сегменте «может быть или не быть проиндексирован в будущем; нет необходимости повторно отправлять этот URL для сканирования».

Многие SEO-специалисты заметили, что у сайта могут быть серьезные проблемы с качеством, если многие нормальные и индексируемые страницы попадают в категорию «Просканировано» — в настоящее время не проиндексированы.

Это может означать, что Google просканировал эти страницы и не считает, что они представляют достаточную ценность для индексации.

Консоль поиска Google просканирована, в настоящее время не проиндексированаСкриншот из Google Search Console, май 2022 г.

Предложенные действия:

  • Проверьте свой сайт с точки зрения качества и еда.

Обнаружен — в настоящее время не проиндексирован

Как говорится в документации Google, страница в разделе «Обнаружено» — в настоящее время не проиндексированная «была найдена Google, но еще не просканирована».

Google не сканировал страницу, чтобы не перегружать сервер. Большое количество страниц в этом сегменте может означать, что у вашего сайта проблемы с краулинговым бюджетом.

Обнаружена консоль поиска Google, которая в настоящее время не проиндексированаСкриншот из Google Search Console, май 2022 г.

Предложенные действия:

  • Проверьте работоспособность вашего сервера.

Не найдено (404)

Это страницы, которые вернули код состояния 404 (не найдено) по запросу Google.

Это не URL-адреса, отправленные в Google (т. е. в карте сайта XML), а вместо этого Google обнаружил эти страницы (т. е. через другой веб-сайт, который ссылался на старую страницу, удаленную давным-давно.

Исключенные страницы в GSC - 404Скриншот из Google Search Console, май 2022 г.

Предложенные действия:

  • Просмотрите эти страницы и решить, следует ли реализовать редирект 301 на рабочую страницу.

Софт 404

Soft 404 в большинстве случаев представляет собой страницу ошибки, которая возвращает код состояния OK (200).

В качестве альтернативы, это также может быть тонкая страница, которая практически не содержит контента и использует такие слова, как «извините», «ошибка», «не найдено» и т. д.

Soft 404 в Google Search ConsoleСкриншот из Google Search Console, май 2022 г.

Предложенные действия:

  • В случае страницы с ошибкой не забудьте вернуть код состояния 404.
  • Для тонких страниц контента добавить уникальный контент чтобы помочь Google распознать этот URL как отдельную страницу.

Страница с переадресацией

Все перенаправленные страницы на вашем веб-сайте попадут в корзину «Исключенные», где вы сможете увидеть все перенаправленные страницы, обнаруженные Google на вашем веб-сайте.

Страница с переадресацией в Google Search ConsoleСкриншот из Google Search Console, май 2022 г.

Предложенные действия:

  • Просмотрите перенаправленные страницы чтобы убедиться, что перенаправления были реализованы намеренно.
  • Некоторые плагины WordPress автоматически создают редиректы. когда вы меняете URL-адрес, поэтому вы можете время от времени просматривать их.
READ  Волатильность расширенных результатов видео от Google, июль 2022 г. | Приложение схемы

Дублировать без выбранного пользователем канонического

Google считает, что эти URL-адреса являются дубликатами других URL-адресов на вашем веб-сайте и поэтому не должны индексироваться.

Вы не установили канонический тег для этих URL-адресов, и Google выбрал канонический тег на основе других сигналов.

Предложенные действия:

  • Проверьте эти URL-адреса, чтобы проверить, какие канонические URL-адреса Google выбрал для этих страниц.

Дубликат, Google выбрал другой канонический код, чем пользователь

Исключенная страница в GSCСкриншот из Google Search Console, май 2022 г.

В этом случае вы объявили канонический URL-адрес для страницы, но даже в этом случае Google выбрал другой URL-адрес в качестве канонического. В результате выбранный Google канонический индексируется, а выбранный пользователем — нет.

Возможные действия:

  • Проверьте URL-адрес, чтобы проверить, какой канонический Гугл выбрал.
  • Проанализируйте возможные сигналы, которые заставили Google выбрать другой канонический (т.е. внешние ссылки).

Дублирующийся отправленный URL-адрес, не выбранный как канонический

Разница между вышеуказанным статусом и этим статусом заключается в том, что в случае последнего вы отправляете URL-адрес в Google для индексации, не объявляя его канонический адрес, и Google считает, что другой URL-адрес будет лучшим каноническим.

В результате выбранный Google канонический индексируется, а не отправленный URL.

Предложенные действия:

  • Проверьте URL-адрес, чтобы проверить, какой канонический Гугл выбрал.

Альтернативная страница с правильным каноническим тегом

Это просто дубликаты страниц, которые Google распознает как канонические URL-адреса.

Эти страницы имеют канонические адреса, указывающие на правильный канонический URL.

Предложенные действия:

  • В большинстве случаев, никаких действий не требуется.

Заблокировано robots.txt

Это страницы, которые robots.txt заблокировал.

Анализируя это ведро, имейте в виду, что Google все равно может проиндексировать эти страницы (и отобразить их в «испорченном» виде), если Google найдет упоминание о них, например, на других сайтах.

Предложенные действия:

  • Проверьте, не заблокированы ли эти страницы с помощью тестера robots.txt.
  • Добавьте тег noindex и удалите страницы из robots.txt. если вы хотите удалить их из индекса.

Заблокировано инструментом удаления страниц

READ  Google считает, что ее новый язык программирования может превзойти C++

В этом отчете перечислены страницы, удаление которых было запрошено инструментом удаления.

Имейте в виду, что этот инструмент удаляет страницы из результатов поиска только временно (90 дней) и не удаляет их из индекса.

Предложенные действия:

  • Убедитесь, что страницы, отправленные с помощью инструмента удаления должны быть временно удалены или иметь тег noindex.

Заблокирован из-за несанкционированного запроса (401)

В случае с этими URL робот Googlebot не смог получить доступ к страницам из-за запроса авторизации (код состояния 401).

Если эти страницы не должны быть доступны без авторизации, вам не нужно ничего делать.

Google просто информирует вас о том, с чем он столкнулся.

401 страница в гуглеСкриншот из Google Search Console, май 2022 г.

Предложенные действия:

  • Проверьте, действительно ли эти страницы требуют авторизации..

Заблокирован из-за запрета доступа (403)

Этот код состояния обычно является результатом какой-либо ошибки сервера.

403 возвращается, когда предоставленные учетные данные неверны, и доступ к странице не может быть предоставлен.

В качестве документация Google состояния:

«Бот Googlebot никогда не предоставляет учетные данные, поэтому ваш сервер неправильно возвращает эту ошибку. Эта ошибка должна быть либо исправлена, либо страница должна быть заблокирована robots.txt или noindex».

Что можно узнать из исключенных страниц?

Внезапные и огромные всплески в определенном сегменте исключенных страниц могут указывать на серьезные проблемы с сайтом.

Вот три примера всплесков, которые могут указывать на серьезные проблемы с вашим сайтом:

  • Огромный всплеск количества страниц Not Found (404) может указывать на неудачную миграцию. где URL-адреса были изменены, но не были реализованы перенаправления на новые адреса. Это также может произойти после того, как, например, неопытный человек изменил слаг сообщений в блоге и, как следствие, изменил URL-адреса всех блогов.
  • Огромный всплеск обнаруженных — в настоящее время не проиндексированных и не просканированных – в настоящее время не индексируется, может указывать на то, что ваш сайт был взломан. Обязательно просмотрите примеры страниц, чтобы убедиться, что это действительно ваши страницы или они были созданы в результате взлома (например, страницы с китайскими иероглифами).
  • Огромный всплеск тега Excluded by ‘noindex’ также может указывать на неудачный запуск и миграцию.. Это часто происходит, когда новый сайт отправляется в работу вместе с тегами «noindex» с тестового сайта.

Резюме

Вы можете многое узнать о своем веб-сайте и о том, как робот Googlebot взаимодействует с ним, благодаря разделу «Исключенные» отчета GSC Coverage.

Независимо от того, являетесь ли вы новичком в поисковой оптимизации или уже имеете несколько лет опыта, сделайте ежедневной привычкой проверять консоль поиска Google.

Это может помочь вам обнаружить различные технические проблемы SEO, прежде чем они превратятся в настоящие бедствия.

Дополнительные ресурсы:


Рекомендуемое изображение: Milan1983/Shutterstock





Source link