За последние пару дней Google внес изменения в некоторые документы справки по поиску Google. Обновленные документы включают коды состояния HTTP, робот Googlebot и справочную документацию по размещению вакансий.
Коды состояния HTTP
В документ с кодами состояния HTTP добавлен целый большой раздел для 404 ошибки чего не было в старая версия. Вот новый раздел:
программные ошибки 404
Мягкая ошибка 404 — это когда URL-адрес, который возвращает страницу, сообщает пользователю, что страница не существует. а также 200 (успех) код состояния. В некоторых случаях это может быть страница без основного контента или пустая страница. Такие страницы могут создаваться по разным причинам веб-сервером вашего веб-сайта, системой управления контентом или браузером пользователя. Например:
- Отсутствует включаемый файл на стороне сервера.
- Нарушено соединение с базой данных.
- Пустая страница результатов внутреннего поиска.
- Незагруженный или иным образом отсутствующий файл JavaScript.
Возвращать код состояния 200 (успешно), но затем отображать или предлагать сообщение об ошибке или какую-либо ошибку на странице — плохой пользовательский опыт. Пользователи могут подумать, что страница является активной рабочей страницей, но затем у них появляется какая-то ошибка. Такие страницы исключаются из поиска.
Когда алгоритмы Google определяют, что страница на самом деле является страницей с ошибкой на основе ее содержания, Search Console отобразит мягкую ошибку 404 в интерфейсе сайта. Отчет о покрытии индекса.
Исправление программных ошибок 404
В зависимости от состояния страницы и желаемого результата вы можете решить программные ошибки 404 несколькими способами: Попробуйте определить, какое решение будет лучшим для ваших пользователей.
Страница и контент больше не доступны
Если вы удалили страницу и на вашем сайте нет страницы для замены с аналогичным содержанием, верните 404 (не найдено) или 410 (ушло) код ответа (статуса) страницы. Эти коды состояния указывают поисковым системам, что страница не существует и контент не должен быть проиндексирован.
Если у вас есть доступ к файлам конфигурации вашего сервера, вы можете сделать эти страницы ошибок полезными для пользователей, настроив их. Хорошая персонализированная страница 404 помогает людям находить нужную им информацию, а также предоставляет другой полезный контент, побуждающий людей к дальнейшему изучению вашего сайта. Вот несколько советов по созданию полезной пользовательской страницы 404:
- Четко сообщите посетителям, что страница, которую они ищут, не может быть найдена. Используйте дружелюбный и привлекательный язык.
- Убедитесь, что ваша страница 404 выглядит так же (включая навигацию), как и остальная часть вашего сайта.
- Рассмотрите возможность добавления ссылок на ваши самые популярные статьи или сообщения, а также ссылки на домашнюю страницу вашего сайта.
- Подумайте о том, чтобы предоставить пользователям возможность сообщить о неработающей ссылке.
Пользовательские страницы 404 создаются исключительно для пользователей. Поскольку эти страницы бесполезны с точки зрения поисковой системы, убедитесь, что сервер возвращает код состояния HTTP 404, чтобы предотвратить индексацию страниц.
Страница или контент теперь где-то в другом месте
Если ваша страница была перемещена или имеет явную замену на вашем сайте, верните 301 (постоянное перенаправление), чтобы перенаправить пользователя. Это не помешает их просмотру, а также это отличный способ сообщить поисковым системам о новом местоположении страницы. Использовать Инструмент проверки URL чтобы проверить, действительно ли ваш URL возвращает правильный код.
Страница и контент все еще существуют
Если в остальном хорошая страница была отмечена программной ошибкой 404, вероятно, она неправильно загружалась для робота Googlebot, на ней отсутствовали важные ресурсы или отображалось заметное сообщение об ошибке во время рендеринга. Использовать Инструмент проверки URL для проверки отображаемого содержимого и возвращаемого HTTP-кода. Если отображаемая страница пуста, почти пуста или содержимое содержит сообщение об ошибке, возможно, ваша страница ссылается на множество ресурсов, которые невозможно загрузить (изображения, сценарии и другие нетекстовые элементы), которые можно интерпретировать. как soft 404. Причины, по которым ресурсы не могут быть загружены, включают заблокированные ресурсы (заблокированные robots.txt), наличие слишком большого количества ресурсов на странице, различные ошибки сервера или медленную загрузку или очень большие ресурсы. Совет по этому поводу от Кеничи Сузуки Твиттер.
Googlebot
На роботе Googlebot сколько байтов текстового контента, такого как HTML, робот Googlebot будет сканировать конкретно сюда. Вот новые строки текста:
Робот Googlebot может сканировать первые 15 МБ содержимого HTML-файла или поддерживаемого текстового файла. После первых 15 МБ файла робот Googlebot прекращает сканирование и рассматривает для индексации только первые 15 МБ контента.
Объявления о вакансиях
На объявления о вакансияхGoogle указал, что при использовании свойства jobLocation необходимо также включать свойство addressCountry.
Это изменения, замеченные за последние пару дней в справочной документации Google.
Обсуждение форума на Твиттер.