Como corrigir erros de rastreamento no Google Search Console

Atualizado em 12 de noviembre de 2023

Quer queiramos ou não, o Google é o líder indiscutível do mercado em motores de busca. E se você sabe um pouco sobre SEO, sabe que o Google é mais do que um mecanismo de busca. À medida que mais e mais usuários encontram o conteúdo que procuram por meio de mecanismos de pesquisa, o Google fornece cada vez mais ferramentas de otimização e análise de pesquisa. O Google Search Console, uma ferramenta que começou como Google Webmaster Tools, é um deles. E neste artigo, mostraremos como usar o Google Search Console para livrar-se de erros de rastreamento.

Mas o que são erros de rastreamento? Como e por que eles ocorrem? Como eles afetam seu site? Essas perguntas e muito mais serão respondidas neste artigo. É sobre isso que gostaríamos de falar:

  • O que é um erro de rastreamento?
  • Tipos de erros de rastreamento e como os erros de rastreamento afetam seu site
  • Erros do site e como corrigi-los
  • Erros de URL e como corrigi-los

Como você deve ter notado, os erros de rastreamento têm a ver com a mecânica básica dos mecanismos de pesquisa. Você pode conferir o artigo vinculado para uma visão mais detalhada, mas a essência é esta: os mecanismos de pesquisa não pesquisam na Internet. Isso demoraria muito.

Em vez disso, os mecanismos de pesquisa usam softwares chamados bots, robôs ou rastreadores para pesquisar sites e criar um índice e, em vez disso, pesquisar o índice. O processo de criação de um índice é chamado de rastreamento. Um bot rastreia uma página, adiciona-a ao índice e adiciona todos os links de uma página à lista de links que ainda não rastreou. Idealmente, cada link em um site levará a uma página.

Conseqüentemente, um erro de rastreamento é uma situação em que um mecanismo de pesquisa tenta rastrear uma página da web, mas falha. Um bot tenta acessar uma página de um site, mas não consegue.

Tipos de erros de rastreamento e como os erros de rastreamento afetam seu site

Para fins de recursos do Google, existem dois tipos de erros de rastreamento: lugar e erros de URL .

Se você tem um erro no site , significa que todo o seu site não pode ser rastreado. Isso é conhecido no jargão do SEO como uma coisa muito ruim. Se o seu site não puder ser rastreado, significa que não pode ser indexado: todo o seu site, incluindo todo o seu conteúdo, ficará invisível para os usuários dos mecanismos de pesquisa. Ainda pode ser acessível digitando o URL no campo URL do seu navegador, mas quando foi a última vez que você fez isso?

Se, por outro lado, o seu site tiver um erro de URL , significa que os bots não podem rastrear uma página específica do seu site. Este não é um problema grave (ou pelo menos não tão grave quanto um erro do site) e geralmente é culpa sua: muitos erros de URL vêm de links internos.

Você pode ver se o seu site apresenta algum erro navegando até o Google Search Console e selecionando Cobertura/Erros no menu do lado esquerdo.

Cobertura

Erros do site e como corrigi-los

Existem três tipos de erros de site: erros de DNS, erros de servidor e erros de falha de bot. Discutiremos cada um em breve.

Erros de DNS

DNS significa Sistema nomes de domínio , e é o que permite navegar na Internet sem saber o endereço IP de cada site. Se o Google Search Console gerar esse erro, significa que Não consigo acessar seu site . Pode ser temporário e, nesse caso, os bots do Google tentarão rastreá-lo mais tarde, mas se o erro persistir, significa que o Google tentou localizá-lo várias vezes.

Para testar esse problema, use uma ferramenta como downforeveryoneorjustme.com para testar se o site está fora do ar e entre em contato com seu provedor de domínio imediatamente, pois o problema provavelmente é causado por ele. Pode ser um problema temporário, mas é improvável que você tenha causado um erro de DNS sozinho e é igualmente improvável que consiga corrigi-lo, a menos que seja seu próprio provedor de domínio.

Erros de servidor

Um erro do servidor provavelmente significa que a solicitação expirou: seu servidor está demorando muito para responder . Um rastreador está tentando visitar e indexar seu site, mas o tempo que leva para carregar é muito longo para ser prático. Ao contrário de um erro de DNS, um erro de servidor significa que o Google pode acessar seu site, mas a página demora muito para carregar. Alternativamente, pode significar que seu site está sobrecarregado de solicitações, seja por meio de um grande número de visitantes ou de um ataque DDOS.

Ferramenta Inspecionar URL É usado para verificar como os bots do Google acessam um site. Ele está localizado no lado direito do console.

Inspecionar URL

Ferramenta Teste a falha do Robots.txt usado para verificar a configuração do seu arquivo robôs.txt que discutiremos na próxima seção.

Se você tiver um erro no servidor, use a ferramenta Inspecionar URL para descobrir exatamente qual desses problemas ocorreu:

  • tempo limite: o servidor demorou muito para responder aos bots do Google;
  • cabeçalho truncado: o servidor fechou a conexão antes que o Google pudesse receber o cabeçalho completo;
  • redefinição de conexão: a conexão foi redefinida no meio da resposta;
  • resposta truncada: a conexão terminou antes que o Google pudesse receber uma resposta completa;
  • conexão recusada: o servidor recusou-se a se conectar aos bots do Google;
  • falha na conexão: o servidor estava inativo ou inacessível;
  • tempo limite de conexão: A conexão demorou muito para ser processada;
  • sem resposta: a conexão terminou antes de qualquer resposta ser enviada.

Eles podem ser temporários ou surgir de problemas internos do site. Explicar cada um deles em detalhes está além do escopo deste artigo, mas encaminharemos você para a ajuda do Google Search Console assim que tiver dados suficientes para continuar.

Falha do robô

Uma falha do robô significa que Os bots do Google não conseguem acessar o arquivo robôs.txt do seu site. Não continuaremos com o arquivo robôs.txt (consulte o artigo vinculado para obter mais informações), mas daremos a essência: ele é usado para controlar o comportamento de bots de mecanismos de pesquisa por vários motivos. No entanto, você não precisa dele para ter um site totalmente funcional. O Google interpretará isso como se você deseja que todo o seu site seja rastreado e indexado.

Ainda assim, se você tiver um arquivo robôs.txt , você precisa ter certeza de que está configurado corretamente. Certifique-se de que o arquivo não contenha esta linha:

Esta linha torna todo o seu site indisponível para os bots do Google. Se quiser que seu site seja indexado, você deve excluir esta linha. No entanto, é melhor deixar a alteração do código do seu site para desenvolvedores profissionais. Sugerimos que você procure ajuda caso não se sinta seguro. Lembre-se de que é melhor não ter nenhum arquivo robots.txt do que ter um arquivo mal configurado.

Erros de URL e como corrigi-los

Erros de URL vêm em vários sabores. Iremos discuti-los em termos gerais.

Erros 404

Um erro 404 significa que não consigo encontrar o conteúdo de uma página . Discutir maneiras de corrigir um erro 404 merece um artigo próprio, e você pode conferir o link para uma descrição detalhada. De modo geral, porém, os erros 404 não afetam sua classificação no Google. Se as páginas que retornam o 404 não forem essenciais, não é um assunto urgente, mas você ainda deve corrigi-las quando tiver tempo. Se páginas essenciais do seu site forem afetadas, você deve corrigi-lo usando os métodos descritos no artigo vinculado ou configurar um redirecionamento 301, se apropriado.

Erros 404 suaves

Erros soft 404 ocorrem quando uma página se assemelha para uma página 404 mas não é. Quem pensa em uma página 404? Para o Google, neste caso. O Google é muito bom em adivinhar qual é o conteúdo de uma página. Se um URL não tiver muito “conteúdo principal (ou seja, conteúdo diferente de links, cabeçalhos, menus e similares)”, ele terá um status HTTP de 200 (encontrado), mas não muito no que o Google chama de conteúdo útil.

Se você quiser evitar esses erros, preencha suas páginas soft 404 com conteúdo real ou forneça redirecionamentos 301 quando apropriado. Alternativamente, se a página desaparecer permanentemente, permita 410 para a resposta do cabeçalho do servidor.

Acesso negado

No caso de um erro 404, os bots do Google não conseguem encontrar uma página. Um erro de acesso negado Isso significa que eles não podem. Isso geralmente significa que ele está bloqueado pelo seu provedor de hospedagem, seu arquivo robôs.txt ou você mesmo solicitou que o usuário fizesse login para visualizar a página.

Agora, no caso dos dois primeiros, pode ser exatamente o que você pretendia: se você não quiser que uma página seja rastreada, seu arquivo robôs.txt Deve conter a configuração apropriada. Da mesma forma, se você configurou um acesso pago ou uma barreira de login semelhante, você não deseja que seu conteúdo esteja disponível para usuários casuais de mecanismos de pesquisa. No entanto, se o seu provedor de hospedagem bloqueou o seu conteúdo, você deve resolver o problema com ele.

Erros específicos de dispositivos móveis

Eles normalmente ocorrem em sites que não respondem e envolvem principalmente redirecionamentos incorretos para um site móvel independente. Para corrigi-los, verifique seus redirecionamentos e seu arquivo robots.txt conforme descrito na seção de falhas de robôs.

Erros de notícias do Google

Se o seu site estiver no Google Notícias, você poderá receber erros de rastreamento se o seu o conteúdo não está formatado para o Google Notícias (falhas na estrutura do cabeçalho, por exemplo) ou podem ocorrer quando o Google pensa que seu conteúdo não é uma notícia. Você deve resolvê-los caso a caso.

Erros de malware

Bug de malware significa que o Google encontrou malware em uma página . Novamente, a proteção contra malware precisa ser resolvida caso a caso.

Erros de servidor e erros de DNS

Erros de servidor e erros de DNS pode aparecer no relatório de erros de URL em seu relatório do Google Search Console. Isso significa que eles são iguais aos erros em todo o site, exceto que afetam URLs específicos. Você deve tratá-los da mesma forma que trataria erros do mesmo tipo em todo o site.

Marcar erros de URL como corrigidos

Se você suspeitar que o problema é temporário ou decorre de um arquivo robôs.txt ou um acesso pago configurado da maneira que você deseja, você pode marcar todos os erros de URL como corrigidos . Isso não afetará o desempenho do seu site.

Em conclusão

Como você pode ver, o Google Search Console é uma importante ferramenta de diagnóstico. para mim Para manter seu site funcional e seus visitantes satisfeitos, verifique regularmente se há erros. Grande parte do trabalho de solução de problemas é árduo, mas algumas coisas importantes também são urgentes. Com o Google Search Console e este guia prático, você saberá qual é qual.

Scroll al inicio