Informagno | Gestão em TI

Vazamento de documentação do Google detalha funcionamento da Pesquisa Orgânica

A documentação indica mais de 14 mil variáveis sobre como o Google coleta, armazena e utiliza dados sobre páginas em seus produtos, incluindo a Pesquisa Orgânica. 

Nesta terça-feira (28), foi divulgado o vazamento de documentos do Google. São dados internos que apresentam alguns “bastidores” da Pesquisa Orgânica, incluindo potenciais fatores que influenciam no sucesso (e na queda) de páginas na SERP.

Dois especialistas em SEO tiveram acesso aos dados, que parecem ter vindo da Content API Warehouse do Google. Rand Fishkin, co-fundador da SparkToro, e Mike King, fundador da IPullRank, divulgaram os vazamentos e fizeram as primeiras análises, que são apresentadas neste post.

Até aqui, tudo é bastante complexo: não se sabe qual a origem dos vazamentos, ou se as documentações foram publicadas por engano em repositório aberto, ao invés de fechado. São códigos, parâmetros e atributos relacionados a produtos como Pesquisa Orgânica, Assistente do Google, Livros e Pesquisa por Vídeo.

É importante lembrar que os dados não apresentam um quadro completo sobre o Google. Não se sabe se todos os critérios estão em uso, quais são os mais relevantes, como eles interagem dentro dos sistemas do Google, e quais são usados apenas em testes. Apenas sabemos que eles existem.

Ou seja: é uma visão parcial sobre o mecanismo de busca, não uma “lista de hacks” para SEO.

O que exatamente foi vazado?

A documentação apresenta 2.596 módulos, totalizando 14.014 atributos. Não são necessariamente 14 mil fatores de ranqueamento, mas são potenciais elementos que o Google leva em conta para decidir quais resultados mostra em primeiro lugar em seus vários serviços.

Visualmente, um módulo e seus atributos são assim: 

A documentação aparenta ser de março de 2024. 

Qual o impacto do vazamento para SEO?

Apesar das novidades, de forma prática as informações confirmam o que já se sabe: o melhor para crescer em SEO é produzir conteúdo de alta qualidade, atendendo à intenção de busca dos visitantes e gerando autoridade.

Veja abaixo alguns módulos e atributos contidos no documento e o que eles significam para o dia a dia em SEO. 

Lembre-se de que este não é um “manual” de otimização para o Google

Não mude sua estratégia por causa dessa documentação; continue focando seus esforços em produzir bom conteúdo, em gerar boas experiências aos visitantes e em construir uma marca sólida na internet. 

Rafael Simões, CEO da SEO Happy Hour, diz que esse vazamento é “que nem saber que o melhor molho de tomate tem canela”. Você sabe o ingrediente, mas não sabe quando entra na fabricação, nem a quantidade. 

Autoria

O Google armazena dados de autoria sobre páginas, o que é considerado um fator relevante para E-E-A-T. Também há um esforço para relacionar esta autoria com uma entidade do Knowledge Graph, especialmente para posts identificados como notícias.

“Despromoção” de conteúdos

Diversos fatores podem fazer com que uma página não apareça no Google, ou apareça em posições inferiores para determinados tipos de pesquisa. Segundo Mike King, as descrições são “limitadas, mas válidas de mencionar”. Os pontos são:

  • Texto âncora não relacionado ao hyperlink;
  • Baixo engajamento com a página, potencialmente medido por meio de cliques;
  • Má experiência de página (esta é uma suposição de Mike);
  • Resenhas de produto, provavelmente em relação ao update de novembro de 2023;
  • Localização, potencialmente indicando que o Google prefere mostrar os resultados mais relevantes para cada localidade quando for relevante, ao invés de páginas “globais”;
  • Pornografia.

Ter a palavra-chave no domínio também não é considerado um fator altamente relevante para palavras-chaves. Ou seja, ter um site chamado seo.com.br não necessariamente aumenta a visibilidade para termos sobre “otimização para mecanismos de busca”.

Originalidade de conteúdo

Há um parâmetro para medir a “originalidade” de um conteúdo, usado em páginas consideradas curtas. Não há detalhes sobre como é a avaliação, nem o que é considerado “pouco conteúdo”.

Títulos de páginas 

Segundo a documentação, o Google compara tags de título com o termo pesquisado na busca, para encontrar as páginas que melhor combinam. Reforça a importância de escrever boas title tags e headings.

Datas

A documentação mostra diversas formas de identificar datas associadas aos documentos. São as datas informadas, datas presentes na URL e até dentro dos conteúdos.

Um exemplo de uso prático desta informação é na atualização de conteúdos. Quando você atualizar um post de um ano para o outro, precisa realmente editar as informações, não apenas mudar o título de “2023” para “2024”. 

Identificação de sites pessoais

Um dos módulos é chamado “smallPersonalSite”, ou “pequeno site pessoal”. É uma forma do Google diferenciar sites e blogs pequenos, potencialmente os classificando de forma diferente. 

Não fica claro se e como isso acontece, mas Mike King relaciona este campo com as críticas de sites injustamente afetados pelo Helpful Content Update.

Ações para gerar tráfego orgânico

Rand Fishkin mencionou alguns elementos que considera essenciais para ter bons resultados em SEO daqui em diante. São ações práticas e pontos de atenção na hora de montar uma estratégia e alocar recursos. Veja abaixo: 

  • Construção de marca: o Google tem diversas formas de identificar e classificar entidades e itens relacionados a elas, como nomes de marca, sites, redes sociais associadas, entre outros. Por isso, construir autoridade fora do buscador também pode se refletir em melhorias de posicionamento de páginas;
  • E-E-A-T importa, mas nem sempre diretamente: a documentação vazada raramente faz menção direta ao E-E-A-T, mas os critérios de experiência, expertise, autoria e confiabilidade estão “dentro” de diversos outros módulos, mas não há detalhes concretos de como funciona nos sistemas do Google;
  • Intenção de busca é primordial: mesmo se o conteúdo for otimizado, ele dificilmente estará bem posicionado caso não atenda a intenção de busca do visitante. O objetivo do Google é mostrar a informação que julga mais relevante aos visitantes, da maneira mais simples possível;
  • Títulos seguem importantes: fatores “tradicionais” de ranqueamento, como PageRank, já evoluíram e se transformaram. Mas bons títulos, relevantes para o assunto da página, seguem sendo fundamentais;
  • Construção de autoridade: para Rand, isto é central para pequenos e médios negócios. Quando você constrói autoridade e se torna conhecido, tende a alcançar melhores resultados em SEO. Segundo ele, “de 1998 até cerca de 2018 você podia criar um funil de marketing razoavelmente poderoso começando com SEO para o Google. Em 2024, não acho que isto seja realista, pelo menos em inglês, em setores competitivos”. 

Observações importantes

Esta história segue em andamento e gerando novos desdobramentos. Além disso, as documentações mencionam diversos pontos que não foram abordados neste post, como:

  • Avaliações sobre autoridade de sites;
  • Relevância (e não-relevância) de links;
  • Coleta de dados do Google Chrome;
  • Arquitetura dos sistemas do Google;
  • Entre outros.