Quinze anos é muito tempo em SEO

Quinze anos é muito tempo em SEO

Tenho estado em um humor introspectivo recentemente.

No início deste ano (15 anos após iniciar a Distilled em 2005), criamos uma nova empresa chamada SearchPilot para se concentrar em nosso teste A / B de SEO e tecnologia de meta-CMS (anteriormente conhecido como ODN Destilado), e fundir a parte de consultoria e conferências do negócio com Brainlabs.

Agora sou CEO da SearchPilot (que é principalmente de propriedade dos acionistas da Distilled) e também sou parceiro de SEO da Brainlabs, então … Lamento a todos, mas vou continuar na indústria de SEO.

Como tal, parece um pouco o fim de um capítulo para mim, e não o fim do livro, mas ainda me fez relembrar o que mudou e o que não mudou nos últimos 15 anos. indústria.

Não posso reivindicar ser um da primeira geração de especialistas em SEO, mas como tenho criado sites desde 1996 e visto o crescimento do Google desde o início, sinto que talvez seja a segunda geração, ou talvez algumas histórias interessantes para compartilhar com aqueles que são novos no jogo.

Esforcei-me para tentar lembrar o que parecia significativo na época e também olhei para trás, para as grandes tendências ao longo do meu tempo na indústria, para reunir o que acho que é uma lista de leitura interessante que a maioria das pessoas que trabalham na web seria bom saber sobre hoje.

As grandes eras da pesquisa

Eu brinquei no início de um apresentação que fiz em 2018 que as grandes eras da pesquisa oscilaram entre as diretivas dos mecanismos de pesquisa e os mecanismos de pesquisa rapidamente se afastando dessas diretivas quando viram o que os webmasters realmente faziam:

Embora esse slide tenha sido um pouco irônico, acho que há algo para se pensar sobre as eras como:

  1. Construir sites: você tem um site? Você gostaria de um site? É difícil de acreditar agora, mas nos primeiros dias da web, muitas pessoas precisaram ser persuadidas a colocar seus negócios online.
  2. Palavras-chave: a recuperação de informações básicas tornou-se a recuperação de informações adversárias à medida que os webmasters perceberam que podiam manipular o sistema com preenchimento de palavras-chave, texto oculto e muito mais.
  3. Links: à medida que a escala da web cresceu além dos diretórios selecionados pelo usuário, algoritmos de busca baseados em links começaram a dominar.
  4. Não esses links: algoritmos baseados em links começaram a dar lugar a algoritmos baseados em links adversários conforme os webmasters trocavam, compravam e manipulavam links no gráfico da web.
  5. Conteúdo para a cauda longa: ao lado dessa era, o comprimento do cauda longa começou a ser melhor compreendido tanto pelos webmasters quanto pelo próprio Google – e era do interesse de ambas as partes criar grandes quantidades de conteúdo (muitas vezes obscuro) e indexá-lo quando fosse necessário.
  6. Não esse conteúdo: talvez previsivelmente (veja a tendência aqui?), A qualidade média do conteúdo retornado nos resultados de pesquisa caiu drasticamente e, portanto, vemos os primeiros fatores de classificação de aprendizado de máquina na forma de tentativas de avaliar a “qualidade” (ao lado da relevância e autoridade do site).
  7. Aprendizado de máquina: indiscutivelmente, tudo a partir desse ponto foi uma aventura no aprendizado de máquina e inteligência artificial, e também aconteceu durante a carreira da maioria dos profissionais de marketing que trabalham em SEO atualmente. Então, embora eu ame escrever sobre essas coisas, voltarei a isso outro dia.

História do SEO: momentos cruciais

Embora eu tenha certeza de que há histórias interessantes a serem contadas sobre a era pré-Google de SEO, não sou a pessoa certa para contá-las (se você tiver um ótimo recurso, por favor, deixe-o nos comentários), então vamos começar cedo na jornada do Google:

Tecnologia fundamental do Google

Mesmo se você estiver entrando no SEO em 2020, em um mundo de fatores de classificação aprendidos com a máquina, eu ainda recomendo voltar e ler o trabalho acadêmico inicial surpreendentemente acessível:

Se você não estava usando a web naquela época, provavelmente é difícil imaginar a grande melhoria do algoritmo baseado em PageRank do Google em relação ao “estado da arte” na época (e é difícil lembrar, mesmo para aqueles de nós que foram):

IPO do Google

Em mais “coisas que são difíceis de lembrar claramente”, na época do IPO do Google em 2004, muito poucas pessoas esperavam que o Google se tornasse uma das empresas mais lucrativas de todos os tempos. No início, os fundadores falaram de seu desdém pela publicidade e fizeram experiências com anúncios baseados em palavras-chave com certa relutância. Por causa dessa atitude, mesmo dentro da empresa, a maioria dos funcionários não sabia que foguete estavam construindo.

Desta época, eu recomendo a leitura da carta de IPO dos fundadores (veja este ótimo artigo de Danny Sullivan – quem é irônico agora @SearchLiaison no Google):

“Nossos resultados de pesquisa são os melhores que sabemos produzir. Eles são imparciais e objetivos, e não aceitamos pagamento por eles ou para inclusão ou atualização mais frequente. ”

“Porque não cobramos comerciantes pela inclusão no Froogle [now Google shopping], nossos usuários podem navegar por categorias de produtos ou conduzir pesquisas de produtos com a confiança de que os resultados que fornecemos são relevantes e imparciais. ” – Arquivo S1

Além do que, além do mais, No Plex é um livro agradável publicado em 2011 por Steven Levy. Ele conta a história do que o então CEO Eric Schmidt chamou (na época do IPO) de “a estratégia de esconder”:

“Aqueles que conheciam o segredo … foram instruídos com bastante firmeza a manter a boca fechada sobre isso.”

“O que o Google estava escondendo era como decifrou o código para ganhar dinheiro na Internet.”

Felizmente para o Google, para os usuários e até mesmo para os profissionais de marketing de busca orgânica, descobriu-se que isso não era realmente incompatível com seus ideais puros dos dias pré-IPO porque, como relata Levy, “em testes repetidos, os pesquisadores ficavam mais felizes com as páginas com anúncios do que aqueles onde foram suprimidos ”. Ufa!

Indexar tudo

Em abril de 2003, o Google adquiriu uma empresa chamada Applied Semantics e colocar em movimento um série de eventos que eu acho que pode ser a parte mais subestimada da história do Google.

A tecnologia de semântica aplicada foi integrada à sua própria tecnologia de anúncios contextuais para formar o que se tornou o AdSense. Embora a receita do AdSense sempre tenha sido ofuscada pelo AdWords (agora apenas “Google Ads”), é difícil subestimar sua importância na história do SEO.

Ao democratizar a monetização de conteúdo na web e permitir que todos sejam pagos pela produção de conteúdo obscuro, ele financiou a criação de quantidades absurdas desse conteúdo.

A maior parte desse conteúdo nunca teria sido vista se não fosse pela existência de um mecanismo de pesquisa que se destacou em sua capacidade de fornecer ótimos resultados para pesquisas de cauda longa, mesmo que essas pesquisas fossem incrivelmente raras ou nunca tivessem sido vistas antes.

Dessa forma, o mecanismo de pesquisa do Google (e o negócio de publicidade em pesquisa) formaram um poderoso volante com seu negócio AdSense, permitindo o financiamento da criação de conteúdo de que precisava para se diferenciar com o maior e mais completo índice da web.

Porém, como acontece com tantos capítulos da história, ele também criou um monstro na forma de conteúdo de baixa qualidade ou mesmo gerado automaticamente, que acabaria por levar a crises de relações públicas e esforços massivos para consertar.

Se você estiver interessado na era do índice de tudo, você pode ler mais de minhas idéias sobre isso em slide 47+ de From the Horse’s Mouth.

Spam da web

o primeiras formas de spam na internet havia várias formas de mensagens, que chegaram ao mainstream como spam de e-mail. Durante o início dos anos 2000, o Google começou a falar sobre o problema que eles denominaram “spam da web” (a primeira menção que vi de spam de link foi em uma apresentação de Amit Singhal de 2005, intitulada Desafios na execução de um mecanismo de pesquisa comercial na Web [PDF])

Suspeito que até mesmo as pessoas que começam em SEO hoje podem ter ouvido falar de Matt Cutts – o primeiro chefe de spam na Web – já que ele ainda é mencionado com frequência, apesar de não ter trabalhado no Google desde 2014. Gostei disso Apresentação de 2015 que fala sobre a trajetória de sua carreira no Google.

Era da qualidade da pesquisa

Com o tempo, como resultado da natureza oposta dos webmasters tentando ganhar dinheiro em relação ao Google (e outros) tentando fazer o melhor mecanismo de pesquisa possível, o spam puro da web não era o único problema de qualidade que o Google enfrentava. O jogo de gato e rato de manipulação de localização – particularmente de conteúdo na página, links externos e texto âncora – seria uma característica definidora da próxima década ou mais de pesquisa.

Foi depois da apresentação de Singhal acima que Eric Schmidt (então CEO do Google) disse, “As marcas são a solução, não o problema … As marcas são como você separa a fossa”.

Aqueles que são mais novos no setor provavelmente já experimentaram algumas atualizações do Google (como “atualizações básicas” recentes) em primeira mão e provavelmente já ouviram falar de algumas atualizações mais antigas específicas. Mas “Vince”, que veio depois de “Flórida” (a primeira grande atualização confirmada do Google), e lançado logo após os pronunciamentos de Schmidt sobre a marca, foi particularmente notável por favorecer grandes marcas. Se você não acompanhou todo o histórico, pode ler sobre as principais atualizações anteriores aqui:

Uma verdadeira ameaça à reputação

Como mencionei acima na seção do AdSense, havia fortes incentivos para os webmasters criarem toneladas de conteúdo, visando, assim, a florescente cauda longa da pesquisa. Se você tivesse um domínio forte o suficiente, o Google rastrearia e indexaria um número imenso de páginas e, para consultas obscuras o suficiente, qualquer conteúdo correspondente seria classificado. Isso desencadeou o rápido crescimento das chamadas “fazendas de conteúdo” que extraíram dados de palavras-chave de qualquer lugar que pudessem e geraram conteúdo de correspondência de palavras-chave de baixa qualidade. Ao mesmo tempo, os sites estavam tendo sucesso permitindo que grandes bancos de dados de conteúdo fossem indexados, mesmo como páginas muito finas, ou permitindo que um grande número de páginas de conteúdo gerado pelo usuário fossem indexadas.

Essa era uma ameaça real à reputação do Google e saiu da busca e da câmara de eco de SEO. Tornou-se um pesadelo de comunidades como Hacker News e StackOverflow, que Matt Cutts enviou uma atualização pessoal para a comunidade Hacker News quando o Google lançou uma atualização com o objetivo de corrigir um sintoma específico – ou seja, que os sites de raspagem estavam rotineiramente ultrapassando o conteúdo original que estavam copiando.

Pouco depois, o Google lançou a atualização inicialmente chamada de “atualização do fazendeiro”. Depois de lançado, descobrimos que foi possível devido a uma descoberta de um engenheiro chamado panda, por isso foi chamada de atualização do “grande Panda” internamente no Google e, desde então, a comunidade SEO tem chamado principalmente de atualização do Panda.

Embora tenhamos especulado que o funcionamento interno da atualização foi um dos primeiros usos reais do aprendizado de máquina no núcleo do algoritmo de pesquisa orgânica do Google, os recursos que estava modelando foram mais facilmente entendidos como fatores de qualidade centrados no ser humano, e assim nós começasse recomendar mudanças direcionadas a SEO para nossos clientes com base nos resultados de pesquisas de qualidade humana.

Tudo vai primeiro no celular

Eu dei um apresentação no SearchLove London em 2014 onde falei sobre o crescimento e escala inacreditáveis ​​dos dispositivos móveis e sobre como demoramos para perceber o quão seriamente o Google estava levando isso. Eu destaquei a surpresa que muitos sentiram ao ouvir que o Google estava desenvolvendo primeiro o celular:

“No final do ano passado, lançamos grandes melhorias de design para pesquisa em dispositivos móveis e tablets. Hoje, transportamos várias dessas mudanças para a experiência do desktop. ” – Jon Wiley (engenheiro chefe da Pesquisa do Google falando no Google+, o que significa que não há nenhum lugar para o link como uma referência perfeita para a citação, mas é referenciado aqui bem como na minha apresentação).

Essa surpresa veio apesar do fato de que, na época em que fiz esta apresentação em 2014, sabíamos que a pesquisa para celular havia começado a canibalizar a pesquisa para desktop (e vimos a primeira queda nos volumes de pesquisa para desktop):

E aconteceu mesmo que as pessoas estivessem começando a dizer que o primeiro ano em que o Google gerando a maior parte de sua receita no celular estava a menos de dois anos de distância:

Escrevendo isso em 2020, parece que internalizamos totalmente o quão importante é o celular, mas é interessante lembrar que demorou um pouco para entender.

O aprendizado de máquina se torna a norma

Desde a atualização do Panda, o aprendizado de máquina foi mencionado cada vez mais nas comunicações oficiais do Google sobre atualizações de algoritmos e estava envolvido em ainda mais. Sabemos que, historicamente, houve resistência de alguns setores (inclusive de Singhal) em usar o aprendizado de máquina no algoritmo principal devido à maneira como impedia os engenheiros humanos de explicar os resultados. Em 2015, Sundar Pichai assumiu como CEO, afastou Singhal (embora isso possa ter sido por outras razões) e instalou ventiladores de AI / ML em funções-chave.

Faz um círculo completo

Antes da atualização da Flórida (na verdade, até o Google lançar uma atualização que eles chamavam de Fritz no verão de 2003), os resultados da pesquisa costumavam ser embaralhados regularmente em um processo apelidado de Google Dance:

A maioria das coisas tem se movido mais em tempo real desde então, mas as recentes “atualizações principais” parecem ter trazido de volta esse tipo de dinâmica em que as mudanças acontecem na programação do Google, em vez de com base nos cronogramas das mudanças do site. Eu tenho especulou que isso ocorre porque as “atualizações básicas” são na verdade o Google retreinando um modelo de aprendizado profundo em massa que é muito personalizado para o formato da web da época. Seja qual for a causa, nossa experiência de trabalho com uma ampla gama de clientes é consistente com o linha oficial do Google que:

Amplas atualizações de núcleo tendem a acontecer a cada poucos meses. O conteúdo que foi afetado por um pode não se recuperar – supondo que melhorias tenham sido feitas – até que a próxima atualização ampla do núcleo seja lançada.

Vincular tendências e descobertas recentes como esta a uma história antiga, como o Google Dance, é apenas uma das maneiras pelas quais conhecer a história do SEO é “útil”.

Se você está interessado em tudo isso

Espero que esta viagem pelas minhas memórias tenha sido interessante. Para vocês que também trabalharam na indústria ao longo desses anos, o que eu perdi? Quais são os marcos realmente grandes de que você se lembra? Deixe-os nos comentários abaixo ou entre em contato comigo Twitter.

Se você gostou deste passeio pela estrada da memória, também pode gostar da minha apresentação Da boca do cavalo, onde tento usar declarações oficiais e não oficiais do Google para revelar o que realmente está acontecendo nos bastidores e tento dar algumas dicas para fazer o mesmo:


Para nos ajudar a atendê-lo melhor, considere responder a 2020 Moz Blog Reader Survey, que pergunta sobre quem você é, quais desafios você enfrenta e o que você gostaria de ver mais no Moz Blog.

Faça a pesquisa



Fonte

Deixe uma resposta

Fechar Menu