como-funciona-o-google

Nesta sexta, a coluna “Os Nerds na Vida Real”, do analista de sistemas e administrador deste blog Rodrigo Felga, explica como funciona o mecanismo de busca do Google.

Como funciona o Google

Olá amigos! A coluna deste mês falará um pouco sobre o funcionamento dos motores de busca.

Quando se fala em busca nos dias de hoje, só existe uma palavra que vem à cabeça: Google.

O Google hoje é referência mundial em termos de pesquisa na internet: muitos sites de busca surgiram (e ainda surgem) e não conseguem competir com o gigante. Muito disso se deve ao fato de o Google ter um mecanismo de busca tão eficiente que torna muito fácil achar aquilo que procuramos. A imagem abaixo mostra a participação de mercado do Google nos principais mercados do mundo:

google-quota-mercado-portugal

Os motores de busca funcionam basicamente da mesma forma: primeiramente um robô, chamado de spider ou crawler varre a internet em busca de sites e informações e armazena as informações que encontra em um gigantesco banco de dados.

Esses robôs fazem essa varredura (chamada de indexação) constantemente e não existe uma frequência padrão para que passem em determinado site. O que se sabe é que quanto mais visitas um site tem, mais vezes ele será indexado. Os crawlers coletam informações que ajudam a identificar o assunto daquela página e a sua relevância perante aquele assunto. Toda essa informação vai para o banco de dados para ser posteriormente processada.

Com esses dados “coletados” (que estão distribuídos em milhares de servidores), ocorre então a mágica ao digitarmos alguma coisa na caixa de busca.

O sistema, utilizando mais de 200 variáveis, classifica os resultados encontrados de forma a nos trazer exatamente o que procuramos, tudo isso é feito em milésimos de segundos. Nem sempre funciona, mas temos que admitir que na imensa maioria das vezes conseguimos achar o que buscamos. Tem até uma brincadeira que as pessoas do meio de tecnologia fazem, que é a seguinte: se não está no Google, não existe.

Esse processo de classificação é chamado pelo Google de ‘PageRank’ e é mantido a sete chaves pela empresa, pois é exatamente isso que a diferencia das outras empresas no mercado. É muito interessante perceber a complexidade dessa classificação, que leva em conta fatores como a localização geográfica do que está procurando, o contexto de suas buscas anteriores (seu perfil) entre várias outras coisas. É realmente “mágico”.

O vídeo abaixo (em inglês) mostra um engenheiro do Google explicando de forma bem didática o que ocorre quando realizamos uma busca. Vale a pena ser visto, se você entende ao menos um pouco de inglês, pode ativar as legendas que facilitam o entendimento: