voc est aqui: Home  → Colunistas  →  Segredos do Google

De acordo com as Leis 12.965/2014 e 13.709/2018, que regulam o uso da Internet e o tratamento de dados pessoais no Brasil, ao me inscrever na newsletter do portal DICAS-L, autorizo o envio de notificações por e-mail ou outros meios e declaro estar ciente e concordar com seus Termos de Uso e Política de Privacidade.


O significado da vida

Por Rubens Queiroz de Almeida

Data de Publicao: 23 de Outubro de 2007

No filme The Meaning of Life, do grupo ingls Monty Python tem uma cena em que dois operrios batem porta de uma residncia. Ao serem atendidos, eles informam ao morador que vieram buscar os rgos que haviam sido doados para transplante. Eles dizem que vieram buscar os rgos. O morador retruca que no podia fazer a entrega pois estava usando os rgos. Mas no adianta, os rgos so retirados assim mesmo.

Voltemos ao Google. Como ele acha as pginas de seu site? Pulando de galho em galho, isto , de link em link. Existe um protocolo que informa aos sites de busca sobre quais arquivos NO indexar. Chama-se Robots Exclusion Protocol. Estas informaes ficam gravadas em um arquivo chamado robots.txt que fica no diretrio raiz de seu servidor de arquivos. O protocolo funciona por excluso. A que mora o perigo, TUDO o mais vlido. At aqueles arquivos com informaes confidenciais que voc pe na Web pensando que ningum vai descobrir. Um belo dia, voc, ou pior ainda, uma outra pessoa, te informa que achou coisas a seu respeito, que no deveriam ser conhecidos por ningum, pesquisando no Google.

O Google, entretanto, oferece uma outra forma de informar quais arquivos podem ser indexados, os chamados sitemaps. Atravs de um arquivo xml, voc informa ao Google quais so os arquivos que podem ser indexados. Tudo que no estiver no arquivo xml no indexado. Este enfoque muito mais seguro, visto que voc precisa autorizar o que o buscador vai indexar. claro que voc precisa prestar ateno ao contedo deste arquivo medida que for criando novas sees para o seu site. Se voc no autorizar, a sua nova seo nunca vai ser visitada, ao menos no atravs das referncias do Google.

Importante: no preciso que voc tenha um site para ficar exposto. Caso a empresa em que voc trabalhe, escola, universidade, etc, no tome os devidos cuidados, voc pode ficar totalmente exposto. Cabe a voc verificar se isto no est ocorrendo.

O Google realiza pesquisas por tipo de arquivo. Planilhas Excel, por exemplo, podem trazer informaes importantes. Uma pesquisa como

xxxxx filetype:xls

ir retornar todas as planilhas que contenham o termo xxxxx, e xxxxx pode ser qualquer coisa que voc quiser.

Mas o que eu estou fazendo contando tudo isto? Pessoas que estiverem lendo este artigo podero se utilizar destas informaes para obter dados secretos. A m notcia, possivelmente s voc no sabe do que eu estou falando. Os bandidos do hiperespao j conhecem tudo sobre isto, ento melhor voc se familiarizar com este tipo de atividade, para proteger o seu site, suas informaes e, em ltima instncia, voc mesmo e sua famlia.

Parece idiotice, mas a quantidade de informaes claramente confidenciais que se pode obter atravs de algumas consultas simples ao Google estarrecedora. Uma consulta ao Google com o termo Google hacking te leva a diversos sites com muitas informaes do tipo. bom comear a ler seno, algum dia vo bater na sua porta (como o pessoal do Monty Python), com intenes nada boas ...

O filme The Meaning of Life no nos diz qual o sentido da vida. Mas o Google diz. Tente perguntar a ele what is the answer to life, the universe and everything.

Off-Topic

Sempre que eu vejo algum baixando os chamados softwares gratuitos para ambiente Windows e vo clicando loucamente, aceitando todas as condies apresentadas, eu me lembro novamente deste pessoal do Monty Python. Quem sabe voc j no assinou a autorizao de transplante de seus rgos :-)

Recomende este artigo nas redes sociais

 

 

Veja a relao completa dos artigos desta coluna