você está aqui: Home  → Arquivo de Mensagens

Portais Corporativos 15 - Classificação e busca de informações, parte 2

Por Cesar Brod

Data de Publicação: 19 de Novembro de 2007

No artigo da semana passada discutimos os tipos de informações que estão presentes em um portal, algumas de classificação mais fácil, outras nem tanto. Antes de voltarmos à informação nos portais, falemos um pouco sobre a função de um bibliotecário.

Durante um tempo considerável da minha atividade profissional, participei da gestão de um projeto que resultou no sistema Gnuteca, hoje mantido pela Solis, Cooperativa de Soluções Livres. Uma das coisas que aprendi neste período, especialmente com a Ana Monteiro, bibliotecária da Univates, e em vários eventos promovidos pelo ISTEC, dos quais tive a grata oportunidade de participar, é que o bibliotecário é um profissional de recuperação de informação. Com um determinado "pacote" de informações nas mãos (que pode ser um livro, revista, DVD, CD, documento na web) o bibliotecário procurará colocar uma série de etiquetas que ajudarão, no futuro, na recuperação destas informações. Para isso existem metodologias complexas que devem, ao mesmo tempo, contar com a tecnologia e prescindir dela. Uma informação classificada hoje, com a tecnologia disponível atualmente, deve possuir as melhores e mais significativas "etiquetas" possíveis para a sua busca no futuro, por mais difícil que seja adivinhar qual tecnologia estará, então, disponível. A estas etiquetas damos o nome de metadados.

Metadados são informações a respeito de uma determinada informação. A ficha catalográfica de um livro é um pequeno conjunto de metadados acerca deste livro. Ao gravarmos um CD ou um DVD, escrevemos nele alguma informação sobre o seu conteúdo. Esta informação também é um metadado. Em uma biblioteca, uma das definições possíveis para os metadados que descrevem cada obra do acervo é o formato MARC. Na web, classificar a informação que surge de maneira autônoma, a partir de várias fontes, sem o controle ou a presença de um bibliotecário, não é tarefa das mais fáceis e a automação deste processo ainda é um grande desafio. Idealmente, a classificação da informação na web deveria ocorrer da mesma forma em que ocorre no nosso cérebro. Temos a habilidade de ver ou ler algo e, de forma natural, buscar esta informação tempos depois, quando surge um assunto relacionado. Lojas virtuais procuram rastrear o comportamento dos compradores, por exemplo, e tentar estabelecer relações com o uso de um histórico de tal comportamento: compradores desse livro interessaram-se também por estes outros. Por isso, cada vez mais, nossos passos na web são seguidos e armazenados, na tentativa de, com uma base estatística comportamental muito grande, poder extrair dela parâmetros que mimetizem a forma pela qual nosso cérebro relaciona informações.

Mas classificar informações não é um problema recente. Em meados do século XVI Carlos Lineu, em função de crescentes descobertas e documentação dos seres vivos, propôs uma classificação hierárquica dos mesmos. Aprendemos sobre isto ainda no ensino fundamental e médio e, com alguma sofisticação, tal classificação, a "taxonomia de Lineu" é usada por biólogos, zoólogos e outros cientistas naturais.

Taxonomia é a ciência da classificação de informações. Mesmo correndo o risco de ser muito sintético, penso na taxonomia como a forma de colocar etiquetas, as menores e mais significativas possíveis, em uma informação ou objeto qualquer, facilitando sua identificação posterior. Na taxonomia proposta por Lineu, isto é feito de forma manual. Um cientista, ao descobrir uma nova espécie, deve classificá-la de acordo com esta taxonomia.

Tirando os que acabaram de vir de outro planeta, todos os que têm acesso à internet conhecem o Youtube. Ao acessar um vídeo no Youtube você tem a opção de abrir, à direita do vídeo, o item "About this video". Ao final da lista de informações sobre o vídeo você encontrará a data em que o vídeo foi enviado, sua categoria e uma série de "tags" -- em português, "etiquetas". Estas etiquetas não são criadas seguindo um método como o de Lineu. Cada pessoa que coloca um vídeo etiqueta-o com uma série de palavras-chave, que ela mesmo considera relevante para a busca de seu vídeo. No sistema ICOX, implementado, entre outros, pelo OpenMoondo, cada usuário cadastrado, ao gerar uma informação, pode colocar nela etiquetas. Outros usuários podem comentar essa informação e adicionar novas etiquetas. Esta taxonomia criada organicamente pelas pessoas que geram e consomem informações é chamada folksonomia. Além do ICOX, outros sistemas de gestão de conteúdo web implementam ferramentas de taxonomia e folksonomia.

Como este artigo já ficou comprido demais, deixo para os próximos (viram, não me arrisquei mais em prometer para "o próximo"!) um papo sobre microformatos, business intelligence e mapas de sites.

Um beijão para a Ana Monteiro!

Sobre o autor

Cesar Brod é empresário e consultor nos temas de inovação tecnológica, tecnologias livres, dados abertos e empreendedorismo. Sua empresa, a BrodTec, faz também trabalhos tradução e produção de conteúdo em inglês e português. Além de sua coluna, Cesar também contribui com dicas para o Dicas-L e mantém um blog com aleatoriedades e ousadias literárias. Você pode entrar em contato com ele através do formulário na página da BrodTec, onde você pode saber mais sobre os projetos da empresa.

Mais sobre o Cesar Brod: [ Linkedin ] | [ Twitter ] | [ Tumblr ].


Para se manter atualizado sobre as novidades desta coluna, consulte sempre o newsfeed RSS

Para saber mais sobre RSS, leia o artigo O Padrão RSS - A luz no fim do túnel.

Recomende este artigo nas redes sociais

 

 

Veja a relação completa dos artigos de Cesar Brod