você está aqui: Home → Colunistas → BrOffice.ORG

Extração de imagens de documentos BrOffice

Por Rubens Queiroz de Almeida

Os arquivos gerados pelo BrOffice na são verdade arquivos zip contendo diversos outros arquivos.

Tomemos como exemplo uma apresentação no formato OpenDocument.

Primeiramente, vamos extrair seus componentes com o comando unzip:

  $ unzip imagens.odp
  Archive:  imagens.odp
  extracting: mimetype
  creating: Configurations2/statusbar/
  inflating: Configurations2/accelerator/current.xml
  creating: Configurations2/floater/
  creating: Configurations2/popupmenu/
  creating: Configurations2/progressbar/
  creating: Configurations2/menubar/
  creating: Configurations2/toolbar/
  creating: Configurations2/images/Bitmaps/
  extracting: Pictures/1000000000000314000002133FD28277.jpg
  extracting: Pictures/10000000000002BC000001E8A36E03CC.jpg
  extracting: Pictures/100000000000024B00000194E53B6E4C.jpg
  ... linhas removidas
  inflating: styles.xml
  extracting: meta.xml
  inflating: Thumbnails/thumbnail.png
  inflating: settings.xml
  inflating: META-INF/manifest.xml

Podemos ver que são criados vários arquivos xml no padrão 1.0, um diretório chamado Pictures, onde ficam armazenadas as figuras usadas no documento, um diretório chamado Thumbnails, onde fica guardada uma imagem que é associada ao arquivo, para visualização em browsers e outros arquivos de configuração. O conteúdo do documento fica gravado no arquivo content.xml.

Figura do diretório Thumbnail

O arquivo content.xml pode ser aberto normalmente em um browser Web que ofereça suporte a XML, como por exemplo o Firefox.

Este padrão de formato é muito conveniente, pois podemos extrair com facilidade as imagens de uma apresentação que recebemos e usa-las para outras finalidades, como por exemplo, enfeitar o seu desktop e deixar o seu dia mais alegre :-)

As imagens que eu extrai desta apresentação de exemplo podem ser encontradas em http://www.dicas-l.com.br/imagens/Pictures

Sobre o autor

Rubens Queiroz de Almeida é engenheiro eletricista, formado pela Universidade Federal de Juiz de Fora. Trabalha na Unicamp, no Centro de Computação, desde 1988. Colaborou em diversas edições da Revista do Linux, com artigos demonstrando a viabilidade e importância estratégica do software livre. É autor dos livros Linux - Dicas e Truques, As Palavras Mais Comuns da Língua Inglesa, Read in English - Uma Maneira Divertida de Aprender Inglês, e colaborou na confecção do livro A Leitura nos Oceanos da Internet.

Mantém os sites Aprendendo Inglês, EduLinks, Contando Histórias e a Dicas-L.

Para se manter atualizado sobre as novidades desta coluna, consulte sempre o newsfeed RSS

Para saber mais sobre RSS, leia o artigo O Padrão RSS - A luz no fim do túnel.

Recomende este artigo nas redes sociais

Veja a relação completa desta coluna