De acordo com as Leis 12.965/2014 e 13.709/2018, que regulam o uso da Internet e o tratamento de dados pessoais no Brasil, ao me inscrever na newsletter do portal DICAS-L, autorizo o envio de notificações por e-mail ou outros meios e declaro estar ciente e concordar com seus Termos de Uso e Política de Privacidade.


unhtml - remoção da marcação html de um arquivo

Colaboração: Rubens Queiroz de Almeida

Data de Publicação: 25 de abril de 2017

A Dicas-L e os outros sites que mantenho são criados a partir de textos formatados com a sintaxe do programa txt2tags, de autoria do Aurélio Jargas. O programa é facílimo de usar e muito poderoso. Como às vezes eu recebo colaborações para a Dicas-L em arquivos html, eu preciso primeiro remover esta marcação para então aplicar a formtação txt2tags.

Para remover a marcação html, eu uso o programa unhtml, de autoria de Kevin Swan.

Seu uso é bastante simples, basta fornecer o nome do arquivo html e direcionar a saida padrão (stdout) para um arquivo:

$ unhtml arquivo.html > arquivo.txt

Para instalar em sistemas Debian GNU/Linux e derivados, digite:

$ sudo apt-get install unhtml

Veja também

Adicionar comentário

* Campos obrigatórios
5000
Powered by Commentics

Comentários

Nenhum comentário ainda. Seja o primeiro!


Veja a relação completa dos artigos de Rubens Queiroz de Almeida