você está aqui: Home  → Arquivo de Mensagens Curso Gratuito sobre Expressões Regulares, com o Prof.  Julio Neves

Conversão de arquivos com codificação UTF-8 para ISO-8859-1

Colaboração: Rubens Queiroz de Almeida

Data de Publicação: 08 de setembro de 2020

Para pessoas como eu, que ainda não migraram todos os seus arquivos para o formato UTF-8, e que usam um ambiente configurado para a codificação ISO-8859-1, às vezes nos deparamos com documentos em que os caracteres acentuados assumem uma forma estranha:

(Este é um pequeno trecho das legendas em português do filme Contato, de 1997, com Jodie Foster)

Vejamos qual a codificação utilizada neste arquivo:

$ file arquivo.txt
arquivo.txt: UTF-8 Unicode (with BOM) text, with CRLF line terminators

Para alterar a codificação do arquivo, eu uso o comando iconv:

$ iconv -c -f utf-8 -t iso-8859-1 arquivo.txt -o arquivo-iso-8859-1.txt 

A diretiva -f indica a codificação original e a diretiva -t indica a codificação de destino. A diretiva -c indica ao programa iconv para descartar os caracteres que não puderem ser convertidos. Neste caso, o comportamento padrão do programa é interromper o processamento ao encontrar estes caracteres. E finalmente, a diretiva -o especifica o arquivo destino. Se esta diretiva não for especificada, a saída é ecoada para a tela.



Veja a relação completa dos artigos de Rubens Queiroz de Almeida