De acordo com as Leis 12.965/2014 e 13.709/2018, que regulam o uso da Internet e o tratamento de dados pessoais no Brasil, ao me inscrever na newsletter do portal DICAS-L, autorizo o envio de notificações por e-mail ou outros meios e declaro estar ciente e concordar com seus Termos de Uso e Política de Privacidade.
Colaboração: Rubens Queiroz de Almeida
Data de Publicação: 08 de setembro de 2020
Para pessoas como eu, que ainda não migraram todos os seus arquivos para o formato UTF-8, e que usam um ambiente configurado para a codificação ISO-8859-1, às vezes nos deparamos com documentos em que os caracteres acentuados assumem uma forma estranha:
(Este é um pequeno trecho das legendas em português do filme Contato, de 1997, com Jodie Foster)
Vejamos qual a codificação utilizada neste arquivo:
$ file arquivo.txt
arquivo.txt: UTF-8 Unicode (with BOM) text, with CRLF line terminators
Para alterar a codificação do arquivo, eu uso o comando iconv
:
$ iconv -c -f utf-8 -t iso-8859-1 arquivo.txt -o arquivo-iso-8859-1.txt
A diretiva -f
indica a codificação original e a diretiva -t
indica
a codificação de destino. A diretiva -c
indica ao programa iconv
para descartar os caracteres que não puderem ser convertidos. Neste caso, o
comportamento padrão do programa é interromper o processamento ao encontrar
estes caracteres. E finalmente, a diretiva -o
especifica o arquivo
destino. Se esta diretiva não for especificada, a saída é ecoada para a tela.
This policy contains information about your privacy. By posting, you are declaring that you understand this policy:
This policy is subject to change at any time and without notice.
These terms and conditions contain rules about posting comments. By submitting a comment, you are declaring that you agree with these rules:
Failure to comply with these rules may result in being banned from submitting further comments.
These terms and conditions are subject to change at any time and without notice.
Comentários