De acordo com as Leis 12.965/2014 e 13.709/2018, que regulam o uso da Internet e o tratamento de dados pessoais no Brasil, ao me inscrever na newsletter do portal DICAS-L, autorizo o envio de notificações por e-mail ou outros meios e declaro estar ciente e concordar com seus Termos de Uso e Política de Privacidade.
Colaboração: Rubens Queiroz de Almeida
Data de Publicação: 05 de Janeiro de 2004
Eu recebo cerca de 1500 mensagens por dia. Um monte são mensagens de erro da Dicas-L e uma grande parte são as famosas mensagens não solicitadas (spam), contos do vigário, etc.
Eu usava o procmail para filtrar isto, com regras que eu mesmo fazia. Consegui fazer que chegassem até a minha caixa postal cerca de 100, das quais 80 eram puro lixo.
Já conhecia o bogofilter (http://bogofilter.sourceforge.net) mas não havia configurado para meu leitor de emails. Li parte da documentação e a instalação foi extremamente simples. Basta pegar o programa, compila-lo e treina-lo. O treinamento é feito passando mensagens de spam para o programa e, com a prática, ele vai aprendendo a diferenciar mensagens legítimas de lixo puro.
Como eu já vinha coletando há algum tempo as minhas mensagens de spam, o treinamento foi bem fácil. O meu arquivo de lixo tem 11MB, aproximadamente 1200 mensagens.
Então:
bogofilter -s < spam.archive
bogofilter -n < notspam
Eu continuo usando o procmail. Para fazer com que o procmail invoque o bogofilter antes de processar as mensagens, inclua em seu arquivo .procmailrc as seguintes linhas:
:0HB: * ? bogofilter -u spam
A minha surpresa, mais de 95% do lixo do spam já foi direto para onde devia, para o lixo. Fantástico!
O que não é lixo eu salvo na pasta notspam e depois rodo o comando
bogofilter -n < notspam
para corrigir os erros. Usuários mais antigos do bogofilter me disseram que a taxa de acertos fica próxima de 100%.
O bogofilter pode funcionar diretamente com o servidor de email (MTA) evitando que os usuários tenham que tomar suas próprias providências. O cliente de email do Mozilla já vem com esta funcionalidade disponível, basta ativá-la e usá-la. As possibilidades são enormes. Para saber mais recomendo que leiam com atenção a documentação.
Eu estou disponibilizando também, para quem precisar, o meu arquivo de spams, em http://www.dicas-l.com.br/download/spam.archive.gz. É um arquivo compactado de cerca de 5MB. Quem tiver algo do tipo e quiser compartilhar comigo para tornar o treinamento inicial do bogofilter mais eficaz, por favor me avise.
This policy contains information about your privacy. By posting, you are declaring that you understand this policy:
This policy is subject to change at any time and without notice.
These terms and conditions contain rules about posting comments. By submitting a comment, you are declaring that you agree with these rules:
Failure to comply with these rules may result in being banned from submitting further comments.
These terms and conditions are subject to change at any time and without notice.
Comentários