Filtros
bayesianos y otras técnicas antispam
:: Fórmulas de limpieza
::
El
correo no deseado se vuelve cada vez más "inteligente"
(si es que esta palabra puede ser aplicada a unos
señores que pretenden hacernos creer la cantidad de absurdas
proposiciones que nos remiten a nuestras cuentas de correo). Rápidamente,
han surgido fórmulas para controlar esta avalancha que
se nos viene encima, y que amenaza la utilidad del correo tal
y como la conocemos.
LMessageLabs
es una empresa dedicada a proporcionar servicios de email seguro,
y, a mediados de 2003, analizó 134 millones de correos
recibidos por sus clientes a través de sus infraestructuras
repartidas por todo el mundo. Conclusión: por primera vez,
el correo basura superaba al legítimo al 51%. En Diciembre
de 2002, elmundo.es anunciaba ya que el 40% de los correos que
circulaban por Internet eran basura.
Veamos algunas de las técnicas
más importantes para mantener nuestros correos libres de
basuras.
Listas
negras
Las listas negras son una forma
de controlar el correo basura a nivel del servidor. El servidor
de correo, que se encarga de enviar y recoger el correo enviado
y depositarlo en la casilla del usuario correspondiente, puede
ser configurado para ignorar los emails que vengan de una lista
de direcciones IP que se suponen origen del correo basura. Estas
listas se obtienen a través de organizaciones que las actualizan
constantemente, y las ofrecen gratuitamente como fuente de información
sobre focos negros de spam. Hay que tener en cuenta que los spammers
ser sirven de servidores mal configurados para realizar sus envíos
masivos, aprovechando recursos de terceros para intentar no ser
detectados. Por tanto, si alguien se percata de que la dirección
de origen del abuso, puede dar cuenta a estas organizaciones,
que la incluirán en sus listas negras, previniendo a todos
los administradores que utilicen esta técnica, de esos
correos no deseados. Algunas listas negras podemos encontrarlas
en SpamCop (http://spamcop.net/bl.shtml), MAPS (http://www.mail-abuse.org/cgi-bin/lookup),
Open Relay (http://www.ordb.org)....
Hotmail
Personalmente, he conseguido
reducir de unos veinte correos spam en Hotmail a sólo tres
o cuatro al día con esta técnica. Es válida
mientras no contactes con personas de habla inglesa, y también
mientras no utilices el correo de hotmail como el de principal
uso, para los asuntos importantes. Existen otras muchas cuentas
web gratuitas que no tienen estos problemas. Pero si ya es demasiado
tarde y necesitas mantenerla, puedes dirigirte a "opciones"
en la pantalla principal de Hotmail. Seleccionar la opción
"Protección contra el correo no deseado" y elevar
a "alto" la activación del filtro. Luego, si
esto no satisface nuestras necesidades (los spammers saben cómo
funcionan estos filtros automáticos y cómo saltárselos)
podemos dirigirnos, en este menú a "Filtros personalizados".
Allí podremos activar hasta diez reglas para descartar
correos o depositarlos en distintas carpetas. Yo personalmente,
uso estas diez reglas para bloquear por palabras que, casi seguro,
representan spam si las encuentro en el asunto (como sex, free,
debts, bills...). También es muy eficaz eliminar el correo
que contenga tu propio nombre de cuenta en el remitente. Es muy
habitual encontrar correo basura que proviene de direcciones del
tipo "tucuenta@asdf.com", "tucuenta@temp.com..."
etc. Cuando estemos seguros de que este sistema funciona bien,
podemos pasar a eliminar directamente todo este correo, en vez
de hacerlo pasar por la carpeta de correo no deseado.
Programas
antispam
Existen programas que, instalados
en el propio sistema, actúan como proxy entre y el cliente
y el servidor de correo. Así permiten controlar los correos
antes de que sean descargados por el cliente y muchas otras funciones.
Dos muy conocidos son, por ejemplo: K9 Antispam, que es un ligero
programa (69 kilobytes) que permite clasificar y descartar spam
antes de que llegue a tu sistema. Se puede configurar una "lista
negra" para considerarlos spam automáticamente, y
una "lista blanca" para realizar exactamente lo contrario;
evitar que los correos lícitos sean considerados como basura.
El programa "aprende", volviéndose cada vez más
eficaz. Otro programa conocido es Mailwhasher, que actúa
de forma similar, pero permite muchas más acciones. Por
ejemplo, nos da la opción de "rebote" de mensajes
no deseados de forma que presenta tu dirección como no
válida. Esto hará que el emisor (si existe) piense
que ya no está activa la dirección y la eliminará
de su lista.
Filtros
heurísticos
Esto fue uno de los primeros
intentos de bloquear el spam. Se basaba en la propia experiencia
del que lo sufría. Si por ejemplo detectaba que muchos
correos contenían legras en rojo, añadía
una nueva regla a su filtro que descartara estos mensajes. Esta
técnica puede resultar efectiva, pero resulta tediosa,
y las técnicas cambian tan de poco en poco que es imposible
seguirles el ritmo para mantener esa eficacia.
Filtros
bayesianos
Representan lo último
en filtros antispam. Se basan en las teorías del matemático
Thomas Bayes (1701-1761). Esta teoría se basa en la afirmación:
"La esencia de la aproximación bayesiana es proporcionar
una regla matemática que explique cómo se deberían
modificar las creencias en función de las nuevas evidencias".
En resumen, una regla matemática para "aprender"
y "realimentarse" de la experiencia diaria y establecer
una nueva evidencia que reafirme o suavice una opinión.
Aplicado al correo no deseado, estas funciones aprenden de lo
que previamente ha sido definido como spam, y así, en el
futuro, poder identificarlos mucho más fácil y eficazmente.
Tras un periodo de aprendizaje, dónde el programa toma
ciertos ejemplos y se les clasifica manualmente de correo basura,
resulta extremadamente eficiente, y, cuanto más se use,
más eficaz se vuelve, porque sus funciones aprenden nuevas
reglas y es capaz de identificar las tendencias que no hemos introducido
manualmente. Identifica con una cierta puntuación lo "parecido"
que es un correo a otro, modificando los parámetros conforme
encuentra diferencias o similitudes más definidas y así
clasificarlos de manera automática.
SpamAssasin, una aplicación
realizada en Perl, es considerada una de los mejores programas
anti-spam. Está basado en el uso de matemática bayesiana,
y al estar realizado en este lenguaje, puede correr en todas las
plataformas que lo soporten. Un servicio corre en segundo plano
identificando todos los correos. Esta aplicación es gratuita
y una de las mejores armas contra el correo basura. Hoy por hoy,
los filtros bayesianos y la prevención, son los métodos
más eficaces contra el spam.