El spam podría desaparecer gracias al machine learning

Servidores de correo electrónico emplean el machine learning para filtrar los mensajes recibidos y reducir, en la medida de lo posible, el correo no deseado.

El correo electrónico no deseado es uno de los principales enemigos públicos de cualquier internauta. A nadie le gusta recibir e-mails publicitarios sin haberlos solicitado previamente o cualquier otro tipo de correo electrónico que poco o nada tiene que ver con la persona que lo recibe. A esta práctica se la conoce como spam.

No es raro encontrar en los servidores de correo electrónico de internet una carpeta dirigida a este tipo de e-mails. Sin embargo, siempre hay algún correo no deseado que se cuela en la bandeja de entrada principal.  Cuando se filtran este tipo de correos hay que agradecérselo al machine learning, algo que hasta los servicios más populares como Gmail ya utilizan.

Técnicas de aprendizaje automático

Investigadores del grupo de Sistemas Inteligentes de Acceso a la Información Departamento de Informática de la Universidad de Jaén han realizado un estudio sobre el uso de la regresión logística bayesiana para detectar el spam. 

Para ello emplean dos tipos de algoritmos para detectar el spam, ya que sugieren que a través del machine learning, este tipo de correos electrónicos deberían detectarse de forma inmediata.

Ellos emplean los algoritmos de aprendizaje automático  SVM (Support Vector Machine), y el algoritmo PLAUM (Perceptron Algorithm with Uneven Margins). Obtienen como resultado que el algoritmo BBR genera unos resultados satisfactorios en cuanto a precisión y recall y además es el algoritmo más rápido de los estudiados.

Según indican en su investigación, el spam generaría unos gastos de 10.000 millones de dólares anuales sólo en Europa y podría alcanzar en todo el mundo alrededor de los 25.000 millones de dólares, de acuerdo a lo que expone Robert Horton, de la Australian Communication Commission. Éste es uno de los motivos fundamentales, añaden, para poner en evidencia la importancia de los sistemas de detección y filtrado de dichos correos.

A su vez, los investigadores ponen de manifiesto que en el uso de este tipo de técnicas hay que tener en cuenta cuál es el mejor algoritmo para filtrar el spam. Para ello hay que tener claros los objetivos del filtrado de correo electrónico como pueden ser el filtrado del mayor número posible de correos válidos, o relajar las condiciones para dejar pasar más correos y evitar el rechazo de correos correctos.

Google mejora sus algoritmos

Además de eso, Google está mejorando los filtros de spam en Gmail usando los algoritmos machine learning (aprendizaje automático) de TensorFlow, logrando bloquear cerca de 100 millones de spam diarios.

Gracias a dicha tecnología, Gmail puede detectar mensajes de spam en categorías que antes difíciles de detectar. La librería de código abierto ha bloqueado spam de imágenes con contenido incrustado, emails y mensajes con dominios que tienen un bajo volumen de spam. Anteriormente, solo se detectaba el spam de correos provenientes de urls sospechosas. 

TE PUEDE GUSTAR

EVENTOS

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Scroll al inicio