Publikationsansicht

Detección automática de Spam utilizando Regresión Logística Bayesiana (2005)

Abstract
Este artículo presenta un sistema de detección automática de Spam, o correo no deseado, aplicando Regresión Logística Bayesiana (BBR) como técnica de aprendizaje automático, sobre la colección de correos electrónicos SPAMBASE. A modo de comparativa se han aplicado otros dos algoritmos de aprendizaje: el algoritmo SVM (Support Vector Machine), y el algoritmo PLAUM (Perceptron Algorithm with Uneven Margins). La finalidad de este estudio es comprobar la eficiencia y efectividad del algoritmo BBR en la tarea concreta de filtrado de Spam. Como muestran los experimentos, el algoritmo BBR no solo obtiene unos resultados satisfactorios en cuanto a precisión y recall, sino que además es el algoritmo más rápido de los estudiados.. This paper presents an Spam automatic detection system using Bayesian Logistic Regression (BBR) as machine learning algorithm, over the SPAMBASE collection. We have also used two machine learning algorithms: SVM and PLAUM, in order to compare the results. Our aim is to check the efficiency and effectiveness of the BBR method. The obtained results show good results in terms of precision and recall. We have also noticed that BBR is the faster algorithm.. Este trabajo ha sido financiado con el proyecto (MCYT) TIC-2003-07158-C04-04.

Details der Publikation
Download http://hdl.handle.net/10045/1307
Herausgeber Sociedad Española para el Procesamiento del Lenguaje Natural
Archiv RUA - Repositorio Institucional de la Universidad de Alicante (Spain)
Keywords Filtrado de correo, Spam, SPAMBASE, Regresión Logística Bayesiana, E-mail filter, Bayesian Logistic Regression
Typ Article
Sprache Spanisch
Verknüpfungen Procesamiento del lenguaje natural, nº 35 (sept. 2005); pp. 127-133