Gambas Mis Programas y el Softwarelibre: Ejemplo de como hacer un detector de Spam o del idioma en que esta escrito un texto: Uso de Clasificadores Bayesianos

lunes, 31 de marzo de 2014

Ejemplo de como hacer un detector de Spam o del idioma en que esta escrito un texto: Uso de Clasificadores Bayesianos

Ejemplo de como hacer un detector de Spam o del idioma en que esta escrito un texto:

Uso de Clasificadores Bayesianos

¿os habéis preguntado como funcionan los detectores de spam en el correo?
¿o como funciona el botón del "detectar idioma" en el http://translate.google.com/?

Pues todo se basa en probabilidades, en especial al teoremas de Bayes y en lo que se llama Clasificadores Bayesianos.

Estos programas clasifican el texto, según el calculo de las probabilidades, según las categorias (Spam / noSpam), y las palabras que contienen el mensaje a analizar.

Previamente este programa "aprende" que tipo de mensajes son spam o no spam, según las palabras (y probabilidades de que aparezcan en el texto),