Comments

Zo'n verloren zondag

Na het ontwaken de laptop aangegooid en thunderbird een slinger gegeven. Tot mijn ontsteltenis constateerde ik dat een spam run succesvol door mijn filters was geglipt. En mijn vage idee van 'Spam Bayesian' filtering op de commentaartjes kreeg ineens vaste vormen. Met tegenzin zette ik mij achter het toetsenbord om deze taak uit te voeren. Na een speurtocht aan bestaande implementaties in PHP geschreven begon het proces van het assembleren en maken.
Ondertussen schakelde ik mijn spamfilters uit om de training van het filter te versnellen, want Spam Bayes werkt alleen als je voldoende data hebt om tegen aan te testen.
Uiteindelijk, rond een uurtje of 11 's avonds was het zover. Ik had een uitgebreide corpus aan data weten op te bouwen en alle blokjes hadden hun plek in de soure gevonden. Tijd voor een eerste test.
Blij als een kind zag ik dat een reactie die door mijn huidige filter was gesijpeld door Spam Bayes werd geclassificeerd als zijnde Spam.
Missie geslaagd.

Syndicate content
thank you for watching  Creative Commons License