Programming

Zo'n verloren zondag

Na het ontwaken de laptop aangegooid en thunderbird een slinger gegeven. Tot mijn ontsteltenis constateerde ik dat een spam run succesvol door mijn filters was geglipt. En mijn vage idee van 'Spam Bayesian' filtering op de commentaartjes kreeg ineens vaste vormen. Met tegenzin zette ik mij achter het toetsenbord om deze taak uit te voeren. Na een speurtocht aan bestaande implementaties in PHP geschreven begon het proces van het assembleren en maken.
Ondertussen schakelde ik mijn spamfilters uit om de training van het filter te versnellen, want Spam Bayes werkt alleen als je voldoende data hebt om tegen aan te testen.
Uiteindelijk, rond een uurtje of 11 's avonds was het zover. Ik had een uitgebreide corpus aan data weten op te bouwen en alle blokjes hadden hun plek in de soure gevonden. Tijd voor een eerste test.
Blij als een kind zag ik dat een reactie die door mijn huidige filter was gesijpeld door Spam Bayes werd geclassificeerd als zijnde Spam.
Missie geslaagd.

Designersblock

Oorlog, mooi weer, anti-oorlog acties en een designersblock. De nachtelijke uren gebruik ik tijdens mijn verlof om te coderen en te testen. Mijn kleinschalige RSS slurper loopt elk uur momenteel 136 RSS feeds te snuffelen naar updates, en slaat ze trouw op in de database. Van alle feeds is ook weer een RSS feed te maken zodat je ze ook lekker in Awasu kan lezen.

Prima allemaal. Alleen ik heb een probleem. Met behulp van magazines is het mogelijk om meerdere RSS kanalen samen te voegen en daar 1 feed van te maken. (en die via email, het web of rss te ontvangen). En ook dat werkt geweldig. Ik krijg elke dag een emailtje met de nieuwe fokke en sukke, ik krijg elk uur een mailtje met al het nieuws over irak.

Syndicate content
thank you for watching  Creative Commons License