Potreboval by som popisat algoritmy, ktore riesia problematiku nevyziadanych mailov(spam). Preto zhanam nejaku podrobnu literaturu(kludne aj eng), odkazy na web alebo aj open source zdrojaky k anti spam pluginom. dakujem
Printable View
Potreboval by som popisat algoritmy, ktore riesia problematiku nevyziadanych mailov(spam). Preto zhanam nejaku podrobnu literaturu(kludne aj eng), odkazy na web alebo aj open source zdrojaky k anti spam pluginom. dakujem
Pred par lety jsem studoval zdrojaky SpamAssassinu. Je to napsane v Perlu, ale fakt pekne - znal jsem jen zaklady + PHP a rozumnel jsem tomu celkem bez problemu.
Jednak tam jsou ruzne analyzy obsahu (hodne regularnich vyrazu), ktere mail boduji, cim vice bodu, tim spis je to spam. Kriteria jsou napr. odkazy, html, analyza hlavicek atd.
Druhak muze uzivatel tridit maily na spam a ham a pak to prohnat pres tzv. Bayesianske filtry. Takhle si muzes natrenovat vlastni rozhodovani pro trideni, ktere je naucene na tve maily. Bohuzel to chvili trva, radove je potreba nekolik stovek spamu a zhruba stejne tak validni posty.
Zkus se mrknout na dobry SpamBayes.