Komentářový spam, jak se bráníte?

**Smitka** · 20.01.2009, 00:27

Dovolil bych si zhruba po roce znova obnovit tuhle diskuzi, protože jsem v poslední době narazil na dost webů "pod plnou palbou".

Za ten rok jsem několikrát na různých webech nasazoval anti-komentář-spam ochranu a na svém webu loguji chování spambotů (od 18.1. ještě víc podrobněji).
Během toho jsem testoval i účinnost různých metod.

Používám několik typů ochrany, které různě kombinuji:

Nastražené políčko formuláře, skryté css s "pěkným" jménem - používám nick, pokud je políčko vyplněno jedná se o bota
Políčko v početním příkladem vyplněné javascriptem a skryté - po načtení je do políčka vložen výsledek příkladu, který používám buď statický, nebo generovaný z session_id
Nastrčený schovaný submit pře opravdovým submitem, pokud byl formulář odeslán tímto submitem, jedná se o bota
Kontextový filtr na straně serveru

Kupodivu jsem zjistil, že v současné době je dostačující ochrana nastrčeným políčkem NICK. Všechny boty mi toto políčko vyplnili. Použili tam většinou stejnou hodnotu jako v poli jméno/name, do políček s neznámým name vkládali náhodnou hodnotu. Pravděpodobně to vychází z toho, že nechtějí riskovat, že by nevyplnily nějaká povinná políčka. Na svých stránkách tato ochrana vždy zareagovala jako první a dále nebylo potřeba nic řešit. A hlavně je opravdu strašně jednoduchá na implementaci.

Z přijatých hodnot se ukázalo, že by zareagovala správně i obrana javascriptem. Na stránkách, kde jsem nedával políčko, tak si žádný bot s javascriptem neporadil a vyplnil náhodnou hodnotu, nebo nějaké URL.

Podstrčený submit také trochu fungoval, byly komentáře většinou s oběma submity, několik s prvním submitem a pravděpodobně starší boti s korektním submitem. Z toho usuzuji, že je to spíše zbytečná ochrana, ale u nových webů by mohl av budoucnu trochu pomoci.

Kontextový filtr jsem vylepšil tím, že zvyšoval skóre u krátkých příspěvků (např. pod 20znaků spamindex*2), protože se nikdy nic nedostalo až k němu, nemůžu říci procentuální úspěšnost, ale když jsem namátkově zkoušel ho aplikovat na zablokované příspěvky a vždy jim přiřadil odpovídající skóre. Protože mám teď udělanou důkladnější analýzu a jedu od začátku, až nasbírám dost vzorků, budou nějaké podrobnější výstupy. Myslím, že kontextový filtr není špatné doplňkové řešení, které může odstranit i některé živé spamery.

Další postřehy:
Ip adresy opravdu blokovat nemá smysl.
Časy mezi vstupem na stránku a odeslání komentáře botem se na mém webu pohybovaly od 4s do 47s (to se již kreje s normálním uživatelem).
Referal si myslím není dobré řešení, protože i normální uživatel vstoupí na stránku přímo (hlavně když prohlížeč doplňuje již navštívené stránky) a také (aspoň na mém webu, kde to vidím) roboti nejdřív vstoupili na nejdřív na stránku a až pak odeslali formulář.
Občas nejdřív přišel krátký komentář, bez zlých slov (a viděl jsem i vytvořený z obsahu původní stránky) a odkazů a když prošel, tak robot spustil útok.
Na mém webu je identifikátor prohlížeče ve velké většině Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)
Odkazované stránky jsou většinou napadené reálné weby, kde se pak tváří že nabízí porno a stahují se z nich soubory typu blablaXXXbla.mpeg.exe s různými trojany.
Zkoušel jsem několikrát napsat majitelům webů, kteří občas i zareagovali

Doplňkové info na mém webu (i s počítačkou spamů

): http://smitka.org/blog/komentarovy-spam

**Smitka** · 20.01.2009, 14:34

Tak jsem ještě prozkoumal ochranu pomocí vloženého submitu. Boti používají téměř bez výjimky (u mě 100%) první nalezený submit.
Bohužel mi došlo, že když uživatel vyplní formulář a odšle ho enterem, tak se vnitřně také použije první submit v pořadí. Takže tahle ochrana sice pro nové boty funguje bezproblému, ale mohla by omezovat běžného uživatele.

Ve svém komentářovacím formuláři mám celkem 4 submity a na různých pozicích a kromě manuálního kliknutí na jediný viditelný čudlík, nebo dotabulatorování na něj je vždy poslán ten první submit, i když první submit před vyplňovanými políčkama.

**ripper** · 23.01.2009, 00:14

Původně odeslal Smitka

Časy mezi vstupem na stránku a odeslání komentáře botem se na mém webu pohybovaly od 4s do 47s (to se již kreje s normálním uživatelem).

To jsem bohužel zjistil taky, když jsem zkoušel timeout 10 sekund na odeslání... Nefunguje.

Původně odeslal Smitka

Občas nejdřív přišel krátký komentář, bez zlých slov (a viděl jsem i vytvořený z obsahu původní stránky) a odkazů a když prošel, tak robot spustil útok.

To vídám taky, napřed zkusí něco nevinného, pak postupně přitvrzují obsahem i kadencí.

Původně odeslal Smitka

Nastražené políčko formuláře, skryté css s "pěkným" jménem - používám nick, pokud je políčko vyplněno jedná se o bota

To je moc pěkný nápad, a jestli funguje, taky ho implementuju, díky

**Smitka** · 23.01.2009, 19:38

No ted jsem si vsiml zvlastni veci... Mel jsem cca 30spamu denne a najednou nic. Nevim zda je to nahoda, ale od te doby co jsem pridal 4. submit do formulare, tak zadny bot nic nepostnul

EDIT: uz se to zase rozjelo

**Smitka** · 29.01.2009, 10:20

Udělal jsem menší statistiku ze 155 spamů, podle toho jaký typ ochrany by je zachytil.

spamy odifiltrované nick políčkem - 155
spamy odfiltrované js příkladem - 155
spamy, které použily první nastrčený submit - 154
spamy, které nepoužily žádný submit (přímý přístup) - 1
spamy ofiltrované kontextovým filtrem (nad 20 bodů) - 155
nejnižší spam-score - 23
nejvyšší spam-score - 307
nejčastější jména - TestName (17), teen (4), tiava (3), youtube (3)
nejčastější user agent - Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1) (155)
počet IP adres, které se objevily 2× - 9
počet IP adres, které se objevily 3× - 1
počet IP adres, které se objevily vice než 3× - 1
nejčastější IP - 212.62.97.23 (13)
nejčastější řetězce: com (477), http (468), href (465), www (260), livevideo (170), teen (118), vidilife (95), notlong (88), preteen (58)

**Smitka** · 24.08.2009, 18:12

Tak jsem zpracoval výsledky z dlouhodobějšího testování:
http://smitka.org/blog/komentarovy-spam-vysledky

V souhrnu:
- počet spamů narůstá (to ale asi každý ví

)
- jsou chytřejší (to asi taky)
- některé už umí javasript
- 100% ochrana se ukázalo nastražení formulářové políčko s lákavým názvem
- kontextový filtr může odfiltrovat velké množství spamů
- lákají hlavně na sex, lolitky a zvířata
- zdrojem jsou hlavně botnety

Téma: Komentářový spam, jak se bráníte?

Nástroje témat

Zobrazení

Re: Komentářový spam, jak se bráníte?

Re: Komentářový spam, jak se bráníte?

Re: Komentářový spam, jak se bráníte?

Re: Komentářový spam, jak se bráníte?

Re: Komentářový spam, jak se bráníte?

Re: Komentářový spam, jak se bráníte?

Informace o tématu

Users Browsing this Thread

Podobná témata

SPAM ?

Spam filtr do The BAT!

Potrebuju rozeslat 500 emailu (nejedna se o spam)

Konecne je tu rival pro Geniuse SW 5.1 HT // spam

Pravidla přispívání