Výsledky 1 až 25 z 31

Téma: Komentářový spam, jak se bráníte?

Hybrid View

Předcházející příspěvek Předcházející příspěvek   Další příspěvek Další příspěvek
  1. #1

    Standardní Re: Komentářový spam, jak se bráníte?

    Zajimavy clanek k tematice - http://blog.synopsi.com/2008-02-26/g...esne-prelomena (nejedna se o prakticke reseni, jen uvahy o prolomeni capchy).

    Capchy jako uzivatel bytostne nesnasim, u nekterych mam uspesnost mensi nez robot
    MSI Z77A-GD55, i5-3470, Gelid Tranquillo rev. 2, 16GB RAM Kingston HyperX Blu XMP 1600Mhz, Gigabyte HD 7950, 80GB Intel SSD, 500GB WD, HP ZR2740w

  2. #2
    Senior Member
    Založen
    09.10.2002
    Bydliště
    Praha
    Příspěvky
    1 404
    Vliv
    303

    Standardní Re: Komentářový spam, jak se bráníte?

    musim podotknout, ze captchu take bytostne nesnasim. posledni dobou navic hojne pribyva webu, kdy se ty znaky musi doslova a do pismene lustit a i kdyz dobre vidim, tak u toho fakt dost casto jsem na nervy. pritom takova blbost, ale ty vygenerovane zacmarane znaky kolikrat nejdou rozumne precist.

    http://hanspaulka.wz.cz/index.php?forum

    na svem webu jsem z javascriptem predvyplneneho a stejne tak i javascriptem schovaneho pole ve formulari(reseni jsme zde popisoval a nekteri z vas ho i pouzili) presel na vygenerovani 5mistneho cisla a nuceni navstevniku ho opsat do pole vedle. myslim, ze si to mohu dovolit. captcha je dneska temer vsude a to i v daleko mene uzivatelsky prijemnych podobach. rozumny navstevnik to pochopi. navic u me je to user friendly, ze se nemusi znaky lustit z obrazku, ktery by byl jeste zacmarany, ale generuji se jako text. myslim ze hodne dlouho nebudou existovat roboty ktere by vedely co s tim. na mojem webu to asi louskat nikdo nebude. ale samo chapu, ze treba pro google je toto me reseni nepouzitelne.

  3. #3

    Standardní Re: Komentářový spam, jak se bráníte?

    Připíšu pár poznámek o tom, jak se chovají moji známí komentářoví roboti, kteří se snaží zasvinit moje diskusní fóra:

    1. Prvotní GET na zadávací form přichází s prázdným "referer", kdežto lidský vstup má vždy regulérně referer=stránka s odkazem "vložit příspěvek".

    2. POST následuje vždy do max. 15 sekund (typicky 2-7), člověk potřebuje alespoň minutu na vyplnění formuláře, i kdyby měl text připravený a jen ho tam vlepil ze schránky. Referer je zde už správně z předchozího GETu.

    3. Jestliže je tento POST odmítnut (chyba při opsání verifikačního kódu apod.) a stránka obsahuje také form, následuje do 15 sekund další POST. Jestliže je spolehlivě detekován spambot a na stránce už není form, ale jen text a odkaz "pokračuj", je tento odkaz také následován do 15 sekund. Další pokusy už nedělá.

    5. Obsah textu: vždy je tam alespoň jeden odkaz <A href=..., obvykle ale až pět.

    6. IP: spamy chodí vždy z různých IP, asi aby se nemohly zabanovat. Tyhle IP jsou většinou obsaženy v různých blacklistech jako open proxy. Mnohdy také přijde sekvence GET-POST-POST ze vzájemně různých IP.

    7. Spambot si nedělá vrásky s JavaScriptem, který by případně skrýval falešné ovládací prvky nebo nastavoval jejich hodnotu apod. Styly, které by je skrývaly, jsem nezkoušel, ale nejspíš na ně ten spambot také ignoruje.

    8. V textu nebylo použito žádné slovo ze slovníku, který uvádí Smitka (viz příspěvek výše, 27.1.200.

    Z toho je patrné, že můj spambot je nejspíš jen jeden, a hodně hloupý.
    Protože mám snahu příliš nebuzerovat uživatele opisováním nějakých nesmyslů nebo je zkoušet z násobilky, koketuji s myšlenkou identifikovat robota na základě uvedených vlastností. Z toho je asi zásadní především existence odkazu v textu - spam bez odkazu totiž nemá zřejmě vůbec smysl.

    Jako schůdný mi vychází tento scénář:
    - zpočátku nabídnout formulář bez verifikace, pokud v požadavku bude korektní referer, jinak ještě přidat Captchu nebo něco podobného. Dotaz na open-relay databáze by se taky dal udělat, ale bojím se, že by to bylo časově náročné.
    - pokud bude v textu odkaz, pokračovat potvrzením, ve kterém už bude Captcha, jinak ho normálně zpracovat.

    Celkově mám dojem, že účelem tohoto spamu ani tak není přimět čtenáře ke kliknutí, jako zvyšovat skóre v Googlu.
    Naposledy upravil pavelch; 25.03.2008 v 15:12.

  4. #4

    Standardní Re: Komentářový spam, jak se bráníte?

    Tak ze slovníku muselo být uvedeno minimálně http

    Jinak prozatím mi moje nová trojitá ochrana drží a ke zpracování pomocí slovníku se zatím nic nedostalo, což mě prozatím těší, ale musím zaklepat

    Na mojich stránkách řádí boti a ti referal vyplňují korektně takže to na univerzální ochranu nelze použít.

    Capcha mi poslední dobou přijde dost šílená, čím dál více toho prostě nerozluštím...

  5. #5

    Standardní Re: Komentářový spam, jak se bráníte?

    HTTP ze slovníku: jo, jasně, to tam je, já mám detekci odkazu jinde.
    Už se mi taky spamy na ten slovník chytly, předtím jsem měl málo vzorků.
    Slovník jsem ještě doplnil: horny, ephedrine, dude, topless
    Taky jsem (provizorně) zahodil Captchu a dělám to tak, že když příspěvek nasbírá "tutové" skóre z těchto faktorů:
    - nekorektní referer
    - POST následuje po GET dříve než 15 s
    - slovník
    - existence odkazu v textu
    tak ho zahodím. Když nasbírá skóre "pravděpodobně", tak ho zapíšu s příznakem "Nezobrazovat", do textu dalšího kroku, kde normálně je "děkujeme za zaslání příspěvku.." taky červeně napíšu něco ve smyslu "příspěvek bude zobrazen až po kontrole moderátorem" a pošlu si e-mail. Na tom budu pár dní ladit váhy pro skóre a pak se uvidí, jak to funguje.
    Další zajímavá věc: zkoušel jsem odkazy v těch spamech a ejhle: na 90% z nich dostanu 404 not found...

  6. #6

    Standardní Re: Komentářový spam, jak se bráníte?

    Citace Původně odeslal pavelch Zobrazit příspěvek
    ...
    - POST následuje po GET dříve než 15 s
    Dal bych tam alespoň nějaké textové upozornění, že pokud na to klikne do 15 vteřin, tak se to zahodí. Nejlépe pomocí JS do odesílacího buttonu --- počkejte ještě [7s]... Očas se to prostě stát může, že někdo bude rychlejší než 15s. Samozřejmě, že to nebude blokovat to tlačítko... ...I když... proč ne, že?
    Naposledy upravil Camillek; 26.03.2008 v 17:20.
    Přirozená inteligence bude zřejmě brzy překonána inteligencí umělou, avšak přirozenou blbost umělá nikdy překonat nedokáže.

  7. #7

    Standardní Re: Komentářový spam, jak se bráníte?

    mne funguje skryta kontrolna otazka, presne tak to mam ako Jey... a odkedy to mam tak ziadny spam. niekde som cital ze boti JS nevidia, a ziaden bot asi nebude vymyslat retazec aaa111
    PC: GA-Z68X-UD3P + i7-2600K + 4x4GB G.Skill 1333CL7 + 8800GT + Audigy2 ZS + Intel 520 120GB R.0 / Seagate 750GB R.1 + Seasonic X660 + Fractal R3 + Phobya 480 + 4xNoctua P12, EK Supreme HF+, ACool VPP655 + XSPC Tank
    NB: DELL XPS M1330 [T7500,4GB RAM,Intel 320 160GB,8400M-GS] + Double Copper Mod, Seven x86+PAE patch

  8. #8

    Standardní Re: Komentářový spam, jak se bráníte?

    Citace Původně odeslal Camillek Zobrazit příspěvek
    Dal bych tam alespoň nějaké textové upozornění, že pokud na to klikne do 15 vteřin, tak se to zahodí. Nejlépe pomocí JS do odesílacího buttonu --- počkejte ještě [7s]... Očas se to prostě stát může, že někdo bude rychlejší než 15s. Samozřejmě, že to nebude blokovat to tlačítko... ...I když... proč ne, že?
    Timeout na submit tlačítko jsem taky zkoušel, myslím na 10s, ale něco tím proklouzlo a přišlo mi, že pro člověka (zvlášť, pokud na ty stránky chodí často) je to zas už moc... S filtrem na poměr počtu odkazů a celkového textu jsem zatím docela spokojen.
    1) ASUS M6A
    2) Toshiba Portége R600-10U
    3) ASUS A8V-X AMD Athlon 64 3000+ Kingmax 2x256MB DDR 400 WD 120GB Samsung 80 GB GMC G30 Fortron FSP400-60THN-P
    Ideální indentace pro Pascal je šest stop pod zem.

Informace o tématu

Users Browsing this Thread

Toto téma si právě prohlíží 1 uživatelů. (0 registrovaných a 1 anonymních)

Podobná témata

  1. SPAM ?
    Založil celebris v sekci fóra Programy a problémy s nimi
    Odpovědí: 1
    Poslední příspěvek: 18.10.2005, 21:41
  2. Spam filtr do The BAT!
    Založil kecinzer v sekci fóra Programy a problémy s nimi
    Odpovědí: 3
    Poslední příspěvek: 20.07.2005, 12:32
  3. Potrebuju rozeslat 500 emailu (nejedna se o spam)
    Založil bobesh v sekci fóra Programy a problémy s nimi
    Odpovědí: 1
    Poslední příspěvek: 04.10.2004, 10:02
  4. Konecne je tu rival pro Geniuse SW 5.1 HT // spam
    Založil lukas.only.three v sekci fóra Zvuk
    Odpovědí: 15
    Poslední příspěvek: 19.04.2003, 23:51

Pravidla přispívání

  • Nemůžete zakládat nová témata
  • Nemůžete zasílat odpovědi
  • Nemůžete přikládat přílohy
  • Nemůžete upravovat své příspěvky
  •