me se prave tenhle 'cesky stoplist' moc nezdal. ten muj navrh vpodstate likviduje jen 100 nejcasteji pouzitych slov primo u nas na foru ...
ale mas pravdu, tyhle slova vyhodim... nejak jsem to vcera probehl jen hoooodne rychle ...
edit: aha, ted jsem pochopil, ze mluvis o tom stoplistu z muni ... "Stoplist je seznam slov, které díky své vysoké frekvenci v textu ztrácejí význam pro sémantickou analýzu věty." - my ale semantickou analyzu imo nedelame ... spis hledame klicova slova, ktera nedavaji vyznam clanku jako takovemu ...