Krótkie nawiązanie do poprzedniego wpisu. Trochę dlatego, że pojawiło się kilka komentarzy, a i nowy egzemplarz spamu również w filtrach się zatrzymał.
Ciąg dalszy "Ciekawy(?) spam II" »Friday, November 4. 2011
Wednesday, November 2. 2011
Ciekawy(?) spam
Od pewnego czasu obserwuję między innymi taki spam komentarzowy:
Obraz wideo i dzwiek odczytywane z plyty DVD narzedzi intelektualnych, niezbednych do. Byli i sa wsrod mozgu maja znacznie wiecej na elektryczne sygnaly, przesylane mozna bylo. Pierwsze komputery Pierwszym komputerem w podobny sposob jak kart perforowanych, przeprowadzajacym obliczenia. Naleza do niego z obliczeniami wartosci wypelniajacymi do 800 MHz, a kilkanascie razy wiecej. W mozgu natomiast nas wlasciciele srodkow pozycjonowanie chemiczne, nie w pozycjonowanie twardego. (...)
Zastanawiam się jak taki tekst powstaje, czy jest to bezładna "kompilacja" kilku tekstów, czy może skutek wykorzystania łańcuchów markowa? Domyślam się, że celem jest obejście filtrów bayesowskich. Jak na razie podejście to jest niezbyt skuteczne.
W tym kontekście zastanawia mnie jedna sprawa - ciekawe jak w filtrowaniu spamu sprawdzałoby się sprawdzanie ortografii i gramatyki tekstu. Raczej jako jeden z czynników decydujących o klasyfikacji wiadomości niż jako jedyny wyznacznik spamu. Zastosowanie takiego filtra mogłoby się również przyczynić do drastycznego podniesienia jakości "komentarzy na onecie"... Z drugiej strony przypuszczam, że akurat jakość komentarzy im niższa (znaczy - im komentarze głupsze), tym lepsze. Budzą chęć do reakcji, kliknięcia lecą, leci też kasa od reklamodawców.
Tuesday, November 1. 2011
OpenBSD 5.0
Tak, zgodnie z tradycją mamy już OpenBSD 5.0. Sobie życzę, by errata do tej wersji była równie pusta, jak ta do wersji 4.9.