Közben elolvastam a FAQ-t (hát igen, ha már semmi sem segít), és valószínűleg az volt a baja, hogy a headerben meg a levél végén ott maradtak a CRM bejegyzései, mindenesetre ha anélkül küldtem vissza neki, akkor szépen megtanulta.
akkor csinalt ilyet, ha egymas utan tobbet tevesztett. ekkor az elsore, amit visszakuldtem neki, tanult egy kicsit, es annak alapjan a masodik tanitasra mar nem volt szukseg.
vOrOn:
jah probaltam. nekem ez a masik jobban bejott. kenyelmesebb ez a train on error fajta tanitas a mail klienssel, mint a sa-learn. persze biztos azt is ki lehet faragni jol.
install utan ugy kell hasznalni, hogy ha teved egyet, akkor a tevesen osztalyozott levelet visszakuldod a sajat cimedre egy kis utasitassal, hogy tanulja meg a program, hogy ezt tevesen osztalyozta spamnek vagy hamnek.
Nekem egy része ilyen headerrel jön vissza:
"X-CRM114-Action: LEARN AS SPAM UNNECESSARY - ALREADY CLASSIFIED CORRECTLY - NO ACTION TAKEN"
Nem akar tanulni a büdös. Neked nem vol ilyen?
Egyelőre nem valami meggyőző, ráadásul még át is kellett írnom, hogy qmail-el is menjen.
szigoruan veve off, mert nem SpamAssassinrol akarok beszelni, de hatha mas is unja mar :)
SA-t hasznaltam olyan 1-1.5 evig, de a vegen neha napi 5-6 spam is atcsuszott, folyton upgradelgetni kellett, mert okosabbak lettek a spamek, szopas whitelisttel, blacklisttel, etc..
helyette itt van ez ni: CRM114. egy honapja csereltem le az SA-t, mara kb 2-3 naponta 1 tevedese van, napi 90-100 spam es kb ugyanennyi vagy tobb ham mellett. ez siman >99%, es kevesebb torodest igenyel, mint az SA.
a CRM114-ben nincsenek elore definialt szabalyok, csak tanulasra jatszik. tok hulyen, nulla tudassal kezdi install utan (az elso ket het mondjuk durva volt, ossze-vissza dobalta a mailt), de epp ez az elonye is: csak a te spamod es hamod alapjan fogja megtanulni a valogatast, es nem erdekli, hogy v1agra vagy vi4gra vagy mi van a levelben.
install utan ugy kell hasznalni, hogy ha teved egyet, akkor a tevesen osztalyozott levelet visszakuldod a sajat cimedre egy kis utasitassal, hogy tanulja meg a program, hogy ezt tevesen osztalyozta spamnek vagy hamnek.
nem is erdemes betanitani elore osszegyujtott spammel, az a lenyeg, hogy csak akkor tanuljon, ha hibazott.
eleinte kenyelmetlen folyton tanitani, de hosszu tavon sokkal jobb, mint az SA..
Ilyen jellegü problémam a cirill levlistákkal van, amennyiben white listezek, iszonyat mennyiségü spamet kapok, ui a listára valo írásnak nem feltétele a felíratkozás, tehát egyenként kell elbirálni a leveleket.
Mellesleg, ha black és white listeket kell használnom, akkor nekem nem kell a spamassassin, ui a sylpheed-claws szüröje kiváloan alkalmas erre a célra.
Ettöl függetlenül tovább keresem az igényes magyar ham és spam levelek gyüjteményét (hasonló URl angolban megadtam).
white list nem alkalmazható A whitelist_to sem? Nincs a headerben valami, ami alapján egyértelműen meg lehet mondani, hogy levlistáról jött?
(Azt a néhány levlistát, amin én fent vagyok, be lehet azonosítani, ez persze semmit nem jelent)
> Szerintem meglepően jól fog menni a 140 darab után is, felesleges 1000-et megvárni... A jó kifejzés, szerinted. A gyakorlati tapasztalatom mást mutat. Levlistákbol rendszeresen "kiszüri" a jó leveleket is a spam mellett, white list nem alkalmazható. ham-eztettem is, javult a helyzet, de számomra nem elfogadható szinten.
Én úgy 200 darabra ráengedtem az sa-learn-t (meg sok-sok hamre is), azóta saccra minimum 98%-os pontossággal dolgozik. Előtte jó ha 20%-ot tudott.
Szerintem meglepően jól fog menni a 140 darab után is, felesleges 1000-et megvárni...
Honnan lehetne letölteni nagyszámban spam, reklám leveleket mbox, de jöhet a gzippelt dir, formatumban?
sa-learn részére kell, nekem még csak 140 darab áll rendelkezésemre, amikor a javasolt mennyiség 1.000 és 5.000 darab között van a man-ban is. :)
Sziasztok!
A learn funkcióval van bajom, nem igazán látom hogy tanulna, ugyanazokat a hibákat követi el újra meg újra. Hol, milyen fájlban jelenik meg a tanulás eredménye?
--dir kapcsolóval a cyrus könyvtárából megette a leveleket, így végülis a dolog működik. Ez a "normális" megoldás, a cyrustól közvetlenül nem kellene tudnia ezt megkérdezni?
Ha scriptet irok rá, hogy naponta adott könyvtárakból tanuljon, nem okoz gondolt ha egy mailt a script többször is megetet az SA-val tnulás végett?
Spamassasint probalnam beloni egy postfix ala, de sajnos az jelenseg, hogy bejon a level, ellenorzi a z SA(latszik a fejlecben), majd local-on keresztul ujra bejon a level, amit szintem ellenorzis es igy tovabb amint leallitom az sa-t megkapom a levelet annyi peldanyban ahanyszor korbement.
Egy leirast alapjan csinaltam a beallitas. Sajnos a leirast nem talom, de az alabbiakat allitottam:
master.cf:
spamfilter unix - n n - - pipe flags=Rq user=spam argv=/usr/local/bin/spamfilter.sh ${sender}
Sajna még mindig nem jöttem rá miként tudom tanítani a cyrus imap folderben lévő levelek segítségével. Lehet egyáltalán ilyet? Ha nem, hogyan tudom mboxba konvertálni az adott leveleket?
főleg a frissítés fontos, mert a rohadékok v1@gra és hasonló trükkjei miatt kicsit olyan ez, mint a fegyverkezési verseny
de ami miatt nekem naponta kell foglalkoznom vele, az a userek hozzáállása: azt akarják, hogy semmit ne dobjon spamnek a szűrő, ami nem az (a föladó nélküli html formátumú ékezetes subjectes hetven címzetnek menő nagybetűkkel teletűzdelt leveleiket sem ;-), de lehetőleg egyetlen spamet se kapjanak... mivel én sok levelet kapok, a saját inboxommal kísérletezek, a headert megnézem, milyen új paraméterek vannak benne, kis leírás, pontok tilitolizása
de mondom, főleg azért csinálom, mert érdekes, aztán majd letiltjuk a pop3-at és az smtp-t, oszt nem jön a spam ;-))
elgondolkodtam azon, amit írsz. eddig a napi negyed-fél óra ellenőrizgetést a kísérletezés öröméért töltöttem vele (na meg mert fizetnek érte ;-), de valóban, mikor szórakozásból idegesítő vacakká válik a levélszemét, nem ér meg napi sok perc molyolást.
"napi 50 levélszemétnél 2-3 átcsúszóra delt nyomni nem nehezebb, mint vacakolni napi fél órát, hogy csak egy jöjjön át."
Na ezért nem foglalkoztam eddig a SA-nel. Ez a két filter nálam 95% fölött teljesít, és évek óta nem kellett hozzányúlnom. A .procmail-embe csak akkor piszkálok, ha valami új levlista vagy egyéb speciális forrás leveleit nem akarom a mobilomra megkapni.
"a procmailes szűrést én nem venném ennyire szigorúan (már ha jól értem) te kidobod a html leveleket."
Nem dobom ki. És különben sem...
De tényleg nem akarok úgy harcolni a spam ellen, hogy azzal kezdem, hogyan azonosítom őket. Ott van abban a 2x4 sorban.
napi 50 levélszemétnél 2-3 átcsúszóra delt nyomni nem nehezebb, mint vacakolni napi fél órát, hogy csak egy jöjjön át. annyit meg mindig újítanak a rosszcsontok (copyright by brumi), hogy sose lesz 100%.
a procmailes szűrést én nem venném ennyire szigorúan (már ha jól értem) te kidobod a html leveleket. hajjaj, céges levelek zömét akkor nem kéne olvasnom ;-)
Ez egy kicsit olyan, mint amikor valaki elárulja, melyik a legcsendesebb kirándulóhely, és kis idő múlva elleik a tömegek. ;-)
Azért remélem a spammerek nem ide járnak okosodni, vagy ha mégis akkor nem értenek procmail-ül. ;-))
SzG, eredetileg a user_pref telepítés után csak minta, minden kommentezve van, amíg nem írsz hozzá. ahova a SA települt, ott is van az egséz rencerre vonatkozó beállításra file
Köszi a tippet!
Hogy kell ezt az autolern-t paramétereznem, ha egy cyrusos imap foldert akarok megadni? Ezt tudom egyszerűen megoldani mint amolyan műkedvelő amatőr, mert ez már megy. :-)
BSD,
autolearn: összegyűjtesz egy csomó spamet, amit nem szűrt ki a SpamAssassin, és berakod mondjuk a MissedSpam nevű könyvtáradba, ami tegyük fel mbox formátumú, majd:
sa-learn --mbox --spam MissedSpam
ha könyvtár maildir formátumú, akkor --mbox elmarad.
Ha olyan levelek vannak, amiket nem kellett volna kiszűrnie, akkor '--spam' helyett '--ham' az opció.
van a ~/.spamassassign-ben egy user_prefs file, abban tuod az egyéni értékeket finomítani, vagy 1700 lehetőség van, jó ha 50-et ismerek, de nekem az is elég úgy 95%-os finomságú szűrésre. ilyenek vannak nálam:
Teszek egy kisérletet, hátha más is érdemesnek tartja a SpamAssassint egy topicra.
A konkrét porbléma, ami miatt most írok, az az, hogy valemilyen okból mintha nagyon lezser lenne a SpamAssassin a gépemen. Frissen tettem fel a Mandrake 9.2 CD-ről. A szokásos egyél viagrát spamre ezt mondja:
X-Spam-Status: No, hits=1.5 required=5.0
X-Spam-Level: *
X-Spam-Checker-Version: SpamAssassin 2.55 (1.174.2.19-2003-05-19-exp)