Discussion:
Leafnode Filter nicht auf Teilstrings?
(zu alt für eine Antwort)
Frank Schletz
2024-02-07 07:59:32 UTC
Permalink
Moin allerseits.

Ich werde alt oder was auch immer.
Mir schlüpft immer wieder ein Thread durch den Filter.

Newsgroups: de.sci.electronics,de.sci.physik,de.talk.tagesgeschehen
Subject: Re: Der P�¤rmewumpen-Wahnsinn

Weder der hier:
newsgroup = de\..*
pattern = ^Subject:(.*Weltordnung.*|.*Stalking.*|.*DENNIS\ GERT.*|.*Hausverbot.*|.*Klimagerechtigkeit.*|.*Erdwachstum.*|.*ahnsinn.*)
action = kill

noch der hier:
newsgroup = de\..*
pattern = ^Subject:(.*Mit\ Torf\ heizen.*|.*Workstation: erste Tests.*|.*ahnsinn.*)
action = kill

wirkt.
Ich hatte schon einige Varianten ausprobiert.
Ich bin sicher, die anderen (Torf heizen, Workstation und so weiter) wirkten.
Also war ich sicher, dass ein weiterer Teilstring zur Erkennung langt.
Insbesondere, da von dem Thread-Erzeuger immer wieder das Subjekt "subtil"
angepasst wird und der Teilstring "Wahnsinn" die Konstante ist.

Was übersehe ich?
Kann auch daran liegen, dass ich mit den div. regexen der div. Sprachen
immer durcheinander komme und die Filter alle falsch sind?

Frank
Martin Klaiber
2024-02-07 15:48:19 UTC
Permalink
Post by Frank Schletz
Mir schlüpft immer wieder ein Thread durch den Filter.
Newsgroups: de.sci.electronics,de.sci.physik,de.talk.tagesgeschehen
Subject: Re: Der P�¤rmewumpen-Wahnsinn
newsgroup = de\..*
pattern = ^Subject:(.*Weltordnung.*|.*Stalking.*|.*DENNIS\ GERT.*|.*Hausverbot.*|.*Klimagerechtigkeit.*|.*Erdwachstum.*|.*ahnsinn.*)
action = kill
newsgroup = de\..*
pattern = ^Subject:(.*Mit\ Torf\ heizen.*|.*Workstation: erste Tests.*|.*ahnsinn.*)
action = kill
wirkt.
[...]
Post by Frank Schletz
Was übersehe ich?
Kann auch daran liegen, dass ich mit den div. regexen der div. Sprachen
immer durcheinander komme und die Filter alle falsch sind?
Ich kenne den leafnode-Filter nicht, aber es könnte sein, dass er
nicht wirkt, weil das gesuchte Wort kodiert ist. Beispiel aus dem
von Dir genannten Thread in der "Roh-Ansicht":

| Message-ID: <***@Achmuehle.WOR>
| Subject: Re: Der =?UTF-8?B?UMODP8OCwqRybWV3dW1wZW4tV2FobnNpbm4=?=

Vielleicht erkennt der Filter auch nicht, wenn das Subject auf zwei
Zeilen aufgeteilt ist, so wie hier:

| Message-ID: <***@4ax.com>
| Subject: Re: =?utf-8?Q?Der_P=C3=83=3F=C3=82=C2=A4rmewumpen?=
| =?utf-8?Q?-Wahnsinn?=

Wie gesagt, ich kenne den Filter nicht und weiß nicht, ob er vor dem
Filtern das Subject dekodiert. Obiges daher nur als Anregung.

Martin
Frank Schletz
2024-02-07 16:23:31 UTC
Permalink
Post by Martin Klaiber
Post by Frank Schletz
Mir schlüpft immer wieder ein Thread durch den Filter.
Newsgroups: de.sci.electronics,de.sci.physik,de.talk.tagesgeschehen
Subject: Re: Der P�¤rmewumpen-Wahnsinn
newsgroup = de\..*
pattern = ^Subject:(.*Weltordnung.*|.*Stalking.*|.*DENNIS\ GERT.*|.*Hausverbot.*|.*Klimagerechtigkeit.*|.*Erdwachstum.*|.*ahnsinn.*)
action = kill
newsgroup = de\..*
pattern = ^Subject:(.*Mit\ Torf\ heizen.*|.*Workstation: erste Tests.*|.*ahnsinn.*)
action = kill
wirkt.
[...]
Post by Frank Schletz
Was übersehe ich?
Kann auch daran liegen, dass ich mit den div. regexen der div. Sprachen
immer durcheinander komme und die Filter alle falsch sind?
Ich kenne den leafnode-Filter nicht, aber es könnte sein, dass er
nicht wirkt, weil das gesuchte Wort kodiert ist. Beispiel aus dem
| Subject: Re: Der =?UTF-8?B?UMODP8OCwqRybWV3dW1wZW4tV2FobnNpbm4=?=
Vielleicht erkennt der Filter auch nicht, wenn das Subject auf zwei
| Subject: Re: =?utf-8?Q?Der_P=C3=83=3F=C3=82=C2=A4rmewumpen?=
| =?utf-8?Q?-Wahnsinn?=
Wie gesagt, ich kenne den Filter nicht und weiß nicht, ob er vor dem
Filtern das Subject dekodiert. Obiges daher nur als Anregung.
Martin
Oh, danke.
Leafnode nutzt (laut Doku) eine PCRE-Engine.
Ich muss wohl nochmal lesen, was bei codierten Strings "passiert".
Das Problem mit diesem, mich in den Wahnsinn(sic!) treibenden Thread, ist,
dass dort immer wieder das Subjekt ein kleines bischen Verändert wird.
Und da dies immer am Anfang passiert, kann ich nur auf einen Teilstring regexen.
So kann ich nicht wirklich nen Score oder ein Kill drauf ansetzen.

Na, ich schau mal, das ich manuell applyfilter im dry-modus und Verbose laufen lasse.
Dann sehe ich (oder auch nicht), was da passiert.
Ein nachträgliches apply-filter meldet seltsamerweise einige Kills.
Die Beiträge hätten jedoch erst gar nicht durch den Filter kommen dürfen.
seufz. Die Trolle sind immer besser als ich.

Frank
Martin Klaiber
2024-02-07 22:52:50 UTC
Permalink
Post by Frank Schletz
Leafnode nutzt (laut Doku) eine PCRE-Engine.
Ja, aber das ist ja nur der Teil für die regular expressions.
Post by Frank Schletz
Ich muss wohl nochmal lesen, was bei codierten Strings "passiert".
Ich vermute, leafnode wird nicht dekodieren. In der man-page habe ich
jedenfalls nichts dazu gefunden. Würde mich auch wundern, das ist doch
üblicherweise die Aufgabe des Newsreaders.
Post by Frank Schletz
Das Problem mit diesem, mich in den Wahnsinn(sic!) treibenden Thread, ist,
dass dort immer wieder das Subjekt ein kleines bischen Verändert wird.
Und da dies immer am Anfang passiert, kann ich nur auf einen Teilstring regexen.
So kann ich nicht wirklich nen Score oder ein Kill drauf ansetzen.
Ich filtere auf Personen, nicht auf das Subject. Das Subject ändert
sich, aber die Troll-Inhalte bleiben doch mehr oder weniger immer die
gleichen und sie kommen immer von den gleichen Personen.

Und ich filtere im Newsreader, damit hat man solche Probleme mit
kodierten Header-Zeilen nicht mehr, da der Newsreader sie vor dem
Filtern dekodiert.
Post by Frank Schletz
Na, ich schau mal, das ich manuell applyfilter im dry-modus und Verbose laufen lasse.
Dann sehe ich (oder auch nicht), was da passiert.
Ein nachträgliches apply-filter meldet seltsamerweise einige Kills.
Die Beiträge hätten jedoch erst gar nicht durch den Filter kommen dürfen.
seufz. Die Trolle sind immer besser als ich.
Du könntest noch auf Crossposts filtern. Das wird von applyfilter
unterstützt. Dieser Politik-Troll-Spam (weiß gar nicht, wie man das
bezeichnen soll) wird üblicherweise über mindestens drei Newsgroups
verbreitet.

Aus <https://linux.die.net/man/8/leafnode>:

| maxcrosspost = 5
|
| If you want to combat spam, you can filter out all postings that are
| posted to more than a certain number of newsgroups. The number is
| defined by setting "maxcrosspost". Setting this parameter to very low
| values is probably a bad idea. This feature is switched off by default.

Martin
Frank Schletz
2024-02-08 09:14:58 UTC
Permalink
Post by Martin Klaiber
Post by Frank Schletz
Leafnode nutzt (laut Doku) eine PCRE-Engine.
Ja, aber das ist ja nur der Teil für die regular expressions.
Post by Frank Schletz
Ich muss wohl nochmal lesen, was bei codierten Strings "passiert".
Ich vermute, leafnode wird nicht dekodieren. In der man-page habe ich
jedenfalls nichts dazu gefunden. Würde mich auch wundern, das ist doch
üblicherweise die Aufgabe des Newsreaders.
Hm, offensichtlich. Schade.
Post by Martin Klaiber
Post by Frank Schletz
Das Problem mit diesem, mich in den Wahnsinn(sic!) treibenden Thread, ist,
dass dort immer wieder das Subjekt ein kleines bischen Verändert wird.
Und da dies immer am Anfang passiert, kann ich nur auf einen Teilstring regexen.
So kann ich nicht wirklich nen Score oder ein Kill drauf ansetzen.
Ich filtere auf Personen, nicht auf das Subject. Das Subject ändert
sich, aber die Troll-Inhalte bleiben doch mehr oder weniger immer die
gleichen und sie kommen immer von den gleichen Personen.
Tja, die "Trolle" habe ich auch im Filter.
Nur wird denen auch noch massiv geantwortet.
Manchmal sogar von Leuten, deren sonstigen Beiträge ich gerne lese.
Post by Martin Klaiber
Und ich filtere im Newsreader, damit hat man solche Probleme mit
kodierten Header-Zeilen nicht mehr, da der Newsreader sie vor dem
Filtern dekodiert.
Das werde ich wohl für diese Art Spezialfälle auch machen müssen. :(
Post by Martin Klaiber
Post by Frank Schletz
Na, ich schau mal, das ich manuell applyfilter im dry-modus und Verbose laufen lasse.
Dann sehe ich (oder auch nicht), was da passiert.
Ein nachträgliches apply-filter meldet seltsamerweise einige Kills.
Die Beiträge hätten jedoch erst gar nicht durch den Filter kommen dürfen.
seufz. Die Trolle sind immer besser als ich.
Du könntest noch auf Crossposts filtern. Das wird von applyfilter
unterstützt. Dieser Politik-Troll-Spam (weiß gar nicht, wie man das
bezeichnen soll) wird üblicherweise über mindestens drei Newsgroups
verbreitet.
| maxcrosspost = 5
|
| If you want to combat spam, you can filter out all postings that are
| posted to more than a certain number of newsgroups. The number is
| defined by setting "maxcrosspost". Setting this parameter to very low
| values is probably a bad idea. This feature is switched off by default.
Die leider nur über 3 Newsgroups.
Und auf maxcrosspost = 2 wollte ich nun nicht gehen.
Da bin ich mir nicht sicher, dass nicht einiges verloren geht.

Danke erst mal für die Hilfe

Frank

Lesen Sie weiter auf narkive:
Loading...