Daß Spam (ausdrücklich: im Sinne unerwünschter Werbemail!) eine Pest ist, darüber scheint auch allerseits einhellig Einvernehmen zu bestehen; das braucht somit nicht weiter diskutiert werden.
Seit Ende Januar 2003 haben wir im Rechenzentrum auf dem Rechner, auf dem alle Mails von außerhalb landen, zusätzlich zum Virenscanner eine Spam-Erkennungssoftware (Spam-Assassin) eingerichtet.
(Von hier ab wird's nun deutlich technischer ...)
Diese Software überprüft die Mail nach diversen Kriterien:
Die positiv geprüften Regeln werden in zusätzlich
eingefügten Header-Zeilen aufgelistet,
so daß der einzelne Benutzer bei Lust und/oder Bedarf
nachvollziehen kann, wieso eine bestimmte Mail, die er für
Spam hält, nicht als solche erkannt wurde, oder wieso eine
andere fälschlicherweise als Spam bewertet wurde.
Die zugehörigen Werte werden aufsummiert und sowohl als Zahl
als auch als Kodierung zur textuellen Erkennung im Header
aufgeführt.
Außer dem Einfügen dieser Header-Zeilen findet auf diesem
Rechner keine weitere Markierung statt.
Erst auf dem POP3/IMAP-Server des Rechenzentrums wird vor dem Ablegen
in der Mailbox nach einer bestimmten Header-Zeile gesucht und ggf. der
Text /SPAM!/ dem Subject (Betreff) vorangestellt.
Die entsprechende Konfiguration in der globalen Datei
/etc/procmailrc lautet:
Bei bestimmten Mails -- die, die über die bugtraq-Mailingliste kommen --
ist wegen des Inhalt eine erhöhte Wahrscheinlichkeit gegeben,
daß sie fälschlicherweise als Spam klassifiziert werden.
Deshalb habe ich mir einen Eintrag für die lokale -- im Heimatkatalog --
Datei .procmailrc fertiggemacht:
Oder für jemanden, der die ganzen zusätzlichen Header-Zeilen
loswerden will:
Worauf ich ausdrücklich gedrängt habe war, daß auf den
Rechenzentrums-Seiten niemandem empfohlen wird die als Spam
eingestufte Mail ungesehen wegzuwerfen.
Wer's dennoch tut, macht es auf eigenes Risiko. Ich sage jetzt schon vorher,
daß er/sie früher oder später eine Mail löschen
wird, die er/sie nicht hätte löschen wollen oder sollen.
Aber es soll keine/r behaupten können, ich hätte es nicht gesagt ...
Nachdem nun zum 137. Mal die Frage auftauchte:
Einfache Antwort: Nein, das ist verboten.
Die ausführliche Antwort ändert daran auch nicht viel.
Früher gab es im Grundgesetz einen Artikel, der im
umgangssprachlichen Gebrauch als Postgeheimnis bezeichnet wurde.
Ob es den noch gibt oder ob oder inwieweit er vom "neuen"
TKDG (Telekommunikationsdienstegesetz) abgelöst wurde,
mögen bitte die Damen und Herren Juristen unter sich ausmachen.
Wer nicht damit einverstanden ist, wird sich wohl an einen meiner
Vorgesetzten (Rechenzentrumsleiter, Chief Information Officer,
Präsident, ...) wenden und dafür sorgen müssen,
daß mir selbiger -- am liebsten schriftlich -- mit den
Worten: "Dienstanweisung: ..." nähertritt.
(Dann hat er nämlich den Schwarzen Peter.)
Das war der Teil, der sich auf das kollektive Löschen von
vermeintlich erkannter Spam bezieht.
Anders sieht es aus, wenn ein Benutzer die bei ihm/ihr selbst eingehenden,
als Spam markierten Mails gesondert behandelt. Es muß jedoch
vorab klar sein, daß -- so lästig Spam auch sein mag --
es keine sichere Methode gibt Spam zu erkennen,
weil die Spammer immer dazulernen und die
meisten Methoden im Lauf der Zeit aushebeln. Ebenso läßt
sich nie ausschließen, daß nicht unbescholtene Mails
fälschlicherweise als Spam klassifiziert werden.
(Deshalb auch obige Warnung unter
"Gegenmaßnahmen"
:
"Worauf ich ausdrücklich gedrängt habe ..."
[bis Ende des Abschnitts])
Aus diesem Grund achte ich gründlichst darauf, daß
mindestens auf Seiten, für deren Inhalt ich verantwortlich
gemacht werden kann, in keiner Weise eine Anleitung zum automatisierten
Löschen von Mail auftaucht.
Sorry, wie das mit dem automatisierten Löschen von Spam geht,
muß jeder selber rauskriegen.
Nochmal: Weder halte ich automatisiertes Löschen von Mails
für eine akzeptable Idee, noch habe ich jemals jemandem gesagt,
er/sie solle etwas Derartiges machen. Im Gegenteil,
ich rate ausdrücklich davon ab!
Eine andere Frage, die ebenfalls immer wieder auftaucht:
Das Regelwerk der von uns verwendeten
Spam-Erkennungssoftware (Spam-Assassin)
ist recht komplex.
Zusätzliche Regeln und/oder Änderungen bei Gewichtungen
sind ohne genaue Kenntnis der Verflechtungen des Regelwerks
m. E. bedenklich.
Deshalb ist momentan keine Adresse zum Abliefern derartiger Mails vorgesehen.
Etwas anders sieht es aus, wenn die Bayes-Funktionalität des
Spam-Assassins in Betrieb genommen würde. Da werden dem
Programm "gute" und "schlechte" Mails vorgesetzt. Darüber
werden -- vereinfacht gesprochen -- Wort-Statistiken aufgebaut.
Aus der Häufigkeit und der Kombination der in einer eingehenden
Mail vorhandenen Wörter wird entschieden, ob diese Mail
als Spam klassifiziert wird oder nicht.
Hier wäre es sinnvoll dem Programm mit falsch bzw. nicht erkannter
Spam nachträglich näherzutreten.
Aber die Methodik mit den Bayes-Filtern ist m. E. nur sinnvoll,
wenn der Spam-Filter auf Benutzer-Basis läuft.
Zwei extreme Beispiele:
In beiden Fällen ist das Ergebnis deutlich weniger zufriedenstellend,
als wenn jeder "nur" seinen eigenen Spam-Filter in dieser Art trainieren
würde.
Wahrscheinlich wird es in absehbarer Zukunft darauf hinauslaufen,
daß das Rechenzentrum einen Spam-Filter mit allgemeinen
Regeln zur Verfügung stellt, daß aber darauf aufbauend
jeder Nutzer selber für sich eine gewisse Menge Fein-Tuning
vornehmen muß. Nur so werden wir akzeptable Spam-Erkennung
realisieren können. Momentan scheitert das an der
Leistungsfähigkeit des POP3-/IMAP-Servers.
Und bevor wir diesen Service über mehrere Rechner verteilen
können, sind noch grundlegende Umstellungen (Austausch)
von Software notwendig. Diese sind in Vorbereitung ...
Die auf diesen Seiten zum Ausdruck gebrachten Meinungen sind die meinigen,
nicht notwendigerweise die der Universität Osnabrück.
(Es sei denn, sie würden zufällig übereinstimmen oder
wären entsprechend gekennzeichnet.)
Zum Thema "Links":
Bei "Links" handelt es sich stets um "lebende" (dynamische) Verweisungen.
Gernot Skalla hat bei der erstmaligen Verknüpfung zwar den fremden
Inhalt daraufhin überprüft, ob durch ihn eine mögliche
zivilrechtliche oder strafrechtliche Verantwortlichkeit ausgelöst wird.
Er überprüft aber die Inhalte, auf die er in seinem Angebot
verweist, nicht ständig auf Veränderungen,
die eine Verantwortlichkeit neu begründen könnten.
Wenn er feststellt oder von anderen darauf hingewiesen wird,
daß ein konkretes Angebot, zu dem er einen Link bereitgestellt hat,
eine zivil- oder strafrechtliche Verantwortlichkeit auslöst,
wird er den Verweis auf dieses Angebot aufheben.
(Quelle:
Impressum/Disclaimer des Berliner Beauftragten für Datenschutz
und Informationsfreiheit Stand: 09/2002)
Last change: Sat Jan 17 10:55:27 NFT 2004
Vorläufig werden Mail größer als 256 kB nicht
auf Spam getestet.
Wenn sich das bei Spammern 'rumspricht, wird diese Grenze
wohl erhöht werden müssen.
Solange lassen wir diese Mails hier aus Gründen der Optimierung
unbehelligt durch.
# Rewrite Subject Line, if SpamLevel is high enough.
:0fw
* < 256000
* ^X-Spam-Level: \*\*\*\*\*
| sed '1,/^$/s@^Subject:@Subject: /SPAM!/@'
Übersteigt der Spam-Level den Wert 5 ( 5 Sternchen oder
mehr auf der entsprechenden Zeile) wird dem Subject (Betreff) eine
Text-Markierung vorangestellt. Nicht alle Klienten können
auf die X-Spam-...-Header-Zeilen prüfen.
(256 kB-Prüfung -- ja, ja, stimmt nicht ganz -- wieder wegen Optimierung;
und wenn's überhaupt als Spam eingestuft wurde, nachschauen ob's
über bugtraq kam und dann die Markierung im Subject entfernen.)
# Rewrite Subject Line, if it's bugtraq mail
:0fw
* < 256000
* ^X-Spam-Level: \*\*\*\*\*
* ^TO bugtraq
| sed '1,/^$/s@^Subject: /SPAM!/@Subject:@'
# X-Spam-?? Header-Zeilen entfernen: "[ ]" ist jeweils "[<blank><tab>]"
:0 f
* < 256000
| sed -e '1,/^$/{; /^X-Spam-/d; /^[ ][ ]*SPAM: /d; }'
Löschen von Spam
Kann das Rechenzentrum die Spam nicht gleich auf dem Server löschen?
Für mich persönlich habe ich mir
folgende Vorgehensweise ausgewählt:
Mails, die beim Mailer der Uni ankommen (also nicht als
fehlerhaft erst gar nicht angenommen werden), werden auch
nach Möglichkeit zugestellt.
Punkt, Ende der Diskussion!
Die Gefahr, daß jemand versucht mich für durch
seine/ihre versemmelte Konfiguration verlorengegangene Mail
verantwortlich zu machen, ist mir definitiv zu groß.
Für die gängigen
Klienten-Progamme ist die
Spam-Seite des Rechenzentrums
ein guter Ausgangspunkt.
Serverseitig wird die Sache schnell komplizierter, weil hier kein
mausbedienbares Tool exixtiert. Wird es von mir auch nicht geben;
siehe oben das mit der "Dienstanweisung".
Wer serverseitiges Löschen haben will, wird sich mit UNIX
und dem Programm procmail auseinandersetzen müssen.
Und der technischere Teil der obigen
Gegenmaßnahmen liefert
die nötigen Informationen, wie die Mails markiert werden.
neue Regeln zur Erkennung von Spam
Ich habe hier Spams, die nicht als solche erkannt wurden.
Wo kann ich die hinschicken?
(Das gilt natürlich für jede Sprache, die hierzulande keine
weite Verbreitung hat.)
(Im umgekehrten Fall -- "gute Mails" als Spam lernen zu lassen --
ist es noch schlimmer: dann werden in Zukunft zu viele
"gute Mails" als Spam klassifiziert.)
Disclaimer: