Zum Inhalt springen

Reguläre Ausdrücke zur Spambekämpfung in Serendipity

Serendipity erlaubt es in der Konfiguration der „Anti-Spam-Maßnahmen“ entsprechende URLs, Namen, E-Mails oder Textbeiträge als Spam zu kennzeichnen und entsprechend zu behandeln (auf Moderation schalten, automatisch löschen).

Vorteilhaft dabei ist es auch „Reguläre Ausdrücke“ einsetzen zu können. Wikipedia erklärt diesen Begriff wieder einmal.. Kurz gesagt kann ich für Wortteile Variablen einsetzen und somit eine Vielzahl von ähnlichen Wörtern mit einem regulären Ausdruck abdecken.

Einfaches Beispiel: Ich hatte Trackbackspams die als Namen mal „ma286en“, mal „ma483en“, mal „ma3234en“ eintrugen (es waren sogar noch mehr). Gemeinsam ist all diesen Namen, dass sie mit „ma“ beginnen, eine Zahlenfolge beinhalten und danach mit „en“ enden. Jedes mal den neuen Namen zu sperren hätte nichts gebracht, da immer neue Kombinationen auftauchten und ich nur hinterher „gehinkt“ wäre.

Hier kommen nun die regulären Ausdrücke ins Spiel. Als Variable für eine oder mehrere Zahlen verwendet man z.B. „[0-9]+“. Gibt man nun „ma[0-9]+en“ ein erwischt man alle der oben genannten Variationen. Natürlich gibt es noch viel komplexere Möglichkeiten.

Warum ich überhaupt darüber schreibe ist, dass mir selbst diese regulären Ausdrücke nicht so geläufig sind. Daher war ich erfreut, bei Frank Helmschrott einen Hinweis auf „Reggy“ zu finden. Dieses kostenlose Programm für MacOS erlaubt das Austesten von regulären Ausdrücken anhand von eigenen Beispielstexten. Somit kann man ausprobieren, ob eine bestimmte Kombination auch wirklich all das findet was man meint.

Ein kleines, feines Programm, dass mir ab nun immer wieder hilfreich zu Seite stehen wird um Spams (hoffentlich) noch erfolgreicher abwehren zu können.

Ein Kommentar

  1. Mit Spams ist nicht zu spassen. Über Trackbacks und per Kommentar kommen täglich hundert und mehr nervige Nachrichten, die es gilt abzufangen. Nachfolgend ein paar Zeilen zu meiner jetzigen Strategie. Captchas Zuerst, was es auf meinem Blog nicht gib

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.