Artikel mit Tag blog
antispam s9y serendipity spam bayes dd-wrt firmware linksys update wlan feed online rss fun babelfish computer deutsch FDP film foto freitag fussball geek gentoo girls kirche link linux lotto Louis de Funes management microsoft nein office olympia politik qualle schnitzel sinnlos sport steuern strand tv unix urlaub video vogel web.de werbung wm work layout theme 2009 acer alkohol apple benchmark berlin bildungsurlaub centos dvb-t editor fedora filesystem frust gpl hardware idioten Job linuxtag lvm lvm2 mac macbook mysql netbook onvista parallels pc raid rootserver samba server streaming sysadmin tuning uptime usb windows wm 2010 xfce4 mail blacklist combots imap inbox jabber konferenz lotus lotus notes newsletter notes on tour postfix reminder security smtp sober thunderbird tipp viren fonic mannheim umts anonym hetzner nameserver teuer vds dovecot entsorgung netzwerk schrott tor traffic statistik buffalo drucker linkstation nas musik
Werbung im Blog oder Marketingagenten
Wer träumt nicht davon? Durch ein wenig vor-sich-hin bloggen ein paar Öre im Monat einnehmen, dafür nur ein paar bezahlte Links setzen.Heute war eine Mail der Firma LinkLift im Posteingang, die mir genau das anbietet (wie verzweifelt müssen die sein?), an der mich zwei Dinge nerven. Zum einen hat es der Vertriebs-/Marketingmensch nicht geschafft, seine eigene Emailadresse in der Signatur korrekt zu schreiben, zum anderen hängt folgender unnötiger Disclaimer an der Mail an:
GEHEIMHALTUNGSPFLICHT: Der Inhalt dieser Email ist vertraulich und ausschließlich für den bezeichneten Adressaten bestimmt. Wenn Sie nicht der vorgesehene Adressat dieser Email oder dessen Vertreter sein sollten, so beachten Sie bitte, dass der Inhalt urheberrechtlich geschützt ist und dass jede Form der Kenntnisnahme, Veröffentlichung, Vervielfältigung oder Weitergabe des Inhalts dieser Email unzulässig ist. Wir bitten Sie, sich in diesem Fall umgehend mit dem Absender in Verbindung zu setzen und das Material von Ihrem Computer zu löschen.
This e-mail is confidential and may well also be legally privileged. If you have received it in error, you are on notice of its status. Please notify us immediately by reply e-mail and then delete this message from your system. Please do not copy it or use it for any purposes, or disclose its contents to any other person: to do so could be a breach of confidence. Thank you for your co-operation.
Oooh, jetzt habe ich doch tatsächlich einen Teil einer "urheberrechtlich geschützten Email" veröffentlicht. Nein, doch, ooh!
Kategorie: vermischtes
Gedanken zu Blog-Spamerkennung mittels bogofilter
Folgendes habe ich gerade im Serendipity Forum eingekippt - vielleicht interessiert es ja auch die Leser hier:Da Akismet und auch TypePad Antispam tlw. ein wenig viel wegfiltern - gerade Kommentare auf Deutsch - habe ich gestern ein wenig begonnen, mir über Alternativen Gedanken zu machen. Erst wollte ich Spamassassin zur Erkennung von Spam/Ham verwenden, bin dann aber bei bogofilter gelandet, da Spamassassin sehr viele Tests für Mailheader hat und diese auch erwartet (Received-Zeilen etc.).
Da bogofilter ein Bayes-basierter Filter ist, muss er erst lernen, was gut und was schlechte Kommentare sind. Dazu habe ich zwei Dinge getan:
Alle guten Kommentare je in eine Datei pro Kommentar geschrieben:
SELECT
author,url,body FROM serendipity_comments WHERE STATUS = 'approved';
Alle erkannten und abgelehnten Spamkommentare in je eine Datei pro Kommentar geschrieben:
SELECT
author,url,body FROM serendipity_spamblocklog WHERE
type = 'REJECTED';
In meinem Fall ergab das dann zwei Verzeichnisse, einmal "blogspam" mit fat 370.000 abgelehnten Spams und ein "blogham" Verzeichnis mit 700 guten Kommentaren und Trackbacks. Jede der Dateien hatte untereinander author, url und body stehen.
Jetzt zum lernen:
CODE:
loco@bigboy ~ $ bogofilter -v -H -n -B blogham/
# 6663 words, 696 messages
CODE:
loco@bigboy ~ $ bogofilter -v -H -s -B blogspam/
# 331002 words, 369836 messages
Wenn ich jetzt je einen neue Spamkommentar und einen erfundenen, aber validen sauberen Kommentar zur Prüfung durch den bogofilter jage, erkennt er das brav:
CODE:
loco@bigboy ~ $ bogofilter -v -H < test.blog
X-Bogosity: Ham, tests=bogofilter, spamicity=0.000000, version=1.1.7
CODE:
loco@bigboy ~ $ bogofilter -v -H < test.blog
X-Bogosity: Spam, tests=bogofilter, spamicity=1.000000, version=1.1.7
Manuell tut das jetzt alles - aber wie verwende ich das in Serendipity? Ich bin SysAdmin, habe es überhaupt nicht mit der PHP Programmierung. Gäbe es denn Interessierte, die diesen Ansatz der Spamfilterung mittels Bayesfilter weiter verfolgen möchten und evtl. in ein Spamblock-Plugin giessen?
Kategorie: Technik
Typepad Antispam als Alternative zu Akismet in s9y *Update*
Um Blogspam zu bekämpfen, gibt es in der besten Blogsoftware der Welt das Spamblock Plugin. Dieses Plugin bietet u.a. die Integration von Akismet an. Akismet ist ein externer Dienstleister, der über eine API den Kommentar vor der Veröffentlichung prüft und eine Entscheidung über Spam oder nicht Spam trifft.Seit einiger Zeit bietet auch TypePad einen AntiSpam Service an - momentan noch im Beta Status, nativ unterstützt werden bisher Movable Type und Wordpress. Die API ist praktischerweise kompatibel zu Akismet, kann also sehr einfach auch in Serendipity integriert werden, mehr dazu gibt es weiter unten.
TypePad möchte den Dienst komplett kostenlos anbieten und schreibt dazu in der FAQ:
How much does TypePad AntiSpam cost?
TypePad Antispam is free, and will always be free, regardless of the number of comments your blog receives. We are strongly committed to spam-free blogs and vibrant, healthy conversations. Charging for the service based on the number of comments processed would mean that we would actually benefit from the behavior of spammers. We don't make money from spam!
Hierzu organisiert man sich bei TypePad einen API-Key. Dieser Key wird in der Plugin Verwaltung anstatt des Akismet API-Keys eingetragen. Anschliessend muss die Datei plugins/serendipity_event_spamblock/serendipity_event_spamblock.php editiert werden - dort einfach alle Vorkommen von "rest.akismet.com" durch "api.antispam.typepad.com" ersetzen.
Auf diesem Blog läuft diese Änderung seit einigen Stunden ohne Probleme - es wurde laut Log brav jeder Spam abgefangen. Ob man als Blogbetreiber möchte, daß jeder Kommentar quer durchs Netz geschickt wird muss jeder für sich selbst entscheiden.
Update: Und warum ist s9y die beste Blogsoftware der Welt? Weil im Spamblock Plugin die Auswahl zwischen Akismet und TypePad Antispam schwupps eingebaut wurde (im trunk und nightly builds zu finden).
Nach ewiger Zeit habe ich mal wieder ein wenig in der langen Liste der verfügbaren Plugins für s9y gestöbert um eine evtl. Alternative für mein kleines Blog zu finden. Bei YellowLed bin ich auf die Portierung eines Wordpress Themes gestolpert: WP_Premium.
Ich finds ganz schick, evtl. mache ich mich mit meinen primitiven CSS Kenntnissen aber noch an eine kleine Überarbeitung, schau mer mal.
Kategorie: vermischtes
Online Feedreader *update*
Zu Beginn meiner RSS-Feed Sammelwut habe ich all meine Feeds entweder per Thunderbird oder mit einem gesonderten Feedreader gelesen. Dies hatte den Nachteil, daß auf jeder Installation ein anderer Stand existierte, was gelesen war und was noch nicht. Meist musste ich entweder Artikel mehrfach lesen oder aber zur besseren Übersicht ganze Feeds als gelesen markieren, um wieder ein wenig Übersichtlichkeit zu schaffen.Später habe ich mit dem RSS Aggregator Plugin von Serendipity (die Blogsoftware, die auch dieses Blog betreibt) einen sogenannten Planeten aufgesetzt, quasi ein eigenes Blog, welches in regelmäßigen Abständen mit den abonnierten Feeds gefüttert wurde. Problem bei dieser Art der Aggregation: solange Suchmaschinen wie Google auf diesen Planeten zugreifen dürfen, werden Artikel aus fremden Blogs oder Newsseiten auch unter meiner URL gefunden - das findet nicht jeder Autor spassig.
Irgendwann bin ich dann auf Bloglines umgestiegen. Damit konnte ich von jedem PC aus auf meine abonnierten Feeds zugreifen, von überall aus hatte ich den gleichen Stand an gelesenen und ungelesenen Feeds.Zur einfachen Bedienung per Tastatur gibt es Shortcuts, meist funktioniert das Holen und Anzeigen der Feeds auch ohne Probleme. In den letzten Wochen und Monaten häufen sich aber die Ausfälle, teilweise gibt es über Stunden keine Feed-Updates: Zeit also, mir die Alternativen anzusehen. Da ich eigentlich zu jeder Zeit einen Onlinezugang habe und nicht z.B. im Zug zur Arbeit in Ruhe offline lesen möchte, darf es gerne ein Onlinesystem sein:
Bloglines
- Performance: oft sehr große Lücken beim Feeds abholen
- neue Bloglines Beta sieht gut aus
Google Reader
- Performance: gefällt mir sehr gut
- feine Keyboard Shortcuts, wie komme ich direkt zum nächsten ungelesenen Feed?
- Layout, evtl. kann ich das noch "pimpen"
Rojo
- Design, Layout: sieht fein aus
- Geschwindigkeit mies, ist sehr zäh
- Keyboard Shortcuts unvollständig, wie komme ich zum nächsten Feed?
Newsgator
- Design, Layout: sieht fein aus
- Performance: mau, lädt sehr lange
- Keyboard Shortcuts fehlen oder ich finde sie nicht
Neben der Wahl aus mehreren Anbietern gäbe es natürlich auch noch die Möglichkeit, mit passender Software selbst einen Online Feedreader zu betreiben:
Tiny Tiny RSS
Gregarius
Beide Tools sagen mir aber auch nicht wirklich zu - immerhin hätte ich damit aber selbst in der Hand, wann ich die Feeds abhole.
Also, lieber Leser: welche Alternativen könnte ich mir noch ansehen?
*Update*: Nachdem mømø in den Kommentaren nach https gefragt hat, hier ein Nachtrag:
- Bloglines: Login in die Beta tut per https, danach http.
- Google Reader: Login per https möglich, anschliessend wieder redirect auf http
- Rojo: ich kann da zwar https vor die URL setzen, aber Seite kaputt.
- Newsgator: Login Seite per default auf https, sehr schön
Top 10 der Blogspam Nationen
Hier ein Snapshot der Spamnationen dieses kleinen Blogs seit dem 01.02.2007:
Top 10 der Blogspam Nationen
Spamstatistik
Bei den Arbeiten an der spamblocklog Tabelle meiner Serendipity Installation, die evtl. demnächst zum release eines Plugins zur Spam Statistik führen, habe ich ein wenig mit der GeoIP API für PHP gespielt, dabei kam z.B. die folgende interessante Statistik zur Herkunft der abgelehnten Kommentare bzw. Trackbacks heraus:2647 United States
1788 Korea, Republic of
1163 Ukraine
972 Norway
861 Austria
686 China
525 India
488 Japan
226 Germany
173 Russian Federation
164 Algeria
127 Mexico
Persönlich hätte ich China und Russland weiter oben auf der Liste erwartet, aber die breite Streuung der verschiedenen Länder (auch aus Syrien, Iran und Saudi-Arabien kommt Spam) deutet auch hier auf Botnetze hin, ähnlich wie bei Spam Mails.
Kategorie: Mail/Spam
Kokain in Mannheim?
Verwirrende AWStats Statistik zu Suchbegriffen, über die Besucher zu diesem Blog finden:Der Schlämmer Horst blogged
via Hostblogger
Update: ist wohl (doch nur) eine Werbemaßnahme eines deutschen Automobilkonzerns
Serendipity 1.0-beta3
Für die beste Blogsoftware der Welt gibt es ein Update auf Version 1.0-beta3 - und wie bei allen bisherigen Updates auch war es wunderbar leicht zu installieren. TAR-File auspacken, Permissions kontrollieren/anpassen, wohlfühlen. Warum kann das nicht immer so einfach sein? Danke Garvin und Co.Tags für diesen Artikel: blog, serendipity
Kategorie: Technik



