Das ist nicht nett von den Heise-Leuten: Sie untersagen seit kurzem Yahoo Pipes ihre Feeds zu verhackstücken. Zumindest sieht es danach aus. Bemerkt habe ich das erst heute, als ich wieder meine Pipe zu “Wikis in Medien” durchlaufen ließ, die auf dem Filtern von rund 15 medienrelevanten Newsfeeds basiert. Das Ergebnis lautete bei den Heise.de-Feeds “403 Forbidden”.
P.S. Könnte aber auch sein, dass Yahoo Pipes alle Feeds auf diese Weise brandmarkt, die nur den Titel widergeben, aber keinen Zugriff auf den Inhalt zulassen. Dann könnte die Überschrift auch lauten “Yahoo Pipes mag Heise nicht” … Hmm.
P.P.S. Heise-Webmaster Wolfgang Schemmel bestätigt meine Vermutung: Heise mag tatsächlich Yahoo Pipes nicht, weil Yahoo Pipes keine Sicherung gegen Content-Klau anbietet:
“Missbrauch will ich technisch umgehen, leider ist die Pipes-Doku zu robots.txt sehr spaerlich, und das wenige was man findet entspricht nicht dem aktuellen Stand. Typische Beta eben. Ich warte selbst schon darauf, dass sie die neue robots.txt abholen und auswerten, vorher komme ich auch nicht weiter.”
P.P.P.S. Wolfgang Schemmel hat das Problem noch etwas genauer analysiert:
“Eine genauere Inspektion der Aenderungen ergab als Ursache fuer das “403 Forbidden” einen Konfigurationsfehler auf unserer Seite. Das wird in rund 1-2 Stunden behoben sein. Damit sollten die Feeds selbst wieder funktionieren. Damit muss ich auch die Aussage zu robots.txt relativieren, da die Schlussfolgerung leider auf falschen Voraussetzungen beruhte.”
Beiträge zu verwandten Themen:


Pingback: KoopTech » Titelgeschichte » News-Scraping selbst gemacht - Interview mit Martin Virtel