{"id":108,"date":"2008-06-25T20:33:49","date_gmt":"2008-06-25T19:33:49","guid":{"rendered":"http:\/\/florianhaas.net\/blog\/?p=108"},"modified":"2008-06-25T16:01:40","modified_gmt":"2008-06-25T15:01:40","slug":"warning-xdcberprxfcfung-photolizenzen-sollte-wohl-warning-uberprufung-photolizenzen-heisen","status":"publish","type":"post","link":"https:\/\/floriantischner.net\/blog\/2008\/06\/25\/warning-xdcberprxfcfung-photolizenzen-sollte-wohl-warning-uberprufung-photolizenzen-heisen\/","title":{"rendered":"&#8220;warning&#8221; &#8220;\\xdcberpr\\xfcfung Photolizenzen&#8221; (sollte wohl &#8220;warning&#8221; &#8220;\u00dcberpr\u00fcfung Photolizenzen&#8221; hei\u00dfen)"},"content":{"rendered":"<p>&#8220;warning&#8221; &#8220;\\xdcberpr\\xfcfung Photolizenzen&#8221; (sollte wohl &#8220;warning&#8221; &#8220;\u00dcberpr\u00fcfung Photolizenzen&#8221; hei\u00dfen) tauchte heute Morgen im Access-log vom Apachen auf. Gekommen ist das von einer dynamischen IP-Adresse der T-Com. Der Schweinehund von Crawler macht sich noch nicht einmal die M\u00fche, die robots.txt auch nur abzurufen, sondern liest einfach mal direkt das Stammverzeichniss.<\/p>\n<p>Ich habe das Gef\u00fchl, dass der Crawler noch ganz am Anfang der Entwicklung ist; jedenfalls hoffe ich das f\u00fcr den Auftraggeber: Der Crawler folgt zwar normalen HTTP-Weiterleitungen, folgt aber keinen Links. Eingebetette Bilder l\u00e4dt er auch nicht runter. Er identifiziert sich nicht eindeutig und scheinbar gibt es vom Urheber keine Internetseite, die erkl\u00e4rt, wer daf\u00fcr verantwortlich ist und was genau er macht.<\/p>\n<p>Ich werde das mal im Auge behalten; wenn der wiederkommt und mehr runterl\u00e4d, gibt es &#8216;ne Beschwerde beim T-Com Abuse.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>&#8220;warning&#8221; &#8220;\\xdcberpr\\xfcfung Photolizenzen&#8221; (sollte wohl &#8220;warning&#8221; &#8220;\u00dcberpr\u00fcfung Photolizenzen&#8221; hei\u00dfen) tauchte heute Morgen im Access-log vom Apachen auf. Gekommen ist das von einer dynamischen IP-Adresse der T-Com. Der Schweinehund von Crawler macht sich noch nicht einmal die M\u00fche, die robots.txt auch nur abzurufen, sondern liest einfach mal direkt das Stammverzeichniss. Ich habe das Gef\u00fchl, dass der [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-108","post","type-post","status-publish","format-standard","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/floriantischner.net\/blog\/wp-json\/wp\/v2\/posts\/108","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/floriantischner.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/floriantischner.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/floriantischner.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/floriantischner.net\/blog\/wp-json\/wp\/v2\/comments?post=108"}],"version-history":[{"count":0,"href":"https:\/\/floriantischner.net\/blog\/wp-json\/wp\/v2\/posts\/108\/revisions"}],"wp:attachment":[{"href":"https:\/\/floriantischner.net\/blog\/wp-json\/wp\/v2\/media?parent=108"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/floriantischner.net\/blog\/wp-json\/wp\/v2\/categories?post=108"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/floriantischner.net\/blog\/wp-json\/wp\/v2\/tags?post=108"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}