Keine Bilder?

English

Wenn bei Ihnen die in meiner Webseite ver­wen­de­ten Bil­der nicht an­ge­zeigt wer­den, son­dern statt­des­sen le­dig­lich das Er­satz­bild aus­ge­ge­ben wird, dann liegt das dar­an, daß Ihr Web­brow­ser kei­ne Re­fer­rer über­trägt, Sie ein Fil­ter­pro­gramm wie Web­washer oder ähn­li­ches ver­wen­den oder Ihr In­ter­net­zu­gang über einen so­ge­nann­ten Proxy­ser­ver her­ge­stellt ist, der die Re­fer­rer ent­fernt. Bis­her kön­nen nur Ope­ra, Nets­cape 7 und Mo­zilla / Fire­fox die Über­tra­gung der Re­fer­rer selbst ver­hin­dern. Zu fin­den ist die­se Op­tion bei Ope­ra (7.11) un­ter „Ein­stel­lun­gen“ (Alt+P), „Da­ten­schutz“, „Pro­to­kol­lie­rung der URL-Re­fe­ren­zen er­mög­li­chen“. Fil­ter­pro­gram­me kann man in der Re­gel auch so kon­fi­gu­rie­ren, daß sie die Re­fer­rer durch­las­sen.

Referrer geben darüber Auskunft, woher der Auf­ruf ei­ner Da­tei kommt. Die auf­ru­fen­de Da­tei kann eine Da­tei der ei­ge­nen Web­sei­te sein, aber auch eine ei­ner an­de­ren Web­sei­te, die einen Ver­weis zur ei­ge­nen Sei­te ent­hält. Bei Bild­da­tei­en gibt der Re­fer­rer in glei­cher Wei­se dar­über Auf­schluß, von wel­cher Da­tei aus die be­tref­fen­de Bild­da­tei auf­ge­ru­fen wur­de. In den Pro­to­koll­da­teien (Logs) des Web­ser­vers wer­den die­se An­ga­ben ge­spei­chert und die­nen dann bei­spiels­wei­se dazu, eine Zu­griffs­sta­tistik zu er­stel­len, der man dann auch ent­neh­men kann wo­her die Be­su­cher ge­kom­men sind.

Vor einiger Zeit mußte ich feststellen, daß je­mand ver­sucht hat auf einen Schlag alle Bild­tei­le der auf mei­ner Sei­te ein­seh­ba­ren Stadt­plä­ne und Kar­ten in je ei­ner ent­spre­chend vor­be­rei­te­ten HTML-Da­tei dar­zu­stel­len, auch so et­was sieht man in ei­ner Sta­ti­stik. Des­we­gen habe ich das jetzt so kon­fi­gu­riert, daß die Bild­da­tei­en nur noch bei Zu­griff durch Da­teien, die zu mei­ner ei­ge­nen Web­sei­te ge­hö­ren aus­ge­ge­ben wer­den. Das wird eben mit­hil­fe des Re­fer­rers fest­ge­stellt. Wird der nicht über­tra­gen, so wer­den die Bild­da­tei­en nicht aus­ge­ge­ben.

In den Logs wird jeder Dateizugriff in einer neuen Zei­le no­tiert. Wel­che An­ga­ben ge­spei­chert wer­den hängt von der Kon­fi­gu­ra­tion des Web­ser­vers ab. Zur Er­läu­te­rung mö­gen die bei­den fol­gen­den Bei­spie­le aus mei­nem Ser­ver­log die­nen. Das er­ste zeigt einen Sei­ten­zu­griff mit, das zwei­te ohne Re­fer­rer­über­tra­gung.

Beispiel 1
195.37.166.231 - - [02/Nov/2004:11:20:02 +0100] "GET /stw/drg.html HTTP/1.0" 200 1912 "http://www.blocksignal.de/indexn.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 4.0)"
195.37.166.231 - - [02/Nov/2004:11:20:02 +0100] "GET /stw/drgn.html HTTP/1.0" 200 2619 "http://www.blocksignal.de/stw/drg.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 4.0)"
195.37.166.231 - - [02/Nov/2004:11:20:02 +0100] "GET /stw/drgs.html HTTP/1.0" 200 34401 "http://www.blocksignal.de/stw/drg.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 4.0)"
195.37.166.231 - - [02/Nov/2004:11:20:02 +0100] "GET /stw/drg/lat1k.jpg HTTP/1.0" 200 6814 "http://www.blocksignal.de/stw/drgs.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 4.0)"

Beispiel 2
80.140.50.36 - - [01/Nov/2004:14:17:05 +0100] "GET /stw/drg.html HTTP/1.1" 304 - "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; DigExt)"
80.140.50.36 - - [01/Nov/2004:14:17:05 +0100] "GET /stw/drgn.html HTTP/1.1" 304 - "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; DigExt)"
80.140.50.36 - - [01/Nov/2004:14:17:05 +0100] "GET /stw/drgs.html HTTP/1.1" 304 - "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; DigExt)"
80.140.50.36 - - [01/Nov/2004:14:17:05 +0100] "GET /stw/drg/lat4k.jpg HTTP/1.1" 403 528 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; DigExt)"

Bedeutung der einzelnen Angaben

195.37.166.231Die IP-Adres­se des auf­ru­fen­den Rech­ners, die bei den mei­sten Sur­fern beim Ver­bin­dungs­auf­bau in das In­ter­net dy­na­misch vom Pro­vi­der zu­ge­wie­sen wird und sich des­halb in der Re­gel mit je­der neuen Ein­wahl än­dert. An­stel­le der IP kann hier auch der eben­falls dy­na­misch ver­ge­be­ne Rech­ner­na­me ste­hen.
- -Anstelle der bei­den Stri­che kön­nen hier noch der An­wen­der­na­me ge­mäß RFC 931 so­wie ein vom An­wen­der selbst ver­ge­be­ner An­wen­der­na­me ste­hen.
[02/Nov/2004:11:20:02 +0100]Datum, Uhr­zeit und Zeit­zo­ne des Zu­griffs, die +0100 steht da­bei für + 1 Stun­de ge­gen­über GMT, also MEZ.
GET /stw/drg.html HTTP/1.0GET: Me­tho­de des Zu­griffs; an­ge­for­der­te Da­tei und Pro­to­koll.
200Statuscode, der über das Er­geb­nis des Zu­griffs Aus­kunft gibt. Es be­deu­ten bei­spiels­wei­se:
200: Zugriff er­folg­reich, der Ser­ver konn­te die an­ge­for­der­ten Da­ten ver­sen­den, es gab kei­ne Pro­ble­me.
304:Daten wurden schon ein­mal ge­la­den und sind seit dem letz­ten Zu­griff nicht ver­än­dert wor­den. Das ist ab­hän­gig von den Brow­ser­ein­stel­lun­gen, in de­nen man meist ein­stel­len kann, daß die an­ge­for­der­ten Sei­ten nur nach Ab­lauf ei­nes be­stimm­ten In­ter­valls neu ge­la­den wer­den sol­len. Vor Ab­lauf des In­ter­valls fragt der Brow­ser le­dig­lich mit Zeit­an­ga­be beim Ser­ver an, ob die an­ge­for­der­te Da­tei seit dem letz­ten Zu­griff ver­än­dert wur­de. Das er­spart un­nö­ti­ges Neu­la­den und da­mit auch un­nö­ti­gen Da­ten­ver­kehr.
400:Die Anfrage enthält Syn­tax­feh­ler, wes­halb der Ser­ver sie nicht be­ant­wor­ten kann.
403:Zugriff verweigert. Das kommt bei zu­gangs­ge­schütz­ten Sei­ten dann vor, wenn kei­ne oder fal­sche Zu­gangs­da­ten ein­ge­ge­ben wur­den. In mei­nem Fall kommt es we­gen der Ser­ver­ein­stel­lun­gen auch dann vor, wenn der Re­fer­rer nicht mit über­tra­gen wur­de.
404:Der angeforderte URL exi­stiert nicht.
1912Anzahl der über­tra­ge­nen Bytes
http://www.blocksignal.de/indexn.htmlDas ist nun der Re­fer­rer.
Er zeigt, von wo aus die Da­tei, auf die zu­ge­grif­fen wer­den soll, auf­ge­ru­fen wur­de. Das kann eine Da­tei der ei­ge­nen Web­sei­te sein, aber auch eine Da­tei ei­ner an­de­ren Web­sei­te, auf der ein ent­spre­chen­der Ver­weis vor­han­den ist.
Mozilla/4.0 (compatible; MSIE 6.0;
Windows NT 4.0)
Angaben zur Version des Brow­sers. Hier fin­den sich ge­ge­be­nen­falls auch Ein­trä­ge der Such­pro­gram­me von Such­ma­schi­nen.

Im ersten Beispiel hat ein Besucher meiner Web­sei­te im In­halts­ver­zeich­nis (indexn.html) der Start­sei­te auf das The­ma Licht­ta­ges­sig­na­le ge­klickt, wo­durch (da­mals noch) das Frame­set drg.html für die­ses The­ma an­ge­for­dert wur­de. Die­ses Frame­set hat zwei wei­te­re Da­tei­en an­ge­for­dert, die Text­sei­te drgs.html und das ent­spre­chen­de In­halts­ver­zeich­nis (Na­vi­ga­tion) drgn.html zu dem auf­ge­ru­fe­nen The­ma. Die Text­sei­te hat wie­de­rum eine Bild­da­tei lat1k.jpg an­ge­for­dert. So setzt sich das dann fort, bis die gan­ze Sei­te auf­ge­baut ist und alle Be­stand­tei­le an­ge­zeigt wer­den.

Im zweiten Beispiel hat ein Besucher, der die­se Sei­te be­reits ein­mal ge­se­hen hat, die glei­che Sei­te er­neut auf­ge­ru­fen. Seit dem letz­ten Zu­griff wur­de die Sei­te nicht ge­än­dert, wes­we­gen der Sta­tus­co­de 304 zu­rück­ge­ge­ben wur­de. Der fol­gen­de Strich zeigt an, daß au­ßer der An­for­de­rung kei­ne Da­ten über­tra­gen wur­den (0 By­tes). Die Sei­te wur­de vom Brow­ser des Be­su­chers mit­hil­fe der beim letz­ten Be­such im so­ge­nann­ten Cache des Brow­sers ge­spei­cher­ten Da­ten dar­ge­stellt. Der fol­gen­de Strich steht an der Stel­le, an der der Re­fer­rer zu fin­den wäre, wenn er denn über­tra­gen wor­den wäre. Weil er fehlt, wur­de die nach­fol­gen­de An­for­de­rung der Bild­da­tei mit Sta­tus­co­de 403 quit­tiert und das an­ge­for­der­te Bild nicht über­tra­gen.

Der Referrer dient wie oben beschrieben dazu, zu er­ken­nen wo­her die Be­su­cher der ei­ge­nen Sei­te kom­men. Das ist schließ­lich auch le­gi­tim. Den al­lent­hal­ben zu le­sen­den Vor­wurf, man kön­ne da­mit Nut­zer­pro­fi­le er­stel­len, kann ich nicht recht nach­voll­zie­hen. Das wür­de er­for­dern, daß man er­ken­nen kann wo­hin der Be­su­cher ent­schwun­den ist wenn er die be­tref­fen­de Sei­te ver­läßt. Wenn man die Spur ei­nes Sur­fers durch das WWW ver­fol­gen woll­te, wäre es dann aber viel bes­ser, Zu­griff auf mög­lichst vie­le Logs im WWW zu ha­ben. Das kann man je­doch aus­schlie­ßen. Der­ar­ti­gen Zu­griff ha­ben be­sten­falls die gro­ßen Web­ho­ster, die je­doch da­mit rech­nen müß­ten ihre Kun­den zu ver­lie­ren wenn das be­kannt wür­de. Au­ßer­dem steht im Re­fer­rer nur wo­her der Be­su­cher kam und nicht etwa wie er heißt und wo er wohnt. Wie oben ge­schil­dert, sind dar­über hin­aus nur die IP-Adres­se und die Brow­ser­ken­nung in der Log-Da­tei vor­han­den.

Neben den im Log zu findenden Angaben wie IP, Brow­ser­ver­sion und Be­triebs­sy­stem las­sen sich je­doch eine Rei­he wei­te­rer Da­ten mit ent­spre­chend vor­be­rei­te­ten Web­sei­ten sam­meln, vor al­lem dann, wenn im Brow­ser Ja­va­script ak­ti­viert ist und Coo­kies ak­zep­tiert wer­den. Wer also das Da­ten­sam­meln er­schwe­ren möch­te, wäre folg­lich bes­ser be­ra­ten Ja­va­script ab­zu­schal­ten und be­stimm­te Coo­kies ab­zu­leh­nen. Wei­te­re In­for­ma­tio­nen dazu sind leicht zu fin­den, wenn man eine Such­ma­schine mit den Be­grif­fen Ja­va­script, Nut­zer­pro­fil und Si­cher­heit füt­tert. Da Ja­va­script auch we­gen der im­mer wie­der be­kannt wer­den­den Si­cher­heits­lücken der Brow­ser von vie­len ab­ge­schal­tet wird und text­ba­sier­te Brow­ser für die Aus­ga­be per Braille­zei­le Ja­va­script ohne­hin nicht ver­ar­bei­ten, ist es al­ler­dings är­ger­lich, daß auf vie­len Web­sei­ten grund­le­gen­de Funk­tio­nen wie die Na­vi­ga­tion ohne Not mit Ja­va­script rea­li­siert wer­den. Wes­halb muß bei­spiels­wei­se ein an­zu­zei­gen­des Bild in ei­nem neuen, der Grö­ße an­ge­paß­ten Fen­ster ge­öff­net wer­den? Ich em­pfin­de das als Be­vor­mun­dung, schließ­lich be­stim­me zu­nächst­mal ich selbst, wel­che Fen­ster ich auf mei­nem Bild­schirm ha­ben will und wel­che nicht.

Mißbrauch mit den Referrern wird aber auf an­de­re Wei­se be­trie­ben, näm­lich in­dem die Logs mit ma­ni­pu­lier­ten Re­fer­rern ge­füt­tert wer­den. Sieht der Web­sei­ten­be­trei­ber sei­ne Sta­ti­stik durch, so lan­det er, wenn er nach­se­hen will wo­her sei­ne Be­su­cher ka­men, auf der Sei­te des Spam­mers. Ver­gleich­bar lä­stig wie E-Mail-Spam wird das Re­fer­rer­spam­ming für die Be­trei­ber von Weblogs / Blogs, die dort an­zei­gen von wel­chen Sei­ten die mei­sten Be­su­cher auf ihr Blog kom­men. Das bringt dem Be­trei­ber ohne Ar­beits­auf­wand Ver­wei­se zu an­de­ren Sei­ten und zeigt dem Be­su­cher, wem das Blog einen Ver­weis wert war. Der Spam­mer er­hofft sich da­von zwei Ef­fek­te. Zum einen führt er so ah­nungs­lose Blog­be­su­cher auf sei­ne Sei­te, zum an­de­ren er­höht sich so die An­zahl der auf sei­ne Sei­te zei­gen­den Ver­wei­se, was ge­ge­be­nen­falls zu ei­ner bes­se­ren Be­wer­tung bei Such­ma­schi­nen führt. Das glei­che Pro­blem kann bei Gä­ste­bü­chern auf­tre­ten, die dem Be­su­cher die Mög­lich­keit bie­ten eine Home­page ein­zu­tra­gen. Bei­des ist je­doch kein Grund für den nor­ma­len Web­sei­ten­be­su­cher die Re­fer­rer zu unter­drücken, schließ­lich wird der Web­sei­ten­be­trei­ber da­mit be­lä­stigt.

English summary

If you do not see the pictures used in my web page, but instead a replacement picture is only spent, then that is because of the fact that your webbrowser does not transfer referrer or you use a filter program like Webwasher or an proxy, which filters. So far the Opera browser, Mozilla and Netscape 7 can prevent the transmission of the referrer. This option is in Opera (7.11) to find under "Preferences" (Alt+P), "Datasecurity", "Logging of the URL references makes possible". With the other browsern this option is present, but not available in the preferences dialog. Filter programs can be configured in such a way that they let the referrer through.

Referrers give informations from where the call of a file comes. That shows, by which other file from the file is called. The calling file can be a file of the own web page or one another web page, which contains a URL to the own side. With image files the referrer shows likewise, from which file the image file was called. In the log files of the web server these data are stored and serve then e.g. to provide an access statistics the more state than the pure access numbers.

How I had to determine some time ago, someone has all picture parts of the city plans and maps observable on my side to download tried at one time - that is also in a statistics to see -, I that had in such a way configured now that the image files only with access by files, which belong to my own web page are spent. That is determined evenly on the basis the referrers. If that is not transferred, then the image files are not spent.

Translated with babelfish :)


Letzte Änderung am 27.2.2012
© Steffen Buhr