Abbildung 1: Caching im WWW

1 Caching Konzepte

Es existieren zwei unterschiedliche Möglichkeiten des Cachings von Web Seiten2 im Internet: Client Caching und Proxy Caching. Die Abbildung 1 zeigt das Zusammenspiel der beiden Ansätze.

1.1 Client Caching

Client Caches sind Teil der Anwendersoftware, z.B. von WWW Browsern, wie Mosaic oder dem Netscape Navigator. Der Client Cache hält nicht nur das aktuell angezeigte Dokument, sondern auch früher angeforderte. Grundsätzlich kann man zwei Formen des Client Caching unterscheiden: persistent und nicht-persistent. Persistente Caches verwahren die WWW Dokumente auch zwischen den Aufrufen des Web Browsers. Nicht-persistente Caches löschen ihren Inhalt beim Beenden der Anwendung.

Der Zugriff auf beide Typen von Caches unterscheidet sich nicht. Wenn der Benutzer eine bestimmte WWW Seite anfordert, prüft die Anwendung zuerst ob sich die gewünschte Seitebereits im Cache befindet. Bei Erfolg kann diese Seite dem Benutzer schnell angezeigt werden und muss nichtüber das Netz geladen werden.

Als Methoden der Kohärenzprüfung bieten Client Caches derzeit nur sehr rudimentäre Möglichkeiten. Der Netscape Navigator bietet hier z.B. drei Techniken zur Verifikation eines Dokuments: Once per Session, Every Time und Never. Abhängig von dieser Einstellung wird entschieden, ob eine im lokalen Cache befindliche Kopie erst auf Aktualität geprüft oder sofortangezeigt wird. Konsistenzprüfungen werden z.B. mit einem conditional GET an einen HTTP oder Proxy Server (vgl. nächsten Abschnitt) unternommen. Mehr hierzu findet sich im Kapitel 4.1.

Als grundsätzliche Regel für den Cache gilt: Je grösser er ist, desto grösser ist die Wahrscheinlichkeit, dass er die gewünschten Daten enthält.

1.2 Proxy Caching

Proxy Caches sind Teil des mit World Wide Web benutzen Netzwerkes. Sie sind auf strategischgünstigen Maschinen plaziert (typischerweise Gateways). Ein Proxy Cache bedient, anders als ein Client-Cache, mehrere Clients.Eine derzeit häufige weitere Einsatzmöglichkeit für Proxy Caches ist die Funktion eines Firewalls für Sicherheitsaspekte. Der Proxy ist ein Server, durch den der gesamte Zugriff aufDaten ausserhalb des Firmen-/Organisationsnetzes erfolgen muss. Ein direkter Zugriff ist nicht erlaubt.

Wenn ein Benutzer eine bestimmte WWW Seite anfragt, geht diese Anfrage an denProxy Server, und dieser prüft, ob er das entsprechende Objekt bereits gespeichert hat. So beantwortet ein Proxy Server die Anfragen von vielen lokalen Clients - durchaus auch miteigenem Client Cache.

Üblicherweise besteht zwischen den Clients eine Beziehung, sie sind Teil der gleichen Organisation oder werden zuähnlichen Zwecken verwendet. Deshalb kann man davon ausgehen, dass von verschiedenen Clients gleiche WWW-Objekte angefordert werden und so ein gemeinsames Caching sinnvoll ist. So eingesetzte Proxies werden auch als forward proxies bezeichnet.

Proxies, die hingegen nur eine geringe Anzahl von Dokumenten (z.B. die einer einzi-gen Organisation) cachen, aber weltweit von Clients benutzt werden, nennt man reverse proxies. Der zentrale WWW-Server der Uni-Karlsruhe (www.uni-karlsruhe.de) zum Beispielermöglicht einen zugriffstransparenten, einheitlichen Zugang auf den Inhalt vieler Server. Diese Organisationsform eines Proxy Caches ergibt grundlegend andere Anforderungen und Probleme und ist nicht Teil dieser Betrachtungen.


2) Wenn im Folgenden von WWW Seiten oder Dokumenten gesprochen wird, sind stets auch sonstige Objekten wie Grafiken, Audio-, Videodaten oder Programme (Applets) gemeint.

----------------------------------------------------------------
[home] [TOC] [prev] [next] [guestbook] [contact]          (c) SM