2 Offene Fragen und Probleme

Ziel des Cachings ist es, das Datenaufkommen im Netz zu verringern. Im einzelnen kann man die Vorteile für Einzelpersonen, Anwender und Internet-Provider kurz zusammenfassen:
Caching ...

... verbessert die Antwortzeit für den Benutzer
... verringert den Bandbreitenbedarf jedes einzelnen Benutzer
... reduziert die Beanspruchung des Internets insgesamt
... beschränkt den Aufwand beim Remote Server

Es ergeben sich sowohl für den Privatanwender als auch für die Gemeinschaft Vorteile. Allgemein verbessert Caching das Internet für jedermann.

Bei allen gegebenen Vorteilen sind aber besonders die noch offenen Fragen und Probleme mit Caching für diese Betrachtungen hier interessant. Das exponentiale Wachstum legt ausserdem die Forderungen an Skalierbarkeit und Einfachheit des Caching-Verfahrens fest. Erfolgreiche Lösungen für mittlere und kleine LANs sind im Bereich von derzeit 3.000 neuen Domains täglich3 nicht mehr praktikabel.

Ein Problem, das in diesem Zusammenhang besondere Betrachtung erfordert, ist die Fragewie gecachete Objekte aktuell gehalten werden können, d.h. bei Änderung der Orginalobjekte die Kopien erneuert werden. In der Terminologie traditioneller Verteilter Systeme wird dies Kohärenz genannt. Um effizient Netzressourcen zu schonen, muss versucht werden, statt des Originaldokuments möglichst oft eine lokale Kopie zu verwenden. Algorithmen und Möglichkeiten, die das Internet derzeit vorsieht, werden im Kapitel 4.1 näher betrachtet. Die aktuellen, relativ begrenzten Techniken bedingen aber, dass existierende Web Caches derzeit zu oft veraltete Informationen liefern und ausserdem den Benutzer länger wartenlassen als wirklich nötig [DP96]. Das Kapitel 5 skizziert einige Ansätze, die dieses Problem in Zukunft besser lösen sollen. Die weitere Entwicklung des Internets ist nur schwer abzuschätzen, sicher ist aber ein weiteres Wachstum. Auch eine Entwicklung hin zu mehr veränderlichen Elementen und die Integration bestehender Datenbasen ins WWW deutet sich an.In diesem Zusammenhang stellt sich die Frage: Wieviel ist cachebar?

Derzeit wird oft aus Mangel an geeigneten Mechanismen Caching für diese variablen Dar-stellungen völlig ausgeschaltet. CGI-Programme erzeugen dynamisch bei jedem Aufruf eine neue HTML-Seite. Hier muss überlegt werden, inwieweit sich diese dynamisch generiertenObjekte in kleinere statische, cachebare Teile zerlegen lassen. Die mit zunehmender Kommerzialisierung des Internets immer wichtiger werdende Frage nach sicheren statistischen Zahlen über Zugriffe auf einzelne Web-Inhalte fällt in den gleichen Zusammenhang. Auch hier wird bisher Caching unterdrückt, um unverzerrte Statistiken zu erhalten.

Veränderungen sind auch bei den derzeit üblichen Anfragesystemen für relationale Datenbanken im WWW, bei den verwendeten Cache-Mechanismen und der Datenausgabenötig. Das Kapitel 5.3 stellt hierzu einen Ansatz semantischen Cachens kurz dar.

Die praktische Leistungsfähigkeit von Cache Servern hängt aber zusätzlich zu dieser theoretisch möglichen Treffer-Rate4 auch von der realen, optimalen Ausnutzung des CacheSpeichers ab. Da die Speicherkapazität von Proxies nach oben beschränkt ist, kann die Entscheidung, welches Objekt ersetzt wird, die Effizienz des Caches massiv beeinflussen. Die Frage nach der optimalen Ersetzungsstrategie für Web Caches versucht das Kapitel 4.2 zu klären.Wo ein Cache im Netz platziert werden sollte, ist nicht ohne Berücksichtigung der verwendeten Cache-Struktur, hierarchisch oder Harvest/Squid, zu klären. In Zusammenhangmit der Harvest Cache Server Software stellt [Fis97] die nötigen Voraussetzungen dar.

Aspekte der Sicherheit, des Datenschutzes und der Möglichkeit eines Pay-per-View -Services bei Caching im Netz sind ebenfalls noch nicht optimal gelöst. Auch hier wird Caching derzeit oft mangels anderer Möglichkeiten umgangen. Diese Arbeit beschränkt sich aber im Wesentlichen auf die Möglichkeiten bei den Problemen der Kohärenz und Effizienz von WebCaches. Für speziellere Problemstellungen sind [Mar96], [MLB95], [Nab97] und [Nea96] zu empfehlen.

Die weniger technische Frage des Copyrights bei Caching und Replizieren wird in [San96]näher betrachtet.


3) iX Magazin für professionelle Informationstechnik 5/1997, S. 40
4) Cache-Treffer oder Cache-Hit: Das geforderte Dokument befindet sich im Cache und muss nicht wie bei einem Cache-Miss vom Original-Server geladen werden.

----------------------------------------------------------------
[home] [TOC] [prev] [next] [guestbook] [contact]          (c) SM