Dieser Beitrag beschreibt Domains als Addressierungsmechanismus zur lokalisierung von Informationen im Internet.
Im Kontext des Internets bezeichnet eine Domäne einen strukturierten Namen zur Identifizierung eines Rechners im Netz. Eine Domänenbezeichnung besteht hierbei aus mit Punkten voneinander getrennten Strings (z.B. www.oldenbourg.de), die welche einen Pfad in einem hierarchischen Namensraum angeben [Wilde 1999]. Die einzelnen Teile stehen hierbei (von links nach rechts gelesen) für aufsteigende Hierarchieebenen in diesem Namensraum. Die oberste Ebene (im Beispiel: de) wird auch als Top-level Domain, die darunter liegenden Ebenen als Sub-Domänen bezeichnet. Top-Level Domänen von einem zentralen Organ, der ICANN festgelegt. Neben Top-level Domänen, die Länder der Erde bezeichnen (.de steht für Deutschland) gibt es eine Reihe von Top-Level Domänen für bestimmte Themenfelder. Zurzeit (Stand Juli 2008) bestehen 22 weitere top-level Domänen, von denen 13 von bestimmten Interessensgruppen gesponsert werden. Die bekannteste und am meisten genutzte Top-Level Domäne ist .com, die vor allem von Firmen aus dem englischsprachigen Raum verwendet wird. Die Bezeichnungen von Subdomänen (z.B. oldenbourg.de) können im Prinzip frei gewählt werden. Um die Eindeutigkeit bei der Bezeichnung von Rechnern zu gewährleisten müssen direkte Subdomänen der Top-Level Domänen bei sogenannten Domänen Registries gegen eine Gebühr angemeldet werden. Die Vergabe dieser second-level Domänen erfolgt nach er Reihenfolge der Anfrage für einen bestimmten Zeitraum. Subdomänen dieser angemeldeten Domänen können in der Regel vom Besitzer der entsprechenden Domäne selbstständig festgelegt werden. Hierbei haben sich jedoch gewisse Konventionen. So wird zum Beispiel die der Strings www häufig zur Bezeichnung des Rechners, auf dem sich der Webauftritt des Domänenbesitzers befindet.
Domänennamen wurden eingerichtet, um das auffinden von Rechnern im Internet zu erleichtern. Auf technischer Ebene werden Rechner durch ebenfalls von der ICANN koordinierten IP-Addressen, einer Addresse, die aus vier Zahlen, die jeweils zwischen 0 und 255 liegen und mit einem Punkt getrennt werden, (zum Beispiel 127.0.0.1) identifiziert. Da sich IP-Adressen schlecht einprägen, wurden Rechner von Anfang an zusätzlich durch einen sogenannten Host-Namen bezeichnet. Domänennamen wurden mit der wachsenden Zahl von Rechnern im Netz eingeführt, als es nicht mehr möglich war, die Abbildung von Host-Namen auf IP-Addressen zentral zu speichern. Durch die hierarchische Struktur von Domänennamen ist es nun möglich diese Abbildung für Subdomänen verteilt zu speichern. Die übergeordneten Domänen verwalten lediglich Verweise auf Rechner, welche über die entsprechenden Informationen für eine bestimmte Subdomäne verfügen.
Domänennamen bilden als Teil sogenannter URIs und URLs auch die Grundlage für die eindeutige Bezeichnung und Lokalisierung von Informationen im Web. URIs (Uniform Ressource Identifiers) sind eindeutige Bezeichner für Objekte im Web. URIs unterteilen sich in URNs (Uniform Ressource Names) die Objekten eindeutige Namen zuordnen und URLs (Uniform Resource Locators), die Objekte eindeutig im Netz lokalisieren. Domänennamen kommen hierbei vor allem in URLs zum Einsatz um festzulegen, auf welchem Rechner das entsprechende Objekt gefunden werden kann. Die Allgemeine Form einer URL ist hierbei die Folgende [Berners-Lee et al 2005]:
http://hans:geheim@www.example.org:80/demo/example.html#abschnitt
| | | | | | |
| | | Domäne | Pfad Anker
| | Passwort Port
| Benutzer
Protokoll
Hierbei legt das Protokoll den Transportmechanismus für den Datenzugriff fest. Benutzername und Passwort Regeln Zugriffsrechte. Domäne und Port identifiziert den Rechner im Netz sowie den direkten Datenzugriffskanal. Der Pfad lokalisiert eine bestimmte Datei auf dem entsprechenden Rechner und der Anker eine bestimmte Position in dieser Datei. Im Rahmen komplexer Datenmanagement-Anwendungen, zum Beispiel im Kontext von XML oder des Semantic Web, werden Domänennamen als Teile von URI nicht mehr unbedingt zur Lokalisierung sondern primär zur Disambiguierung von Namen verwendet. Insbesondere identifizieren URI hierbei Namensräume (namespaces), die unabhängig vom wirklichen Speicherort die Zugehörigkeit einer Objektbeschreibung zu einem bestimmten Modell signalisieren und dieses hierdurch zum einen von gleichnamigen Objekten in anderen Modellen abgrenzt, sowie den Kontext, in dem die Informationen zu interpretieren ist festlegt [Bray et al 2006].
T. Berners-Lee, R. Fielding and L. Masinter, Uniform Resource Identifier (URI):
Generic Syntax, Technical Memo, The Internet Society (2005) (http://gbiv.com/protocols/uri/rfc/rfc3986.html)
Literatur
Timr Bray, Dave Hollander, Andrew Layman und Richard Tobin. Namespaces in XMLr 1.0 (Second Edition), W3C Recommendation 16 August 2006.r (http://www.w3.org/TR/REC-xml-names/)
Erik Wilde. World Wide Web – Technische Grundlagen. Springer Verlag. Berlin, Heidelberg 1999