Startseite | Kontakt | Impressum | drucken?  

Material für den Informatikunterricht

Die Frage in der Titelzeile Wem gehört das Internet? ist nicht ganz ernst gemeint, aber auch kein reiner Spaß - wie man gleich sehen wird. Im Folgenden findet kein Grundkurs in html statt und auch keiner für Informatikstudenten. Allerdings werden hier ein paar Kurzkommentare und Links zusammengetragen, die die Spreu vom Weizen trennen sollen (falls noch jemand etwas mit diesem Bild aus der Agrarwelt anfangen kann).

1. Vernetzung vor dem Internet

ARPA / DARPA und die Russenangst

Wikipedia lag vor 2010 schief, als damals noch aufgetrumpft wurde:
Nach einer weit verbreiteten Legende bestand das ursprüngliche Ziel des Projektes vor dem Hintergrund des Kalten Krieges in der Schaffung eines verteilten Kommunikationssystems, um im Falle eines Atomkrieges eine störungsfreie Kommunikation zu ermöglichen. In Wirklichkeit wurden vorwiegend zivile Projekte gefördert, auch wenn die ersten Knoten von der Advanced Research Projects Agency (ARPA) finanziert wurden.

Dies war falsch, die "Legende" ist keine Legende, sondern just die Wahrheit, wie gleich nachgewiesen wird: Das Verteidigungsministerium der USA erteilte Anfang der 60er Jahre (Vorüberlegungen begannen fast zehn Jahre davor) den Forschungsauftrag: Wie wird Datenübertragung (und eventuell Datenspeicherung) unangreifbar gegen einen Atomschlag? Die Überlegung zur Lösung lief auf ein Datennetz hinaus. Dass die praktische Erprobung und Weiterentwicklung dann an Universitäten stattfand, ist kein Einwand. Und das Dementi eines Zeitzeugen auch nicht. Man muss sich einfach die historischen Umstände, den Forschungsaufwand und die Funktion von ARPA / DARPA überlegen. Das Internet ist ein Kind des Kalten Krieges, da beißt die Maus keinen Faden ab. Dass dieses "Kind" dann jugendlich und erwachsen, also selbständig wurde, ändert daran nichts.

Wer oder was ist ARPA / DARPA?

Die Adresse lautet kurz und trocken www.darpa.mil und dass da eine Internetadresse mit "mil" endet, womit nicht irgendein Militär, sondern exklusiv immer nur das US-Militär gemeint ist, kann einen schon nachdenklich machen. Die DARPA schildert selbst frank und frei ihre ersten Überlegungen zur Errichtung eines Computernetzes - aus militärischen Überlegungen, aus welchen sonst. Ganz nett dann die konkrete Datierung mit einem Notizzettel: "Talked to SRI (Stanford Research Institute) Host to Host" am 29. Oktober 1969 (die pdf-Datei der DARPA nennt da als Datum den 23. April 1963; dieses Datum ist ein Lesefehler - man schaue genau hin). Also ein frühes Gespräch von Computer (host) zu Computer. Alle Details mit erfrischendem Klartext dann in der pdf-Datei der DARPA über diese frühen Jahre: "...began back in 1951, when the Air Force commissioned MIT to design a state-of-the-art early-warning network to guard against a Soviet nuclear bomber attack".

Die DARPA beauftragte das MIT sowie das SRI, außerdem eine Universität in Utah und die Uni in Los Angeles (UCLA) mit der Erforschung und Durchführung der Vernetzung von Computern. Dies war nicht zweckfreie Forschung, auch wenn das noch so oft zu lesen ist. Die DARPA sagt es nun wirklich explizit, was sie warum wollte! Diese frühen Arbeiten zur Vernetzung dauerten die ganzen 60er Jahre an. Und das dabei entstehende Netz hieß prompt ARPANET. - Das Ganze, wenn auch mit einer etwas bangen Einleitung ("... und es ist deshalb auch nicht verkehrt, das so darzustellen"), lässt sich auch bei selfhtml nachlesen. Siehe dort auch den Abschnitt "Wissenschaftliche Einrichtungen".

2. Chronik

Vint Cerf notiert die Chronik
Das Arpanet 1970

1969
29. Oktober (oder 24. September oder 10. Oktober?): Zum ersten Mal werden Computer über eine größer Distanz miteinander verbunden (siehe oben): "Talked to SRI (Stanford Research Institute) Host to Host", von Arlington, Virginia, nach Palo Alto, Kalifornien. Damit erster Test des Arpanets, eines experimentellen Netzwerks des US-Militärs, es werden einzelne Buchstaben (L O G I N) von einem Computer zum anderen geschickt (siehe auch die beiden ersten Notizen hier auf dem Hotelzettel von Vint Cerf; er weiß den Tag auch nicht mehr so genau...).

1970
Das Arpanet wird auf die Ostküste der USA ausgedehnt.

1971
Ray Tomlinson erfindet das Protokoll für E-Mails. Er entscheidet sich für Symbol @, um die Adressen von verschiedenen Netzen zu kennzeichnen. E-Mails gibt es also früher als Webseiten!

1973
- Die ersten internationalen Knoten des Arpanets entstehen in England und Norwegen (im Link die internationale Vernetzung 2009).
- Vint Cerf u.a. entwickeln für die Datenübertragung die Paket-Technik: Dateien werden in Pakete zerlegt mit Absender und Empfänger sowie der Angabe der Paketgröße und der Angabe, das wievielte von wievielen Paketen dies nun ist. Damit entsteht das eigentliche Internet. Vint Cerfs Notizzettel: "4 Dec 1974 1st. complete specification of TCP". Als TCP/IP wird diese Technik am 1. Januar 1983 schließlich allgemein angenommen. Die überragende Eigenschaft des Internet in dieser Form entwickelt sich: eine plattformunabhängige Kommunikation zwischen oder mittels Computern: Egal ob Apple/Macintosh oder Microsoft, Linux oder Sun: Man nehme Netzwerkkarte, Browser, E-Mail-Programm und ab geht's (jedenfalls ab etwa 1990...).

1977
die RSA-Formel RSA, die Verschlüsselung mit einem öffentlichen und die Entschlüsselung mit einem privaten Schlüssel, wird in einer wissenschaftlichen Zeitschrift der Öffentlichkeit vorgestellt (siehe das Weitere 1995).

1983
Erstmals wird ein System mit Domain-Namen vorgeschlagen. Mit .com, .gov und .edu entstehen ein Jahr später die ersten Top Level Domains, also vor den Länderkürzeln.

1988
Einer der ersten Internetwürmer befällt Tausende Computer.

1990
Tim Berners Lee entwickelt am Forschungszentrum CERN die Seitenbeschreibungssprache html. Damit legt er den Grundstein für das World Wide Web, die Multimedia-Variante des Internets.

1993
Marc Andreessen entwickelt mit Kollegen an der Universität von Illinois "Mosaic", den ersten Browser, der auf einer einzigen Seite Bilder und Text darstellt.

1994
- Das World Wide Web Consortium (w3c) wird gegründet, um die Sprachen des Web zu standardisieren; unter anderem werden im Lauf späterer Jahre Validatoren entwickelt: Online-Prüfprogramme für Webseiten. - Die erste brauchbare Version von html wird vom W3C herausgegeben (es ist gleich die Version 2).
- Andreessen und andere aus dem Mosaic-Team gründen eine Firma zur Entwicklung des ersten kommerziellen Webbrowsers: Netscape. Damit wird das wirtschaftliche Potenzial des Internets deutlich, was dann auch Microsoft und andere auf den Plan ruft.
- Zwei Anwälte verschicken die erste Spam-Mail.

1995
- Die Firma VeriSign wird in Kaliformien gegründet; mit VeriSign beginnt die kommerzielle Nutzung der public-key-Kryptograhie, im Wesentlichen basierend auf RSA. Damit wird der Internethandel (Amazon, Ebay ...), Online-Banking und Online-Buchung von Dienstleistungen (Flüge, Veranstaltungen...) möglich.
- PHP erscheint in einer ersten Version (Erfinder: der Grönländer Rasmus Lerdorf). PHP und Varianten davon ermöglichen die Trennung von Inhalt und Formatierung. Damit wird in den folgenden Jahren (siehe 1999: CSS) der Weg frei, dass Webseiten-Besucher selbst Seiten erstellen: Web 2.0 (siehe 2009).

1996
- In der Bundesrepublik beginnen die Länder zusammen mit der Telekom (wie es damals noch hieß) die Aktion "Schulen ans Netz": subventionierte Internetzugänge und Schulungen für Lehrer sollen eben Schulen ans Internet heranführen.
- Der deutsche "Arm" des ICANN, nämlich DENIC, wird gegründet.
- Napster wird in den USA entwickelt: Man lädt ein Programm auf den eigenen Rechner, das die dort gespeicherten MP3-Musikdateien indiziert und samt der eigenen IP-Nummer an einen Server meldet, wo Interessenten sich dann melden und diese Musikdateien herunterladen. Zwar wird Napster einige Jahre später verboten, aber MP3 und Musik-Downloads führen zu einer Krise der Musik-Vermarktung.

1998
- Aus einem Projekt in einem Wohnheim an der Universität Stanford entsteht Google.
- Die US-Regierung überträgt die Regulierung der Top Level Domains (Länderkürzel und generische TLDs wie .org, .com usw.) sowie die Weiterentwicklung von TCT/IP (siehe unten, Teil 3) an die Internet Corporation for Assigned Names and Numbers (ICANN); die Corporation untersteht übrigens weiterhin US-amerikanischem Recht. Eine Unterabteilung der ICANN ist die IANA.
- Das US-Justizministerium und 20 US-Staaten verklagen Microsoft und werfen dem Hersteller des Betriebssystems Windows vor, seine Marktmacht zur Verdrängung von Netscape und anderen benutzt zu haben.

1999
- Weltweit gibt es 250 Millionen Domains.
- CSS als zentrale Formatierungsdatei erscheint in der 1. Version, also deutlich nach der Erfindung von PHP (siehe 1995).

2000
- März: Die Internet-Blase ("Dot.com-Blase") platzt: Aus der Hoffnung auf große Geschäfte war ziemlich massenhaft in Internet-Geschäftsideen investiert worden, z.B. in deren Aktien, wobei die entsprechende Firma manchmal nur aus einer Geschäftsidee und nicht viel mehr bestand: Diese Investitionen erwiesen sich dann als substanzlos.
- Deutsche Internet-Service-Provider entstehen oder wachsen: T-Online, 1&1, Strato...

2002
Weltweit nutzen mehr als 500 Millionen das Internet.

2004
- Das so genannte Web 2.0 entwickelt sich: Die Besucher und Benutzer erstellen und gestalten selbst die Seiten; es entstehen soziale Netzwerke: Facebook u.a.
- Regierungen, Ämter usw. unterhalten eigene Webauftritte (z.T. schon seit einigen Jahren).

2005
YouTube startet als Portal für Videos.

2006
Mehr als eine Milliarde Menschen sind im Internet.

2007
Das Internet wird mobil (bzw. diese Mobilität wird polulär): Apple stellt das iPhone vor, Radio- und TV-Stationen legen sich Internetportale zu.

2008
- Die Zahl der weltweiten Internet-Nutzer steigt auf mehr als 1,5 Milliarden. In China alleine sind es 250 Millionen und damit erstmals mehr als in den USA.
- Die Netscape-Entwickler stellen ihre Arbeit an dem Internet-Pionier ein. Der Abkömmling Firefox wächst und gedeiht aber.

2009
9. Dezember: Welche Webseiten werden weltweit am häufigsten angeklickt? Der Server-Forscher robtex.com meldet zu dieser Frage:
Rang 1 = google.com
Rang 2 = facebook.com
Rang 3 = yahoo.com
Rang 4 = youtube.com
die freie Enzyklopädie wikipedia.org steht auf Rang 6 (Chapeau!), das Quasselportal twitter.com auf Rang 14, microsoft.com findet sich erstaunlich weit "hinten" auf Rang 16, der ehemalige Riese aol.com steht auf Rang 45. Meine Website steht irgendwo auf Rang 2,9 Mio. Die Statistik auf mostpopularwebsites.net schreibt wohl Unsinn, wenn sie www.live.com (die Betaversion der Microsoft-Suchmaschine "bing") auf Rang 4 setzt.

3. Paket für dich: Das Schichtenmodell

Das Folgende ist nicht komplett, man kann das alles noch viel genauer und ausführlicher sagen. Das Problem ist bloß, dass das immer passiert und man nur sehr schwer eine Darstellung bekommt, ohne dass für das Verständnis gleich eine halbes Ingenieurstudium angehängt werden muss. - Alsdann:

Zu Beginn eine Unterscheidung:
Das Internet funktioniert völlig anders als Radio und Fernsehen. Beim Rundfunk werden Funksignale rundum versendet, und wer seine Antenne in diesen Rundfunk hineinhält, kann Radio hören oder TV empfangen. Die inhaltlichen Unterschiede = Stationen entstehen durch Frequenzwechsel. Wie viele Menschen den Rundfunk empfangen, ist technisch völlig egal, das Signal wird dadurch nicht schwächer. - Beim Aufruf einer Website wird eine individuelle Verbindung zwischen zwei Rechnern hergestellt, ansonsten ruht der Inhalt der Website, er wird nicht ausgestrahlt. Das gilt auch für Livestream, was für den Betrachter dann wie eine normale Fernsehsendung aussieht, tatsächlich aber eine Punkt-zu-Punkt-Verbindung des Internets ist.
Damit wären wir beim Thema.

Das Internet besteht auf der technischen Seite unter anderem aus einer Reihe von Verbindungen, die durch Gremien wie W3C und ICANN / IANA / RIPE und DENIC geregelt werden; was da jeweils in verschiedenen Versionen gilt, wird "Protokoll" genannt: hypertext transport protocol (HTTP), file transfer protocol (FTP), transmission control protocol (TCP), internet protocoll (IP) usw. Die diversen Protokolle bedeuten hier nicht wie im landläufigen Sinne "Mitschriften", sondern es sind Regeln oder Vorschriften, wie etwas ablaufen soll (in diesem Sinne spricht man ja auch vom "diplomatischen Protokoll"). Dazu später mehr.

Diese Protokolle bauen aufeinander auf - und zwar bei jeder Internetverbindung. Den Aufbau der Internetprotokolle nennt man das Schichtenmodell, wobei dies kein Modell im Sinne von Beliebigkeit ist, sondern es ist der technische Zusammenhang. Um die Internetverbindungen zu verstehen, muss man die nachfolgende Tabelle von unten nach oben lesen.

HTTP, POP3 , FTP …= Anwendung, Darstellung
TCP= Transport (Routing)
IP= Adressierung, Einwurf der Pakete
Netzwerkkarte, Ethernet, Router= Hardware, Netzzugang
  1. Die Netzwerkkarte; jede Netzwerkkarte hat eine weltweit einmalige Kennung, die MAC-Adresse (media access control). Die MAC-Adresse erfährt man in den meisten Windows-Versionen mit getmac. Die MAC-Adresse hat das Format xx.xx.xx.xx.xx.xx, wobei jedes x ein hexadezimaler Wert ist. Damit sind 1612 oder 2566 = etwa 281.500 Mrd. Netzwerkkarten möglich.
    Die MAC-Adress-Nummer wurde ursprünglich von Xerox vergeben, heute von der IEEE = einem Weltverband der Ingenieure (offenbar werden ganze Nummernbereiche an die Hersteller der Netzwerkkarten verkauft).
    Die Details der Vernetzung sind auf Windows-Rechners auch zu erfahren mit → Start → Ausführen → cmd → mit dem Befehl cd\ auf die Hauptebene gehen → ipconfig /all eingeben; Achtung Leerzeichen vor dem Schrägstrich! Nach dem Anschauen mit exit beenden.
  2. Das Ethernet; eine Netztechnik, ursprünglich für lokale Datennetze, gemessen wird die Geschwindigkeit in Bit pro Sekunde. Ethernet transportiert Daten paketweise ohne festes Zugriffsraster. Deshalb bereitet Ethernet Probleme bei allen Arten von zeitkritischen Anwendungen. Ethernet bietet keine Garantie, dass die Daten innerhalb einer bestimmten Zeit den Empfänger erreichen. Ein Paket = Frame kann maximal 1500 Bytes an Nutzdaten übertragen. Das Ethernet ist auf der materiellen Seite ein Kabel. Die Software dazu wird in Windows mit der Netzwerk-Konfiguration festgelegt bzw. aktiviert.
  3. Der Router (gesprochen "ruter" wie "Route 66"; wer "rauter" sagt, stößt auch kleine Kinder vor den Bus); ein Router verbindet Netze, z.B. das lokale Netz mit dem Internet. Die zwei möglichen Techniken im Router sind entweder Hub (engl. Achse, Nabe) oder Switch (engl. Schalter). Hubs fragen bei der Zustellung eines IP-Paketes jeden einzelnen Client (der einzelne Rechner im Netz) ab, ob er (mit seiner IP-Adresse und MAC-Adresse) der "richtige" sei; ein Switch enthält eine Tabelle der angeschlossenen Clients und schickt das fragliche Paket ohne Rundfrage (engl. Broadcast) gleich an die richtige Adresse (= Client). Der Oberbegriff zu Routern heißt Gateway. In Windows wird der Router allerdings auch als "Standardgateway" bezeichnet.
  4. IP = Internet Protocol; die entscheidende Erfindung bei IP ist die Pakettechnik: Eine Datei (und Webseiten bestehen bekanntlich aus mehreren Dateien…) wird in Pakete aufgeteilt und nur so versendet. Ein IP-Paket, theoretisch bis 64 KB groß, wird in gegebenenfalls mehrere Teile aufgeteilt, von denen jedes klein genug ist, um übertragen werden zu können.
    IP fügt den Daten einen Header hinzu. Dieser enthält unter anderem Absender- und Empfängeradresse. IP kann nun über verschiedene "Zwischenstationen" Pakete ausliefern, es gibt nicht einen richtigen Weg, schon gar keinen direkten. Als Beispiel denke man sich einen Host (= Server) A, der mit einem Host B verbunden ist, und einen Host C, der mit Host B verbunden ist. Angenommen, die Verbindung zwischen A und C ist defekt, überlastet oder sonstwie unbrauchbar. In diesem Fall packt IP ein an C adressiertes IP-Paket in ein oder mehrere an B adressierte Ethernetframes ein. Die Daten sind hier also doppelt verpackt: Um die Daten herum sind die Zusätze des IP-Frames (also beispielsweise der IP-Header mit den IP-Adressen), und um den IP-Frame herum sind die Zusätze des Ethernet-Pakets (also beispielsweise die Ethernet-MAC-Adressen). Diese Frames werden dann von Server B empfangen. Die IP-Implementierung (in Windows: → Netzwerkverbindungen → Internetprotokoll IP…) von B löscht bei der empfangenen Nachricht den Header des Ethernet-Frames, nachdem dieser verarbeitet wurde. Übrig bleibt der IP-Frame und natürlich die Daten. Nun erkennt B an der IP-Adresse, dass das Paket an C gesendet werden soll und packt es daher wieder in einen neuen Ethernet-Frame, der diesmal jedoch an C adressiert ist (B kann ja C erreichen) und sendet es. Diesen Vorgang bezeichnet man als Routing.
    Durch das Zusammenspiel von Fragmentierung und Routing kann ein IP-Paket in Form von mehreren Fragmenten beim Empfänger eventuell in falscher Reihenfolge ankommen. Das IP setzt diese Fragmente wieder ordentlich zusammen, und es entsteht wieder das IP-Paket. Und so entstehen aus mehreren IP-Paketen auch wieder die gesamten Daten der kompletten html-Datei…
    Dabei arbeitet das IP verbindungslos und ungesichert, d.h. vor dem Versenden der Pakete wird keine funktionierende Verbindung zum Empfänger hergestellt, sondern diese Pakete werden einfach abgeschickt. Es existieren auf IP-Ebene keine Sicherungsmechanismen, die sicher stellen, dass die Daten auch korrekt beim Empfänger ankommen.
    Jede (TCP-) Verbindung wird eindeutig durch zwei Endpunkte identifiziert. Ein Endpunkt (genannt Socket) besteht aus IP-Adresse und Port. Ports sind 16-Bit-Zahlen (Portnummern) und reichen von 0 bis 65535 (65536 = 216). Ports von 0 bis 1023 sind reserviert und werden von der IANA definiert, z. B. ist Port 80 für das im WWW verwendete HTTP reserviert (8000 und 8010 auch...).
    Den Weg der IP-Pakete kann man in Windows nach der Eingabeaufforderung mit tracert sehen (die Darstellung ist dann komplett, wenn wieder C:\ blinkt); beim Aufruf tracert www.rhg-ge.de kann dieser Weg so verlaufen:
    Routenverfolgung zu www.rhg-ge.de [195.234.228.90]  über maximal 30 Abschnitte:
    1    <1 ms    <1 ms    <1 ms  speedport.ip [192.168.2.1]
    2    47 ms    60 ms    48 ms  217.0.116.143
    3    41 ms    41 ms    41 ms  217.0.73.218
    4    46 ms    47 ms    45 ms  f-ea5-i.F.DE.NET.DTAG.DE [62.154.16.161]
    5    53 ms    54 ms    46 ms  62.156.138.94
    6   112 ms    46 ms    45 ms  ffm-bb1-link.telia.net [80.91.249.81]
    7    46 ms    46 ms    51 ms  ffm-b3-link.telia.net [80.91.249.141]
    8    46 ms    46 ms    45 ms  br2.ix1.inetserver.de [213.248.102.147]
    9    46 ms    46 ms    46 ms  fw1.ix1.inetserver.de [194.150.189.218]
    10   55 ms    49 ms    46 ms  www.rhg-ge.de [195.234.228.90]
    Ablaufverfolgung beendet.
    Erläuterung (alle IP-Nummern werden gut aufgelöst ("Who is") durch die Whois-Seite der IKS Jena):
    Schritt 1 = lokaler Router mit dynamisch vergebener IP-Nummer 192.168.2.1 (siehe dazu "Private IP-Adresse" z.B. in Wikipedia)
    Schritt 2 und 3 = IP-Nummer 217.0.xxx.xxx = Telekom und RIPE
    Schritt 4 und 5 = IP-Nummer 62.156.xxx.xxx = Telekom
    Schritt 6 und 7 telia.net (Telia = schwedischer Glasfaser-Betreiber, Station ffm = Frankfurt)
    Schritt 8 und 9 inetserver = ebenfalls zu Telia gehörend (br2 vermutlich irgendein Ort in Bayern)
    Schritt 10 IP-Nummer 195.234.228.90 = Firma QualityHosting in Gelnhausen ("domainkunden.de"), dort steht der Server, der die Schul-Website beherbergt (dieselbe IP-Nummer haben auch mehrere hundert andere Domains; siehe www.robtex.com).
    Die aktuelle eigene IP-Nummer und die IP-Nummer des eigenen Routers ("Standardgateway") erfährt man unter anderem in der DOS-Box mit dem Befehl ipconfig.
  5. TCP = Transmission Control Protocol; TCP stellt einen virtuellen Kanal zwischen zwei Endpunkten (Sockets) einer Netzwerkverbindung her. Auf diesem Kanal können in beide Richtungen Daten übertragen werden. TCP setzt in den meisten Fällen auf das IP (Internet-Protocol) auf. Datenverluste werden erkannt und automatisch behoben, Datenübertragung ist in beiden Richtungen möglich, Netzwerküberlastung wird verhindert. Daher ist TCP ein sehr weit verbreitetes Protokoll zur Datenübertragung. Beispielsweise wird TCP als fast ausschließliches Transportmedium für das WWW, E-Mail und viele andere populäre Netzwerkdienste verwendet.
    Das TCP-Segment besteht immer aus zwei Teilen - dem Header und der Nutzlast. Die Nutzlast enthält die zu übertragenden Daten, die wiederum Protokollinformationen der Anwendungsschicht wie HTTP oder FTP enthalten können. Der Header enthält für die Kommunikation erforderliche Daten sowie das Dateiformat beschreibende Informationen. Grafische Darstellung eines Headers in Wikipedia, auch als Add-on für Firefox: live http headers oder auf der Seite von A. Hoppe.
    Die Paketgröße: Ein TCP-Segment hat typischerweise eine Größe von 1500 Bytes. Es darf nur so groß sein, dass es in die darunter liegende Übertragungsschicht passt, das Internetprotokoll IP. Das IP-Paket ist theoretisch bis 64 KB spezifiziert, wird aber selbst meist über Ethernet übertragen, und dort ist die Rahmengröße auf 1500 Bytes festgelegt. TCP- und IP-Protokoll definieren jeweils einen Header von 20 Bytes Größe. Für die Nutzdaten (der eigentliche Inhalt) bleiben in einem TCP/IP-Paket also 1460 Bytes übrig (1500 Byte Nutzdaten -20 Byte TCP-Header -20 Byte IP-Header).
    Beispiel einer TCP-/IP-Datenübertragung: Der Sender schickt sein erstes TCP-Segment mit einer Sequenznummer SEQ=1 (variiert) und einer Nutzdatenlänge von 1460 Byte an den Empfänger. Der Empfänger bestätigt es mit einem TCP-Header ohne Daten mit ACK=1461 (ACK = acknowledgement = Empfangsbestätigung und Endnummer des Segments) und fordert damit das zweite TCP-Segment ab dem Byte mit der Nummer 1461 beim Sender an. Dieser schickt es dann mit einem TCP-Segment und SEQ=1461 an den Empfänger. Dieser bestätigt es wieder mit einem ACK=2921 und so weiter. Der Empfänger braucht nicht jedes TCP-Segment zu bestätigen, wenn diese zusammenhängend sind. Empfängt er die TCP-Segmente 1-5, so braucht er nur das letzte TCP-Segment zu bestätigen. Fehlt zum Beispiel das TCP-Segment 3, weil es verlorengegangen ist, so kann er nur die 1 und die 2 bestätigen, 4 und 5 jedoch noch nicht. Da der Sender keine Bestätigung für die 3 bekommt, läuft sein Timer ab, und er verschickt die 3 noch einmal. Kommt die 3 beim Empfänger an, so bestätigt er alle fünf TCP-Segmente. Der Sender startet für jedes TCP-Segment, welches er auf die Reise schickt, einen Timer (RTT).
  6. HTTP = Hyper-Text Transport (Transfer?) Protocol; damit werden die Daten schließlich wieder zu einer lesbaren (html-)Seite zusammengesetzt. Dies leistet der Browser (z.B. Firefox), vor allem dessen Kern, der so genannte Parser.
  7. POP3 = Post Office Protocol (Version 3); Verbindung zum Empfang von E-Mails.
  8. FTP = File Transfer Protocol; Methode z.B. zum Hochladen ("upload") von Dateien auf einen Server (um z.B. eine Website zu aktualisieren); von FTP-Servern lassen sich auch Dateien herunterladen.

4. Routing: Der Weg hinaus

Der Aufruf einer Website läuft in etwa so:

  1. Wenn ich meinen Browser anklicke und als Startseite eine Suchmaschine eingestellt habe, bin ich bekanntlich schon gleich im Internet, d.h. Netzwerkkarte, lokale IP-Einstellungen, Ethernetverbindung, Router (als Kästchen im Regal oder als Karte im Rechner) sind schon aktiv.
    Jeder Rechner, der am Internet teilnimmt, kann Host genannt werden (siehe oben den ersten Notizzettel). Und jeder Host, also auch mein Rechner, bekommt eine IP-Nummer - entweder als feste Nummer, weil der Host eine Domäne (eine Website) beherbergt, oder als Besucher mit dynamisch = jeweils neu vergebener IP-Nummer (alles mit Klick auf "Netzwerkverbindungen" zu sehen, siehe oben). Die IP-Adresse oder IP-Nummer in der heute gültigen Version 4 hat vier Gruppen von bis zu 255 Zahlen (Null bis 255 = 256 Zahlen). 256 = 28 = 1 Byte; eine IP-Nummer besteht also anders gesagt aus vier Bytes oder dezimal aus 2564 oder 232 = ca. 4,3 Mrd. Adressen.
  2. Ich will mich z.B. auf der Schulhomepage umschauen und gebe im Browser oben in der Adresszeile einfach den Domänennamen ein: rhg-ge.de.
    Moderne Browser ergänzen ihn gleich vorne mit www, so dass es jetzt heißt www.rhg-ge.de. Damit wird angenommen, dass die Domäne (es ist der second-level Domain-Name) rhg-ge mit dem top-level Domain-Namen de eine selbständige Domäne im World Wide Web ist, also im multimedialen Teil des Internets. Die im WWW zur Darstellung der verschiedenen Inhalte nötigen Protokolle und erlaubte Dateiformate regelt das entsprechende Consortium W3C.
    Und noch etwas ergänzt mein Browser in diesem Fall: Weil er annimmt, dass als erstes eine Startseite im html-Format erscheinen wird (selbst wenn dann blitzschnell auf eine andere Seite weitegeleitet wird), schreibt er davor noch http://, also das Protokoll zu html. Denn wenn nichts weiter notiert wird, dann heißt die erste Seite einer Domäne index.html. So wird also aus dem Eintrag rhg-ge.de automatisch http://www.rhg-ge.de/index.html.
  3. Dieser Eintrag wird von meinem Browser als Anfrage interpretiert und über Netzwerkkarte, Ethernetkabel oder WLAN, über Router, DSL und/oder Glasfaserkabel geht diese Anfrage an den DNS-Server, der meinen Internetzugang besorgt, neudeutsch: mein (Internet Service) Provider.
  4. Der DNS-Server sucht dann aus seinem Tabellenwerk die IP-Nummer zur angefragten Domäne heraus. Die IP-Nummer der gesuchten Website kann ich auch selbst herausbekommen, z.B. in der Eingabeaufforderung durch den Befehl ping, Beispiel ping www.rhg-ge.de. Der DNS-Server gibt die Anfrage in dieser IP-Form weiter an den nächsten Server; siehe entsprechend der tracert-Tabelle oben: Der DNS-Server der Telekom (dtag.de) gibt die Anfrage weiter an "telianet", von dort geht sie an "inetserver.de", bis die Anfrage schließlich bei dem rhg-ge.de-Server "domainkunden.de" ankommt.
    Dieses Weiterreichen sowohl der Anfrage als auch zurück der Datenpakete heißt Routing. Das Tempo des Routings hängt von der Bandbreite der Verbindung (z.B. Glasfaserkabel, Satellitenverbindung, Kupferkabel), von seiner Verfügbarkeit und Geschwindigkeit ab; die entsprechenden Kriterien werden alle 30 Sekunden von den Internet-Servern bei den Nachbar-Servern abgefragt und dementsprechend wird das Routing geändert oder beibehalten. - Zum Routing siehe das Elektronik-Kompendium.
  5. Von dort geht die Reise nun umgekehrt (Schritt 3 und 2) - und zwar nach dem oben beschriebenen Schichtenmodell samt Pakettechnik - siehe auch die graphische Aufarbeitung bei robtex.com.

© Michael Kraus, Dezember 2009
Diese Übersicht beruht auf der Lektüre der Zeitschrift c't,
von Artikeln im Elektronik-Kompendium,
von Texten in Wikipedia und anderen.
Ich danke und empfehle das Studium dieser Quellen.
Im Übrigen macht meine Website weder Gewinn noch Verlust.