Wie funktioniert eigentlich Datenkompression?
Wie funktioniert Datenkompression? Das Komprimieren oder die Kompression von Daten ist ein Verfahren, mit dem Datenmengen reduziert, indem gleiche Daten und Informationen in verkürzter Form dargestellt werden. Dazu gibt es verschiedene Verfahren, doch zuerst sehen wir uns die Kompression einmal genauer an. Das Wort Kompression kommt aus dem lateinischen, es bedeutet „zusammendrücken“. 1948 entwickelte Claude E. Shannon die Theorie zur Komprimierung von Daten. Die Theorie dazu ist einfach und besagt, dass eine Zeichenkette mit wiederum anderen Zeichen auf eine geringere Länge gebracht werden kann. Die „ZIP-Datei“ ist aus jedem gängigen Betriebssystem bekannt. ZIP ist heute sogar das bekannteste und am meisten verwendete Verfahren zur Kompression.
Im Jahr 1989 kam das erste ZIP-Programm, wie wir es heute kennen: PKZIP, kommandozeileninterpretiert für Microsofts Betriebssystem MS-DOS. Der Funktionsumfang dieses Programms war minimal, es reduzierte die Daten auf ein mögliches Minimum. In Zeiten von MS-DOS war das ZIP-Verfahren nahezu eine kleine Revolution. Der Speicherplatz war begrenzt, ZIP verhalf Speicherplatz zu sparen. Das Ziel einer solchen Komprimierung ist, Daten „verkürzt“ darzustellen – Zeichenketten werden also kompakt kodiert.
Ein Beispiel: In der Zeichenkette AAAABBBAABBBBBCCCCCCCCD kommt viermal das A, dreimal das B, dann wieder zweimal das A, fünfmal das B, achtmal das C und einmal das D vor. Verkürzt lässt sich das so darstellen: 4A 3B 2A 5B 8C D. Mit dieser Methode wird jede Serie von sich wiederholenden Zeichen durch eine Angabe ersetzt. Also: ZZZ => 3Z. Neben diesem Verfahren gibt auch noch weitere Verfahren, zum Beispiel LZW, oder RLE, hier bleiben wir jedoch bei der einfacheren Variante.
Wozu braucht man eine Komprimierung?
Wie bereits oben kurz angedeutet war Speicherplatz früher rar. In späteren Zeiten kam auch die Übertragung von Daten im Internet dazu. Bei einer Einwahl über die Telefonleitung mit einem klassisches Modem und Gebührenabrechnung im Minutentakt war die Kompression ebenfalls sehr wertvoll. Die Übertragungszeit wird so wesentlich verkürzt, somit entstehen wesentlich geringere Kosten. Komprimiert werden kann beinahe alles: Bilder, Videoclips, Tondateien und auch Dateien. Hier einige der gängigsten Datei-Formate:
- *.zip
- *.dmg
- *.rar
- *.7z
Möglich ist nicht nur das Komprimieren in Dateien/Dateiarchiven, sondern auch direkt von Dateien wie Bilder, Videos und Tondateien. Bekanntestes Beispiel ist wohl das Bildformat JPEG. Schlechte Bildqualität war davon die Folge, „verpixelte“ Bilder und bei Ton ein „verwaschener“ Klang. Auch hier werden die Daten auf ein Minimum reduziert. So entsteht ein Qualitätsverlust, der anders als bei Dateiarchiven unwiederbringlich ist – die ursprüngliche Qualität von Bildern und Ton kann also nicht mehr wiederhergestellt werden.