Beiträge zum Thema  Bilddaten-Kompression
Der neue Standard JPEG-2000:
Das Wunder der Wavelets

Der kommende Standard JPEG 2000 markiert den Beginn einer neuen Ära der Bildkommunikation. Das neue JPEG ist viel mehr als ein Kompressionsverfahren!

Warum was neues bei JPEG?

Das komprimierende Bildformat JPEG, so benannt nach der für ISO und ITU gemeinsam tätigen "Joint Photographic Experts Group", ist heute der Standard für digitale Fotos im Internet. In der professionellen Welt des Publishing dagegen sieht man in JPEG wegen der scheinbar unvermeidbaren Qualitätsverluste keine Alternative zu TIFF und anderen HighEnd-Formaten. Die Kritik am bald 10 Jahre alten JPEG-Standard (ITU-T.81 bzw. ISO/IEC 10918-1) wird an vielen Stellen laut. Folgende Bereiche können von JPEG nämlich bisher nicht abgedeckt werden:

  • Bildqualität bei hohen Kompressionsraten unter 0,25 bpp bei hochaufgelösten Grautonbildern ist nicht akzeptabel.
  • Kein Standard verbindet bisher verlustfreie und verlustbehaftete Kompression in einem einzelnen Codestream.
  • JPEG ist begrenzt auf Bilder mit 64K x 64K Pixel
  • Keine einheitliche Dekompressionsarchitektur: JPEG kennt 44 Modi, viele davon sind anwendungsspezifisch. Es gibt sogar eine (fast unbekannte) verlustfreie Variante.
  • Schwierige Übertragung auf gestörten Kanälen: Die Bildqualität von JPEG leidet dramatisch bei Bitfehlern. Fur Funknetze ist es daher nicht geeignet.
  • Unbrauchbar für berechnete Computerbilder mit harten Übergängen: JPEG ist für natürliche Bilder entwickelt worden.
  • Unbrauchbar für Verbunddokumente: JPEG wird wegen seiner schlechten Performance bei Text und Strich kaum für Verbunddokumente (Text, Grafik, Bild) verwendet.
  • Die Ziele von JPEG 2000

    Der neue Standard JPEG 2000 will das alte JPEG nicht ersetzen, sondern ergänzen. Doch die Vorteile des neuen Verfahrens sind überzeugend:

  • Erhöhung des Kompressionsgrads über alle Bereiche um durchschnittlich 20...30 %. Frei skalierbar von verlustfrei (Kompression 50 %) bis verlustbehaftet.
  • Hervorragende Leistungen bei niedrigen Bitraten unter 0,25 bpp, wie sie in der Netzübertragung und der Fernerkundung auftreten.
  • Ungehinderter Zugriff auf den komprimierten Datenstrom. Dadurch können komprimierte Bilder betrachtet, verändert, bearbeitet, übertragen und gespeichert werden.
  • Gemeinsame Halbton- und Strichkomprimierung: J2K kann unterschiedliche Dynamikbereiche von 1 bis 16 bit pro Farbkanal gleichermassen gut komprimieren. Wichtig ist das für Verbunddokumente, Röntgenbilder mit Text-Overlay oder computergenerierte Bilder mit binären Regionen, Alpha- und Transparenzmasken.
  • Verlustfreie und verlustbehaftete Kompression. In vielen Bereichen wie PrePress, Medizin oder der Langzeitarchivierung von Kulturgütern ist eine verlustfreie Kompression unverzichtbar.
  • Progressive Übertragung entweder nach Pixelgenauigkeit (Farbtiefe) oder ortsfrequenter Auflösung.
  • Beschreibungsdaten innerhalb des Bildformats sind für medizinische , juristische und archivarische Aufgaben unverzichtbar.
  • Interface zu MPEG4: Standbilder können aus der Bewegtbildfolge entnommen und wieder eingefügt werden.
  • Frei in der Form definierbare Objekte (Object based composition) erlauben die Definition und die objektbezogene Beschreibung von „Regions of Interest“.
  • Die ISO 15444 ist ein Meilenstein

    Mit der Verabschiedung der ISO/IEC-Norm 15444 bzw. der gleichlautenden ITU-Empfehlung T.800 Ende 2000 wird ein Meilenstein gesetzt, dessen Bedeutung für die Publishing-Welt man derzeit nur erahnen kann. Seit Mitte März liegt der "Final Commitee Draft v.1.0" für den Part 1 dieses Standards vor, der das JPEG 2000 Image Coding System ausführlich beschreibt. Part 2 wird 2001/2002 folgen und noch mehr Möglichkeiten etwa bei der Definition des Farbraums bieten.

    JPEG 2000 hat das Ziel, endlich eine Alternative zu dem Dschungel proprietärer und quasi-standardisierter Bildformate zu bringen, mit dem sich Praktiker Tag für Tag herumschlagen müssen. J2K, wie wir es im folgenden nennen wollen, geht dabei über den Ansatz des "alten" JPEG (ISO/IEC 10918 bzw. ITU-T.81-88) weit hinaus, denn es bescheibt nicht nur mehrere Verfahren für die verlustfreie und verlustbehaftete Bildkompression von farbigen und schwarzweißen Halbton- und Rasterbildern: es spezifiziert erstmals auch ein komplettes Dateiformat mit der Extension .J2K.

    Wahlfreier Zugriff auf den Datenstrom

    Komprimierte Bilddateien sind normalerweise völlig unbrauchbar, wenn Sie nicht vollständig übertragen und in den Arbeitsspeicher des Rechners geladen werden können. Nicht so J2K: hier kann man fast an beliebiger Stelle in den Datenstrom hineingreifen, um einzelne Segmente nochmals zu übertragen, zu speichern oder anzuzeigen. Es ist auch möglich, die Daten aus dem komprimierten Datenstrom so zu extrahieren, dass entweder ein geringer aufgelöstes Gesamtbild oder nur ein Ausschnitt des Bildes übertragen wird. Dadurch kann ein Datenfluß an die aktuellen Möglichkeiten des Übertragungskanals, des Speichermediums oder des Displays angepaßt werden, ohne dass die gesamten Daten dafür decodiert werden müssen. Da die Flußsteuerung nicht bei der Quelle, sondern bei der Senke (dem Empfänger) erfolgt, kann eine einzige Übertragung gleichzeitig mehrere Datensenken gemäß deren Anforderungen bedienen.

    J2K kann bis zu drei Ebenen (planes) eines Bildes beschreiben, auf denen verschiedene Komponenten liegen. Eine Bildebene wird in Teilflächen (tiles) gegliedert, die unabhängig voneinander bearbeitet und dekodiert werden können.

    Wavelets sind mathematische Elementarteilchen

    Jedes dieser Teilbilder wird dann mit Hilfe der Wavelet-Analyse in Spektralebenen zerlegt, die verschiedene Bereiche des zweidimensionalen Ortsfrequenzspektrums repräsentieren. Der mathematisch weniger Gewandte möge sich seine HiFi-Lautsprecherbox vergegenwärtigen: hier werden die tiefen, die mittleren und die hohen Töne von verschiedenen Lautsprecherystemen abgestrahlt. Eine Frequenzweiche in der Box sorgt dafür, dass jedes Lautsprechersystem nur die passenden Spektralbereiche, etwa die Tieftöne, zugeführt bekommt.

    Die Wavelet-Analyse macht nichts anderes, nur eben in den zwei Dimensionen des Bildes: Die unterste Spektralebene repräsentiert die groben Strukturen, die oberste Ebene die Feinstrukturen. Je nach Display werden nur die "tieferen" Ebenen benötigt, da die Feinstrukturen sowieso nicht dargestellt werden können.

    Das Verfahren der spektralen Zerlegung eines Bildes wurde natürlich schon beim alten JPEG-Verfahren in Form der sogen. "Diskreten Cosinus-Transformation" (DCT) verwendet. Der Unterschied zwischen der DCT und der Waveletanalayse ist zunächst rein mathematisch und erschliesst sich nicht ohne weiteres demjenigen, der nie mit Höherer Mathematik im Studium konfrontiert wurde. Kurz gesagt: die DCT ist eine Anwendung der Fourier-Transformation und arbeitet mit kontinuierlichen Sinusfrequenzen, während Wavelets zeitlich bzw. räumlich begrenzt sind und nur aus wenigen Schwingungen bestehen.

    Mit diesen "kleineren Elementarteilchen" der Mathematik, die man noch gar nicht so lange kennt, kann man einmalige Ereignisse in Zeit oder Raum, etwa harte Kanten und abrupte Übergänge in einem Bild, viel genauer beschreiben, als mit der alten DCT.

    „Regions of Interest“ können zuerst übertragen werden

    Darauf beruht letztendlich die höhere Effizienz der Wavelet-Komprimierung: man benötigt nur die Koeffizienten, sozusagen die Gewichtsanteile der einzelnen Elementar-Wavelets, um ein Bildsegment zu beschreiben. Je genauer, also je besser aufgelöst die Beschreibung sein soll, desto mehr dieser Koeffizienten sind erforderlich.

    Die aneinandergereihten Koeffizienten, in "Paketen" gebündelt, bilden den Datenstrom. Jedes Paket hat eine Identifikation: das macht den willkürlichen Zugriff auf den Datenstrom möglich. So kann man etwa eine bestimmte Bildregion als "Region of Interest" (ROI) markieren, deren Pakete vor allen anderen übertragen werden. Der Empfänger sieht diesen wichtigen Bildbereich zuerst, während der Rest drumherum noch übertragen wird. Der ROI-Bereich kann zudem beliebig höher aufgelöst werden, als der Hintergrund; er kann sogar völlig verlustfrei komprimiert sein. Auch für das Shaping, also den Übergang von ROI zum Hintergrund, sind mehre Varianten vom weichen Verlauf bis zur sprunghaften Abnahme der Bildinformation möglich.

    Das Dateiformat ist auch schon drin

    Der J2K-Standard sieht optional vor, dass die komprimierten Bilddaten auch in einem definierten Dateiformat JP2 gespeichert werden. Dieses Format ist containeratig strukturiert. Jeder Container ("Box") enthält spezifische Daten; es gibt autonome Container und es gibt Subcontainer. Das Dateiformat wird in PC-Systemen an seiner Extension .JP2 oder .jp2 erkannt; der Mac sieht den Type Code "jp2040".

    JP2 kennt zwei Wege, den Farbraum des Bildes anzugeben. Entweder mit einer Kennziffer, die sich auf eine vorgegebene Liste mit definierten Farbräumen bezieht, oder über ein eingebettetes ICC-Profil. Dabei muss es sich um ein monochromes oder ein dreikanaliges Matrix-Profil gemäß ICC-Spezifikation 2.2.0 handeln. Der Profile Connection Space (PCS) nutzt relative XYZ-Koordinaten.

    Prinzipell lässt JP2 auch mehrere Methoden der Farbraumdefinition in einem Bild zu: Das Leseprogramm soll sich stets an die erste verwertbare Methode halten und die anderen ignorieren. So kann etwa ein Webbrowser die erste Farbraumspezifikation ignorieren und sich einer einfacheren Farbverarbeitung zuwenden. Damit steigt die Zahl der Anwendungen erheblich, mit denen das Bild geöffnet werden kann.

    Metadaten in XML-Boxen

    JP2 kennt auch Einkomponentenbilder oder - "palettized images" mit Index-Farben aus einer Farbtabelle. Jeder Indexwert repräsentiert ein Tupel von RGB-Werten. Neben den Farbkomponenten gibt es in JP2 auch Hilfskomponenten, in denen Informationen über Opazität und Transparenz enthalten sind.

    Die Containerstruktur von JP2 macht es einfach, Metadaten beliebiger Art unterzubringen. Der Standard erlaubt im zukünftigen Part 2 beliebige anbieterspezifische Erweiterungen, solange die Darstellung des Bildes davon nicht beeinträchtigt wird. Da für diese Metaboxen die Beschreibungssprache XML eingesetzt werden kann, sind ihre Anwendungsmöglichkeiten nahezu unbegrenzt.

    Wavelet-basierte Software bereits erhältlich

    Auch wenn der Standard noch nicht verabschiedet ist, wird die Wavelet-Kompression schon heute für Bilddaten verwendet. Marktführer ist hier die 1993 gegründetet deutsche LuraTech GmbH, die bereits seit längerem waveletbasierte, aber (noch) nicht J2K-konforme Kompressionsprogramme für Bilder und Dokumente anbietet. Die aus der Luft- und Raumfahrttechnik stammende LuraTech ist Mitglied verschiedener wissenschaftlicher Verbände und an der Standardisierung von JPEG2000 beteiligt.

    Das Berliner Unternehmen bietet die Hochleistungs-Kompression für gescannte farbige Dokumente LuraDocument Lite Edition auf seiner Website www.luratech.de sogar als Freeware an. Ein DIN A4-grosses Dokument, das mit 300 dpi gescannt wurde, benötigt statt 25 MByte weniger als 100 KByte Speicherplatz, also nicht einmal einem halben Prozent der ursprünglichen Dateigröße. Dies gelingt LuraDocument durch die getrennte Verarbeitung der Bild- und Textbereiche, die typischerweise in einem gescannten Dokument vorhanden sind. Im Vergleich zu anderen Verfahren, wie z.B. JPEG, bietet LuraDocument eine deutlich bessere visuelle Qualität der komprimierten Dokumente. Texte bleiben auch bei hohen Kompressionsraten lesbar, die Farbigkeit der Dokumente bleibt erhalten.

    Nutzniesser sind das Internet und Bilddatenbanken

    Durch das an FlashPix erinnernde hierarchische Dateisystem von JPEG 2000 müssen Content-Anbieter im Internet und die Betrieber von Bilddatenbanken nur noch eine einzige Bildversion vorhalten und verwalten, da sich jede Anwendung die notwendige Auflösung selbst aussucht. Das spart Speicherplatz und Wartungsaufwand.

    Auch bei völlig verlustfreier Kompression ist JPEG 2000 mit einer Kompressionsrate von durchschnittlich 1:2 dem LZW-Algorithmus bei TIFF-Dateien oder dem ZIP-Verfahren überlegen. Bleibt die spannende Frage, wann die PrePress-Welt die Vorteile des neuen Formats erkennt: die Zurückhaltung bei der Akzeptanz von ImagePac-Format der Photo CD oder gar dem FlashPix-Format macht nicht allzu viel Hoffnung.

    Links:

  • JPEG: www.jpeg.org
  • DIG: www.i3a.org
  • EUROSTILL: http://ltswww.epfl.ch/~eurostill
  • Neximage : http://ltswww.epfl.ch/~neximage
  • SPEAR: http://spear.jpeg.org
  • JJ2000 JavaTM JPEG2000 development: target="_blank"http://jj2000.epfl.ch
  • LuraTech: www.luratech.de
  • Literatur:

    A.N.Skodras, C.A.Christopoulos, T.Ebrahimi: JPEG2000 – The Upcoming Still Image Compression Standard. Proceedings of the 11th Portuguese Conference on Pattern Recognition, May 2000.

    Copyright: Roland Dreyer 2000

    PDF-Version

    Das Internet wird besondes von der bei gleicher Dateigröße viel besseren Bildqualität von JPEG 2000 gegenüber dem alten JPEG profitieren.

    Die Farbraumoptionen des Dateiformats von JPEG 2000 lassen keine Wünsche offen. Der Teil 2 des Standards (ab 2001) bringt deutliche Erweiterungen gegenüber dem Teil 1 des Standards.

    Gerade bei minimalen Datenraten von 0,125 bit per Pixel (bpp) liefert JPEG 2000 (unteres Bild) deutlich bessere Bilder als JPEG (oberes Bild).

    Die Regions of Interest ROI sind frei definierbare Zonen eines Bildes, die zuerst oder mit höherer Auflösung übertragen und angezeigt werden. Die vier Bilder haben jeweils 0,125, 0,5, 1 und 4 bpp.

    Hier sieht man andeutungsweise die Zerlegung eines Bildes in verschiedene „Frequenzbänder“, die separat codiert werden.