XML-Autorenprogramme im Vergleich

XML-Autorenprogramme im Test:
MIT XML werden Dokumente multidimensional

Die Metasprache XML ist die Grundlage für das medienübergeifende Publishing: ein XML-Dokument kann von verschiedenen Anwendungen verarbeitet und auf beliebigen Medien präsentiert werden. Der Umgang mit XML wird auch für Autoren zur Selbstverständlichkeit werden. Neue WYSIWYG-Autorenprogramme machen die Arbeit mit XML-Tags sehr einfach. Allerdings ist ein Grundverständnis für die XML-Materie unumgänglich.

CrossMedia-Publishing ist im Zeitungsbereich etwas mehr, als nur drei mal das selbe auf verschiedenen Medien darzustellen. Wer als Journalist für Printmedien arbeitet, muß seinen Text anders schreiben, als ein Online-Redakteur, weil der Leser eine Zeitungsseite anders rezipiert als einen Bildschirminhalt.  Die bisherige Option, zwei Fassungen zuschreiben, ist nicht sehr effektiv. Einfacher wäre es, wenn künftige Redaktionssysteme automatisch die jeweils mediengerechte Fassung produzieren könnten.

Einmal schreiben – multimedial publizieren

Das ist möglich, wenn der Autor schon beim Schreiben die Textkomponenten mit XML-Tags auszeichnet: Überschrift, Einleitung, Zusammenfassung, zentrale Aussagen, erläuternde Hintergrundinformationen, Quellen, Zitate und mehr. So mancher Fachredakteur wäre schon heute froh, wenn er in den Beiträgen seiner freien Autoren die bei Platzmangel zu streichenden Textpassagen auf einen Blick erkennen könnte.

Ein XML-Editor ist keine Textverarbeitung von der Stange, mit der man nach einer Stunde schon den ersten Brief schreiben kann. Er muß – wie eine Werkzeugmaschine - immer für die jeweilige Einsatzaufgabe vorbereitet werden. In der Praxis wird sich ein Autor daher kaum mit der XML-Programmierung befassen müssen: er wird immer mit EDV-kompetenten Kollegen im Verlag zusammenarbeiten, die ihm seinen Arbeitsplatz so einrichten, dass er sofort loslegen kann.

XML ist im Prinzip nur Textverarbeitung...

Deshalb sollten sich die Autoren unter den Lesern nicht von dem unvermeidbaren Kauderwelsch beeindrucken lassen, das nur für Systemspezialisten von Interesse ist. Wenn die Arbeitsvorbereitung funktioniert, ist ein XML-Editor nicht schwerer zu bedienen, als ein Textverarbeitungsprogramm. Ohne diese Einrichtung und Einweisung ist ein XML-Editor so aufregend wie ein Computer ohne Software.

Für die Erstellung eines Dokuments ist die Document Type Definition (DTD) praktisch unverzichtbar; in dieser Textdatei werden die für das jeweilige Dokument sinnvollen Tags und die Regeln für ihre Verwendung – die Grammatik - aufgelistet. Für ein Buch gibt es andere Regeln und Elemente als für eine Zeitungsseite. Die DTD beschreibt die prinzipielle Struktur (das Layout-Konzept) eines Dokuments, sie besagt etwa, dass die Überschrift unverzichtbar ist und unbedingt vor der Einleitung stehen muß. Ohne eine DTD weiß der Autor gar nicht, welche Tags ihm überhaupt zur Wahl stehen und welche Tags er in jedem Fall mit welchen Inhalten füllen muß. Bei Tags mit Attributen sind nur bestimmte Begriffe aus einer Liste  oder bestimmte Ziffernfolgen und Formate zulässig. Viele DTDs sind bereits international genormt.

Ohne DTD, FOSI und CSS geht nichts

Die Anweisungen zur medienspezifischen Darstellung eines Dokuments stehen in einem weiteren Dokument: dem Style Sheet, das entweder in der Extensible Style Language XSL (nur für XML tauglich!) geschrieben ist oder im CSS-Standard (Cascading Style Sheets) vorliegt, der sowohl HTML als auch XML unterstützt. XSL eignet sich auch dazu, ein XML-Dokument in HTML/CSS zu transformieren. Allerdings ist XSL noch in der Entwicklung; derzeit kann man praktischerweise im Internet nur mit CSS arbeiten.

Das Style Sheet beschreibt, wie die von den XML-Tags beschriebenen Dokumententeile im jeweiligen Medium dargestellt werden. Diese Umsetzung übernimmt im ersten Schritt ein sogen. XML-Parser, der in den neuen 5er-Versionen der Browser von Microsoft und Netscape  bereits enthalten ist. Der MS IE5 enthält bereits einen XSL-fähigen XML-Prozessor, allerdings ist seine XSL-Impelementierung schon etwas veraltet. Ein Parser ist ein Programm, das den Markup vom Inhalt trennt, so dass Anwendungen den Inhalt erkennen und weiterverarbeiten können. Als Standard für XML Style Sheets wird sich neben CSS1 auch DSSSL-0 etablieren, eine Untermenge von DSSSL (sprich "Dissl“). DSSSL ist die sehr umfangreiche Document Style Semantics and Specification Language, der internationalen Standard ISO-10179 für SGML- Style Sheets.

Ein SGML Style Sheet für den Print-Bereich nennt man auch FOSI (Format Output Specification (outspec) Instance). Mehr zu dem recht komplexen Thema XSL, CSS und DSSSL gibt es im Web unter www.w3.org/Style/.

Zu den wichtigsten Aufgaben eines XML-Editors gehört die Validierung (Prüfung) der XML-Tags in bezug auf eine spezifische DTD. Die DTD listet die gültigen Tags, ihre Attribute und die zulässigen Verschachtelungen. Ohne eine DTD kann der Editor nicht beurteilen, ob das Dokument richtig ausgezeichnet wurde, also „gültig“ bezüglich einer DTD  und somit SGML-konform ist. Nur die „Wohlgeformtheit“ lässt sich auch ohne DTD feststellen. Wohlgeformt ist ein XML-Dokument, wenn es keine Syntax-Fehler (wie offene Tags) enthält. Das unterscheidet XML von HTML, wo ein Tag wie <Br> auch ohne </Br> stehen darf.

CALS: Commerce at Light Speed

Viele DTDs und Style Sheets sind aber bereits standardisiert: so verbirgt sich hinter dem Akronym CALS das Konzept „Computer-Aided Acquisition and Logistic Support“, dem viele DTDs wie etwa die MIL-M-38784C, eine  Spezifikation des US-Militärs für Technische Handbücher, entsprechen müssen. CALS ist "eine globale Strategie zur Unterstützung der Unternehmensintegration durch Verschlankung von Geschäftsprozessen und Anwendung von Standards und Technologien zur die Entwicklung, Management, Austausch und Nutzung von Geschäfts- und technischen Informationen". CALS steht für auch für „Continuous Acquisition and Life-Cycle Support“ (ursprünglich militärisch)  oder „Commerce At Light Speed“ (zukünftig zivil). Ein Ziel der CALS-Vision ist die elektronische Verbreitung von Informationen, die eine gleichzeitige Ausführung von Prozessen und Aktivitäten bei allen Beteiligten eines virtuellen Firmenverbunds ermöglichen. Seit April 1996 gibt es auch im DIN einen CALS-Ausschuß.

Weitere XML-DTDs findet man auf www.xmlx.com und www.ucc.ie/cgi-bin/public; lesenswert ist auch die XML-FAQ auf www.ucc.ie/xml/ .

XML macht Database Publishing einfach

Wer Webseiten mit häufig wechselnden Inhalten erstellen muß, tut sich mit konventionellen HTML-Programmen schwer. Trennt man dagegen Architektur (Navigation), Darstellung (Layout) und Inhalte, bietet ein mit XML ausgezeichneter und in einer Datenbank verwalteter Content eine erhebliche Arbeitserleichterung.  Die Datenbank kann im einfachsten Fall eine Sammlung von Dateien sein; komfortabler ist natürlich eine objektorientierte Datenbank wie die Poet Content Management Suite. Das Aktualisieren der Webseiten kann dann vollautomatisch erfolgen.

Das DOM – Document Object Model – ist ein Schlüsselakronym in der XML-Welt. Von Microsoft erstmals im Internet Explorer 4.0 eingeführt (und auch als „Dynamisches HTML“ bezeichnet), erlaubt es, alle Elemente eines HTML-Dokuments direkt anzusprechen.

Dokumente werden mit XML intelligent

Praktisch veranschaulicht das die Gliederungs- oder Outline-Darstellung eines Dokuments: der User sieht zunächst nur die Überschriften: die Kapitel darunter werden erst beim Anklicken javaskriptgesteuert angezeigt, sind aber längst vom Browser geladen worden. In klassischem HTML wäre das nur mit einem Link auf weitere Seiten machbar: das DOM erlaubt es, den mit HTML-Tags markierten Inhalt, die Steuerlogik und die Darstellung kompakt in eine Datei wie in einen Informations-Container zu packen. Einmal geladen, enthält dieser Container alle Intelligenz und Interaktivität: eine Verbindung zum Server ist nicht mehr erforderlich. Werden nun anstelle der HTML-Tags die semantisch codierenden XML-Tags verwendet, lassen sich aus Dokumenten intelligente Applikationen machen.

Unser Testbericht setzt sicherlich bereits grundlegende Kenntnisse voraus: zumindest die Lektüre der XML-Beiträge in DD 6/99 (g13) und DD 34/99 (w8). Wenn COM, DOM, DTD, CALS und CSS trotzdem noch böhmische Dörfer für Sie sind, akzeptieren Sie es einfach: man braucht einfach einige Zeit, um mit dem Vokabular vertraut zu werden. Auf http://www.bse.de/verweise/sgml.htm finden sie eine kommentierte Einstiegsseite für SGML-Informationen im Web.

Wir haben uns drei XML-Autorenprogramme für Sie angesehen: XMetal 1.0 von Softquad, XML Pro 2.0 von Vervet Logic und Adept von Arbortext.

XMetal: Die Legende lebt

Als das WorldWideWeb vor vielen Jahren in Fahrt kam, galt Softquads legendärer HTML-Editor HotMetal als Geheimtip. Mit XMetal wird das englische Softwarehaus erneut seiner Pionierrolle gerecht. Das – bislang nur in der englischen Version verfügbare – Paket enthält zwei umfangreiche Handbücher: das eine beschreibt die Arbeit mit dem Programm, das andere ist ein Handbuch für den Skript-Programmierer, der XMetal und seine Makros anpassen möchte.

Der Anwender kann bei XMetal Dokumente in drei verschiedenen Darstellungsmodi bearbeiten. Im Normalmodus sorgt ein Cascading Style Sheet für die WYSIWYG-Darstellung des Textes. Im „Tags On“-Modus sind die Tags als Felder sichtbar und können über Attribut-Menüs bequem bearbeitet werden. Die ASCII-Darstellung schließlich zeigt dem Profi den gesamten, voll editierbaren, farbig abgehobenen Code samt Text.

XMetaL ermöglicht die einfache Erstellung von nativen SGML und XML Dokumenten und übernimmt die komplette Syntax-Prüfung im Hintergrund. Die einfache Benutzeroberfläche lässt sich vollständig an die individuellen Anforderungen anpassen. Seine auf dem Component Object Model (COM) basierende Architektur bietet vollständigen Zugriff auf alle Funktionen. Der integrierte Scripting Host unterstützt JavaScript und VBScript sowie jede andere Windows Scripting Engine. Zudem ermöglicht das W3C Document Object Model (DOM) den kompletten Durchgriff auf alle Teile des Dokuments.

Aus der Datenbank direkt ins Internet

XMetaL erzeugt XML- und SGML-Dokumente und speichert SGML als XML und umgekehrt. Es unterstützt mehrere DTDs. Ein Datenbank-Importassistent ermöglicht den Zugriff auf jede ODBC-Datenbank: Datenbankinhalte können automatisch in XML konvertiert werden. Der Textverarbeitungsmodus ermöglicht einfaches Editieren mit CSS-Formatierung für die Darstellung im Browser. XMetaL bietet daneben spezielle Unterstützung für das Publizieren im Web. So können neben CALS- auch HTML 4.0-Tabellen erzeugt werden. Integriert ist zudem ein CSS-Editor, um die professionelle Darstellung von XML-Dokumenten auch im Web zu ermöglichen.

Die Farbdarstellung der Syntax für XML- und SGML-Code erleichtert die Arbeit wesentlich und führt mit der Zeit auch zu einem Lerneffekt. Der Autor hat stets Zugriff auf alle Element-Attribute; die aktuell gültigen Attribute werden angezeigt. Die Web-View-Funktion dient zur Visualisierung von XML-Dokumenten mit dem integrierten Browser. Xmetal bietet eine vollständige CSS-Unterstützung mit externen Style Sheets, Style Elementen und Attributen; XSL Style Sheets werden aber noch nicht unterstützt. Die Validierung des Dokuments erfolgt in Echtzeit mit jeder XML- oder SGML-DTD.

XMetaL ist zum Preis von DM 1049,- inkl. MwSt. in englischer Sprache für alle 32-Bit Windows Plattformen verfügbar.

XML Pro: ein echtes Java-Programm

Deutlich preisgünstiger und natürlich funktional einfacher als XMetal  ist XML Pro 2.0 von Vervet Logic: ein reiner Editor ohne Preview-Funktion, den man sich aus dem Internet für 150 US-Dollar von www.vervet.com herunterladen kann. Das plattformneutrale Java-Programm, das mit einer Runtime-Version von Sun Java JRE 1.2 geliefert wird und somit auf Windows 95/98/NT, Solaris und Linux läuft, enthält den XML4J-Parser von IBM. Es unterstützt das DOM des W3C und die SAX-Schnittstelle (SAX=Simple API for XML) zu XML-Parsern. Dokumententeile können per Drag&Drop und  Cut&Paste oder über die Explorerleiste verschoben werden. Eine DTD lässt sich darstellen, aber nicht editieren.

Die Oberfläche von XML Pro zeigt auf der linken Schirmseite die baumartige Struktur eines Dokuments in der Art des Windows Explorers. Klickt man ein Element an, kann man es in der rechten Schirmhälfte bearbeiten. Sowohl für Elemente als auch für attribute gibt es Auswahllisten: XML-Tags müssen nur aus einer kontextspezifischen Liste durch Anklicken ausgewählt werden. Die Hilfe-Funktion erklärt alle Funktionen des Programms und die Grundlagen der XML-Syntax.

Adept 8.0: Die große Lösung

Schon die Versionsnummer 8.0 läßt erkennen, dass Arbortext (www.arbortext.com) mit Adept keinen Neuling ins Content Management Feld schickt. Das Autorenwerkzeug für „Knowledge Capture“ kommt aus der SGML-Welt und wird schon lange von der Industrie  und beim Militär für umfangreiche technische Dokumentationen eingesetzt: so wird das Space Shuttle der NASA mit Adept dokumentiert. Dort weiß man sicherlich auch zu schätzen, dass Adept 8.0 die Format Output Spezifikation DTD MIL-M-28001B.1 unterstützt. Der Adept-Editor verarbeitet daher auch vollwertige SGML-Dokumente und kann SGML in XML und umgekehrt verwandeln.

Adept 8 ist die erste auch auf Windows NT laufende Version der Solaris-orientierten Adept-Serie. Das Dokumenten-Gestaltungssystem unterstützt sowohl XML als auch SGML und bietet alle Funktionen, die für ein professionellles Publishing auch umfangreicher Druckwerke erforderlich sind. Neben dem Editor, dem Publisher und dem Document Architect gibt es noch eine preisgünstigere und individuell angepaßte Contributor-Version, die nur Autorenfunktionen beinhaltet.

Der Adept Editor ist vergleichbar komfortabel bedienbar wie ein normales Textverarbeitungsprogramm, und bietet für die Auszeichnung zwei Hilfen an: QuickTag zeigt nach Drücken der Eingabetaste alle an der aktuellen Cursorposition zulässigen Tags und Tag Prompt hebt alle leeren Elemente im Dokument hervor, die dann angeklickt und befüllt werden können. Für Datenblätter und ähnliche Dokumente mit Pflichtfeldern existiert ein dialogboxengesteuerter formularartiger Eingabemodus: die Auswahlelemente (etwa Artikelnummern) können direkt aus einer Datenbank übernommen werden. Die Gestaltung dieser Eingabefelder erfolgt mit der integrierten Skriptsprache ACL (Adept Command Language).

Maximale Unterstützung für den XML-Autor

Der Adept Publisher enthält zusätzlich zu den Editorfunktionen ein automatisches Layoutprogramm, das PostScript-Code erzeugt. Das Erscheinungsbild wird über eine grafische Benutzeroberfläche zur FOSI (Format Output Specification Instance), dem Industriestandard für SGML Style Sheets, definiert; eine FOSI kann in den (noch nicht ganz fertigen) XSL-Standard konvertiert werden. Eine Stärke von Adept ist die Darstellung mathematischer Formeln. Der Publisher beherrscht den regelbasierten Spalten- und Seitenumbruch, erzeugt Fußnoten, Inhalts- und Stichwortverzeichnisse sowie Listen von Bildern, Gleichungen und Tabellen.

Mit dem Document Architect können SGML-gemäße DTDs und Style Sheets für Druck und Bildschirmdarstellung geschrieben, kompiliert und getestet werden. Über ihn werden auch das Erscheinungsbild von Tags und zahlreiche andere Eingabe- und Darstellungsoptionen im Adept Editor definiert.

Adept 8.0 liefert eine Vielzahl von DTDs und Style Sheets samt Musterdokument mit, darunter auch welche für HTML 4, die den Einstieg wesentlich erleichtern. Die Funktionalität von Adept kann hier natürlich nur ansatzweise beschrieben werden: gegenüber dem Ruderboot XML Pro (Festplattenbedarf 3 MB) mutet Adept 8.0 mit seinen 80 MB an wie ein Flugzeugträger. Ausführliches Material findet sich auf der Website www.arbortext.com.

Fazit: Ein Ruderboot, eine Yacht und eine Flugzeugträger

Für den Einstieg in die XML-Welt ist XML Pro von Vervet Logic sicherlich ein guter Anfang. Für anspruchsvollere Aufgaben ist XMetal von Softquad die ideale Ausgangsbasis: insbesondere Webdesigner können sich hier mit der XML-basierten Gestaltung ihrer Seiten vertraut machen – auch wenn damit nur die jüngste Browsergeneration bedient werden kann. Wer bereits mit SGML vertraut ist, findet in Adept 8.0 von Arbortext eine überaus funktionale Lösung für das technische Dokumentenpublishing für Online und Print, die kaum noch Wünsche offen lässt.

Die XML-Materie ist nicht ganz einfach: man braucht wohl einige Zeit, um souverän mit ihr umgehen zu können. Die SGML-Experten unter den Lesern bittet der Autor daher um Nachsicht - er macht aus seiner phasenweisen Überforderung („DTD not found“) bei der Bearbeitung dieses Themas kein Hehl. 

Roland Dreyer

Bildlegenden

Bild 1a-c: (a: XM-WSW, b: XM-Tag; c: XM-ASC)

XMetal von Softquad bietet drei verschiedene Ansichten eines Dokuments: WYSIWIG, mit Tags und Plain ASCII. Die Symbolleisten sind frei konfigurierbar und bieten direkten Zugriff auf die Tags der DTD. Xmetal eignet sich v.a. für komplexe Webanwendungen.

Bild 2: (Xpro)

XML Pro 2.0 von Vervet Logic ist ein feines Java-Programm, mit dem man seine  ersten Gehversuche mit XML machen kann.

Bild 3a+b: (adept3 und adept4)

Adept 8.0 von Arbortext ist ein überaus komfortables und reich ausgestattetes Programm zum Erzeugen von XML- und SGML-Dokumenten für Crossmedia-Publishing technischer Dokumentationen. Musterdokumente für die mitgelieferten DTDs machen den Einstieg leichter, aber die Help-Datei hat nicht umsonst fast 8 MB.

Copyright: Roland Dreyer 1999