XML

XML – Extensible Markup Language

XML ist eine Abkürzung für „eXtensible Markup Language”, was auf Deutsch “erweiterbare Auszeichnungssprache” bedeutet. Das Datenformat wurde erstmals 1998 vom W3C (World Wide Web Consortium) eingeführt und wird seitdem regelmäßig international verwendet. Es handelt sich dabei um ein textbasiertes Datenformat, welches in einem einfachen Texteditor bearbeitet werden kann. Das XML-Format kann zum Beschreiben, Speichern und Austauschen von Daten (wie etwa Produktdaten) verwendet werden.

 

Wofür wird XML verwendet?

XML bietet als Datenaustauschformat vielfältige Nutzungsmöglichkeiten. Viele Softwarelösungen und Apps nutzen die klar definierte, hierarchische Struktur des Formats zur Planung und Darstellung von Layouts und Konfigurationsinformationen. Es wird zudem vielfach in vielen Bereichen der Webentwicklung genutzt.

Das Datenformat bietet von Menschen und Maschinen eine gut lesbare Struktur und wird daher auch für den Austausch von Produktdaten verwendet. Der im Produktdatenmanagement verwendete Datenstandard BMEcat basiert auf XML und ermöglicht eine einheitliche Datenstruktur. Sowohl der Produktdatenimport in PIM- oder ERP-Systeme als auch der Produktdatenexport für Marktplätze, Branchenportale oder B2B-Kunden kann beispielsweise über XML-Dateien realisiert werden. Auch der Austausch von Geschäftsdokumenten wie Rechnungen ist möglich: Beispielsweise nutzt der Transaktionsstandard OpenTRANS das Datenformat.

 

Wie ist ein XML-Code strukturiert?

XML ermöglicht einen klar strukturierten, plattformunabhängigen Austausch von Daten und Informationen zwischen mehreren Systemen und Datenempfängern. Die Strukturierung des Datenformats erfolgt durch folgende Komponenten:

  • Öffnende und schließende Tags in spitzen Klammern, z.B. <Artikel> und </Artikel>.
  • Elemente, die durch Tags definiert sind, wie <Artikelnr>, in denen Daten oder Werte gespeichert sind, z.B. <Artikelnr>24688</Artikelnr>.
  • Attribute, die zusätzliche Informationen zu einem Element bereitstellen und innerhalb des öffnenden Tags definiert sind, z.B. <Produkt Artikelnr=”24688″>.
  • Inhalte oder Werte, die zwischen dem öffnenden und schließenden Tag eines Elements stehen, wie die genannte Artikelnummer „24688“.

Hier ein Beispiel aus dem Produktdatenmanagement:

Beispiel-Code für eine XML-Datei im Kontext des Produktdatenmanagements

Elemente können auch in anderen Elementen verschachtelt sein, wodurch Hierarchien abgebildet werden können:

<Artikel>

<DEHANR>123456789</ DEHANR>

<LFKURZ>LF1</LFKURZ>

<LFNAME>Lieferant1 GmbH </LFNAME>

</Artikel>

 

Worauf muss man beim XML-Format achten?

XML-Dateien basieren auf festgelegten Strukturgrundlagen. Dazu gehören:

  • Die Unterscheidung zwischen Groß- und Kleinschreibung:
    Die Datenstruktur ist case-sensitive, unterscheidet also zwischen Groß- und Kleinschreibung. Beispielsweise werden die Tags <Produkt> und <produkt> vom XML-Parser als zwei unterschiedliche Elemente behandelt, obwohl sie inhaltlich dieselbe Funktion erfüllen könnten. Dies zeigt die Wichtigkeit einer einheitlichen Nutzung von Groß- und Kleinschreibung in XML-Dokumenten. 

Hier ein Beispiel:

<ProduktListe>

<Produkt>

<Name>Wasserkocher</Name>

<Preis>29,99€</Preis>

</Produkt>

<produkt>

<name>Toaster</name>

<preis>19,99€</preis>

</produkt>

</ProduktListe>

 

  • Die Öffnung und Schließung von Elementen:
    Ein geöffnetes Element (z.B. <Produkt>) muss auch wieder geschlossenen werden (</Produkt>).

 

  • Die Einhaltung der hierarchischen Reihenfolge:
    Bei der Nutzung von ineinander verschachtelten Elementen müssen Elementen innerhalb der übergeordneten Elemente entsprechend hierarchisch passend geschlossen werden:

<Produkt>

<Name>Wasserkocher</Name>

<Preis>29,99€</Preis>

</Produkt>

Die Elemente „<Name>“ und „<Preis>“ wurden innerhalb des Elements „<Produkt>“ geöffnet und müssen entsprechend auch innerhalb des übergeordneten Elements „<Produkt>“ wieder geschlossen werden. Erst danach kann das übergeordnete Element wieder geschlossen werden („</Produkt>“).

 

Wie können XML-Dateien erzeugt und bearbeitet werden?

Die manuelle Aufbereitung von Produktdaten in einer solchen übersichtlichen Datenstruktur mithilfe von Texteditoren kann je nach Datenmenge und Hierarchiestruktur sehr zeitintensiv und mühselig sein.

Mit der SaaS-Lösung CatalogExpress können Hersteller und Händler selbst eine Vielzahl von Produktdaten schnell in eine saubere und einheitliche Struktur bringen. Neben der Konvertierung von Datenformaten wie CSV oder XLSX in eine XML-Datenstruktur ermöglicht die Data-Syndication-Software zudem die automatisierte Datenbereitstellung in verschiedenen Austauschformaten wie BMEcat ETIM. Produktdaten können aus einer oder mehreren Datenquellen (verschiedene Systeme wie PIM/DAM/ERP sowie aus unterschiedlichen Dateiformaten) in CatalogExpress importiert werden und in wenigen Schritten optimal auf verschiedene Zielformatvorlagen wie beispielsweise BMEcat ETIM (also XML) angepasst werden.

Um sicherzustellen, dass die optimierten Produktdaten einer vordefinierten Formatvorgabe entsprechen, können die Daten in CatalogExpress gegen ein vorgegebenen XML Schema (auch „XML Schema Definition“ oder XSD genannt) geprüft / validiert werden. Diese jeweilige Zielstruktur kann dabei entweder vom Nutzer selbst oder vom jeweiligen Datenempfänger (z. B. PIM, ERP, Kunden oder Marktplätze) vorgegeben werden. Anschließend kann die erstellte Katalogdatei exportiert und Datenempfängern automatisiert über SFTP-Server oder andere Wege bereitgestellt werden.

Hier finden Sie weitere Informationen zu den vielfältigen CatalogExpress-Features.

 

Welche Austauschformate nutzen XML?

Das Datenformat wird aufgrund seiner Vorteile vielfach im Bereich des Produktdatenmanagements genutzt. Hier finden Sie ein paar bekannte Beispielformate:

  1. Der BMEcat basiert als Standard für elektronische Produktkataloge auf XML. Die Struktur ermöglicht die übersichtliche und umfassende Angabe diverser Produktdaten (Kategorien, Artikelnummern, Bezeichnungen, Preisen und mehr). Auch Klassifikationsmodelle wie ETIM und ECLASS nutzen XML zur Angabe von Produktklassifikationen.
  2. Der Datenstandard „GS1 XML“ wird für den Datenaustausch von Bestellungen, Rechnungen und anderen logistischen Informationen verwendet.
  3. Das Format „cXML“ wurde speziell für den Austausch geschäftlicher Informationen (Bestellungen, Auftragsbestätigungen, eKataloge) entwickelt.
  4. Der Datenstandard „openTRANS“ bildet Daten im XML-Schema ab.
  5. Auch der Baubranchen-Datenstandard DPB basiert auf XML.

 

Welche Vorteile bietet XML für Ihr Produktdatenmanagement?

Das XML-Format eignet sich für das Produktdatenmanagement gleich aus mehreren Gründen:

  1. XML-Dateien sind übersichtlich und haben eine klar definierte hierarchische Struktur:
    Unternehmen können ihre Produktdaten klar geordnet und leicht erkennbar darstellen und aufbereiten.
  2. Das Format kann sowohl von Menschen als auch von Maschinen gelesen werden:
    Sowohl Mitarbeiter als auch Systeme und externe Datenempfänger können mit Daten im XML-Format arbeiten.
  3. Es ist ein weitverbreitetes Datenformat:
    Da es sich um ein offenes und international etabliertes Format handelt, können Unternehmen ihre Produktdaten effizient mit Partnern, Lieferanten, Datenempfängern und Systemen (PIM, ERP, MDM, DAM etc.) austauschen. Anders gesagt: XML ist ein plattformunabhängiges Format. XML-Dateien können also von verschiedenen Softwarelösungen und Plattformen problemlos gelesen und verwendet werden.
  4. Die Auszeichnungssprache ist flexibel erweiterbar („extensible“):
    Nutzer können eigene Elemente definieren (etwa für spezifische Produktattribute wie Preise, Besonderheiten etc.). Auch die Berücksichtigung externer Anforderungen an die Darstellung und den Beschreibungsumfang von Produktdaten im XML-Schema ist möglich. So können Sie Ihre Produktdaten optimal Datenempfängern wie B2B-Kunden, Marktplätzen oder Branchenportalen zur Verfügung stellen.

 

Welche Nachteile hat das XML-Format?

Neben den vielfältigen Vorteilen ist auch die Berücksichtigung von technischen Nachteilen des Formats wichtig. Obwohl Produktdaten klar und eindeutig darstellen werden können, kann die hierarchische Struktur gerade bei vielen und komplex verschachtelten Elementen Auswirkungen auf

  • die Dateigröße
  • die Übertragungsgeschwindigkeit und
  • die Verarbeitung der Datei durch Systeme haben.

Um diese Faktoren zu minimieren und eine schlankerer Datenstruktur zu ermöglichen, wurden im Laufe der Zeit weitere Dateiformate wie JSON entwickelt.

 

Wie unterscheiden sich XML und JSON voneinander?

Beide Formate werden in der digitalen Datenverarbeitung genutzt und weisen Ähnlichkeiten auf, unterscheiden sich allerdings auch in wichtigen Punkten. Hier die fünf größten Gemeinsamkeiten und Unterschiede:

  1. JSON ist jünger:
    Während XML bereits seit 1998 verwendet wird, wurde JSON (JavaScript Object Notation) Anfang der 2000er Jahre eingeführt.
  2. Beide Datenformate ermöglichen ein strukturiertes Produktdatenmanagement:
    Die hierarchische Struktur kann selbst größere Datenmengen klar strukturiert darstellen.
  3. Die Formate sind für Mensch und Maschine lesbar:
    Die eindeutige Struktur beider Formate sorgt für eine einfache und vielseitige Nutzung.
  4. Beide Datenformate nutzen eine unterschiedliche Syntax:
    XML nutzt eine hierarchische Datenstruktur mit öffnenden und schließenden Tags. JSON nutzt unter anderem Objekte (gekennzeichnet durch geschweifte Klammern {}), welche aus Schlüssel-Wert-Paaren bestehen. Außerdem werde Werte in sogenannten Arrays (in eckigen Klammern) zusammengefasst, wie etwa [„Artikel1“, „Artikel2“, „Artikel 3“].
  5. Daten werden unterschiedlich dargestellt:
    Bei großen Datenmengen kann die Verwendung von XML oder JSON einen wichtigen Unterschied machen. Aufgrund der unterschiedlichen Grundstruktur kann dieselbe Datenmenge im JSON-Format kürzer und schlanker dargestellt werden, was zu geringeren Dateigrößen und kürzeren Übertragungszeiten führt.

 

Dies ist einer der Gründe, warum das ETIM xChange-Datenformat als Nachfolger für den BMEcat auf JSON basiert. Im NEXIpedia-Beitrag zum JSON-Format finden Sie außerdem weitere wissenswerte Informationen.

Sie haben Fragen? Lassen Sie sich gerne unverbindlich zu den vielfältigen Funktionen von CatalogExpress beraten.

Wer hat‘s geschrieben?
Jan Müller
jan.mueller@nexoma.de

Jan ist seit 2024 bei nexoma. Dem gelernten E-Commerce-Kaufmann sind Produktdaten alles andere als fremd. Als sprachlich versierter Marketing Manager ist Jan außerdem unser Mann für viele Texte (Deutsch und Englisch) und versorgt euch unter anderem mit wissenswerten NEXIpedia- und Newsletter-Beiträgen.