XML-Dateien (eXtensible Markup Language)

XML ist das weltweit vielseitigste Datenformat. XML-Dateien können Text, strukturierte Daten und selbst Programmcode enthalten. Der wohl größte Vorteil liegt darin, dass XML-Dateien von Mensch und Maschine gleichermaßen gut lesbar sind.

Das XML-Format definiert eine Art Markup, mit dem nahezu alles Erdenkliche codiert werden kann. XML kann wie folgt aussehen:

In vielen Fällen enthalten XML-Dateien Text. Und Text muss übersetzt werden.

Viele bekannte Dokumenttypen sind verschleierte XML-Dokumente. HTML ist XML. Word-Dokumente, zumindest das DOCX-Format, sind XML. XLIFF-Dateien sind XML. TMX-Dateien mit Translation-Memory-Inhalten sind XML. Es gibt noch viele weitere, und bei allen handelt es sich um unterschiedliche Formen von XML-Dateien. Eine bestimmte Form von XML-Dokument wird als Dokumenttyp bezeichnet.

XML-Dokumente können in memoQ verarbeitet werden. Wenn das verwendete Dokument jedoch in einer bekannten XML-Form vorliegt (z. B. HTML, DOCX oder XLIFF), verfügt memoQ in der Regel über den jeweiligen speziellen Filter. Zudem wird der entsprechende spezielle Filter automatisch ermittelt, wenn Sie das Dokument öffnen. Wenn Sie ein Word-Dokument importieren, wird daher niemals die Verwendung des XML-Filters vorgeschlagen. Trotzdem wird in memoQ der Großteil des Dokuments mithilfe des XML-Filters gelesen.

In vielen Programmierungs- und Datenbanksystemen werden Inhalte in XML-Dateien gespeichert – oder exportiert. Wenn Sie diese Dateien in memoQ übersetzen, verwenden Sie diesen XML-Filter, um sie zu importieren.

XML-Dateien können mehrsprachig sein. Verwenden Sie dafür den Filter für mehrsprachige XML-Dateien: Manche XML-Dateien enthalten den gleichen Text in mehreren Sprachen. Verwenden Sie zum Importieren dieser Dateien den Filter für mehrsprachige XML-Dateien.

XML-Konfigurationen sind komplex, und es lohnt sich, sie zu speichern: Es kann mehrere Stunden dauern, um memoQ so vorzubereiten, dass alles richtig importiert wird. Stellen Sie daher sicher, dass Sie nach Abschluss der Vorbereitung im Fenster "Einstellungen für Dokumentenimport" auf die Schaltfläche "Speichern" neben der Dropdown-Liste "Filterkonfiguration" klicken. Wenn Sie das nächste Mal eine XML-Datei der gleichen Herkunft importieren möchten, können Sie in derselben Dropdown-Liste "Filterkonfiguration" einfach die gespeicherte Konfiguration auswählen.

Navigation

  1. Importieren Sie eine XML-Datei.
  2. Wählen Sie im Fenster Dokument-Importoptionen die XML-Dateien aus, und klicken Sie auf Filter und Konfiguration ändern.
  3. Das Fenster Einstellungen für Dokumentenimport wird angezeigt. Wählen Sie aus der Dropdown-Liste Filter die Option XML-Filter.

    xml-encoding-tab

Möglichkeiten

Um eine XML-Datei problemlos importieren zu können, müssen Sie zahlreiche Einstellungen vornehmen. Zur Vereinfachung wird in diesem Thema das folgende Beispiel verwendet:

xml-sample-document

Wie jedes XML-Dokument enthält es "normalen" Text, der übersetzt werden soll, aber auch Tags wie <doc>, die in erster Linie beschreibende bzw. strukturelle Informationen beinhalten. Tags können Attribute aufweisen, die Werte besitzen (id="0527"). In den folgenden Abschnitten wird erläutert, wie diese Elemente in memoQ interpretiert werden können.

Abschließende Schritte

Gehen Sie folgendermaßen vor, um die Einstellungen zu bestätigen und zum Fenster Dokument-Importoptionen zurückzukehren: Klicken Sie auf OK.

Gehen Sie folgendermaßen vor, um zum Fenster Dokument-Importoptionen zurückzukehren und die Filtereinstellungen nicht zu ändern: Klicken Sie auf Abbrechen.

Im Fenster Dokument-Importoptionen: Klicken Sie erneut auf OK, um die Dokumente zu importieren.

Ergebnis für das Beispieldokument

Wenn einige Teile übersetzt wurden, müsste das Übersetzungsdokument so aussehen:

xml-sample-translation

Anmerkungen zu diesem Screenshot:

  • Der Text Aug-04-2006(NOT TO BE TRANSLATED) fehlt im Dokument, da das Attribut updInfo als nicht übersetzt festgelegt wurde.
  • Der Text Diagram for illustration purposes wird als separates Segment angezeigt, und mit alt="@2" im img-Tag in Segment 3 wird angegeben, dass der Wert des zu übersetzenden Attributs zwei Segmente weiter unten im Übersetzungsdokument zu finden ist.

    Hinweis: Zu übersetzende Attribute werden während des Importvorgangs für das Dokument erfasst, gespeichert und an der Position in das Übersetzungsdokument eingefügt, an der der aktuelle Inhaltsblock endet – also beim nächsten strukturellen Tag.

  • Das öffnende Tag ref wurde im Zielsegment 2 ohne das erforderliche Attribut „target“ eingefügt – daher zeigt memoQ eine Warnung an.
  • Das Platzhalter-Tag img fehlt im Zielsegment 3 – daher zeigt memoQ eine Warnung an.
  • In Segment 4 wurde die Entität '&copyright;' zu '©' konvertiert.