Mehrsprachige XML-Dateien
Wenn Sie Text übersetzen oder lokalisieren sollen, der anstatt in Dokumentdateien in Datenbanken erstellt und gespeichert wird, erhalten Sie häufig mehrsprachige XML-Dateien (eXtensible Markup Language).
Mehrsprachige XML-Dateien können in memoQ in einem Schritt in mehrsprachige Projekte importiert werden. Dadurch können Sie mehrsprachige Projekte schneller einrichten.
Nur mehrsprachige Projekte: Verwenden Sie diesen Filter nur, wenn Sie ein mehrsprachiges Projekt in memoQ project manager einrichten.
Import in LiveDocs nicht möglich: Sie können eine mehrsprachige XML-Datei nicht in ein LiveDocs-Korpus importieren.
Weitere allgemeine Informationen zu XML: Siehe das Thema zum Importieren von XML-Dateien.
Navigation
- Importieren Sie eine mehrsprachige XML-Datei.
- Wählen Sie im Fenster Dokument-Importoptionen die XML-Dateien aus, und klicken Sie auf Filter und Konfiguration ändern.
- Das Fenster Einstellungen für Dokumentenimport wird angezeigt. Wählen Sie in der Dropdown-Liste Filter die Option Filter für mehrsprachige XML-Dateien aus.
Möglichkeiten
Beginnen Sie auf der Registerkarte Codierung und Referenzdateien.
- Überprüfen Sie die Codierung. Normalerweise enthält ein XML-Dokument eine Kopfzeile, die die Codierung festlegt. Wenn diese fehlt oder falsch ist, müssen Sie in der Liste Standardcodierung auswählen eine andere Codierung auswählen. Im Feld Vorschau können Sie den eigentlichen Text überprüfen.
- Richten Sie Referenzdateien ein. Normalerweise werden die importierten Dateien verwendet. Wenn Sie Regeln oder Tags einrichten möchten, werden in memoQ die Inhalte aus diesen Dateien angezeigt.
Wenn das Projekt umfangreicher ist und viele Dateien enthält, die nicht unmittelbar bearbeitet werden müssen, jedoch zum Projekt gehörten – oder gehören werden – können Sie sie hinzufügen. Klicken Sie unter "Referenzdateien und DTD" auf "Datei hinzufügen".
Wenn Sie über die Dokumenttypdefinition (DTD) oder das XML-Schema verfügen, die bzw. das alle Tags und Attribute angibt, können Sie alternativ auch diese verwenden. Klicken Sie neben dem Textfeld "DTD/Schema" auf "Durchsuchen", und wählen Sie die DTD- oder Schemadatei aus.
Richten Sie als Nächstes Importregeln für die verschiedenen Sprachen in der mehrsprachigen XML-Datei ein.
So sieht ein sehr einfaches Beispiel aus:
Ein Eintrag in einer mehrsprachigen XML-Datei enthält den gleichen Text in mehreren Sprachen. Eine Importregel gibt in memoQ an, wo der Text für eine dieser Sprachen zu finden ist.
Die Importregel gibt zudem an, ob ein Kontext, ein Kommentar und möglicherweise eine Längenbegrenzung für den Text in dieser Sprache vorhanden ist. Praktisch ist eine Importregel für jede Sprache erforderlich.
- So richten Sie die Importregeln ein: Klicken Sie auf den Tab Importregeln. Klicken Sie unten auf Importregeln bearbeiten. Das Fenster XML-Importregeln wird angezeigt.
- Blenden Sie links alle Elemente im ersten Eintrag ein.
So fügen Sie eine Regel für eine Sprache hinzu:
- Klicken Sie auf das Tag, das den Text enthält. Klicken Sie nicht auf den Text und auf kein Attribut. Klicken Sie im Beispiel oben in <string lang="de"> auf 'string'. Das Feld XPath für ausgewählte Zeile wird ausgefüllt.
Regeln werden mit XPath-Ausdrücken angegeben: Ein XPath-Ausdruck verweist auf eine Stelle in einer XML-Datei. In gewisser Hinsicht beschreibt er die "Koordinaten" eines Elements in einer XML-Datei.
- Klicken Sie bei dem Feld XPath-Inhalt auf Von ausgewählter Zeile auffüllen. In memoQ wird ein XPath-Ausdruck eingefügt, der auf das Element verweist, auf das Sie geklickt haben. Dieser XPath-Ausdruck nimmt keine anderen Elemente auf. An diesem Punkt müssen Sie ihn bearbeiten, um ihn allgemeiner zu definieren und sinnvolle Bedingungen festzulegen (z. B. Aufnehmen eines 'string'-Elements für die deutsche Sprache, wenn für das zugehörige Attribut 'lang' der Wert "de" angegeben ist).
Informationen zu den erforderlichen Bearbeitungen an einem XPath-Ausdruck: Siehe das Thema zum Fenster "XML-Importregeln".
- Wählen Sie in der Dropdown-Liste memoQ-Sprache die Sprache des Texts aus. Im Beispiel wählen Sie Deutsch aus.
Sie können jede Sprache auswählen, die in memoQ unterstützt wird. Wenn das Projekt diese Sprache jedoch nicht beinhaltet, wird das Element nicht importiert.
Die XML-Datei kann andere Elemente enthalten, die als Kontext, Kommentar und optionale Längenbegrenzung für den Text dienen.
- Klicken Sie auf das Element, das als Kontext verwendet werden soll. Im Beispiel oben klicken Sie auf das id-Attribut (Bezeichner) des entry-Tags: Klicken Sie im ersten <entry id="E1">-Tag auf 'ID'. Wieder müssen Sie den XPath-Ausdruck so bearbeiten, dass er nicht nur die erste, sondern alle Eintrags-IDs aufnimmt.
- Klicken Sie bei dem Feld XPath-Kontext (ID) für Inhalt auf Von ausgewählter Zeile auffüllen.
- Wenn der Eintrag ein weiteres Element oder Attribut enthält, das eine maximale Länge für den Text festlegt, klicken Sie darauf. Klicken Sie dann bei dem Feld XPath-Längenbeschränkung für Inhalt auf Von ausgewählter Zeile auffüllen.
- Wenn der Eintrag noch ein weiteres Element oder Attribut enthält, das einen Kommentar für den Text enthält, klicken Sie darauf. Klicken Sie dann bei dem Feld XPath-Kommentar für Inhalt auf Von ausgewählter Zeile auffüllen. Sie können auch den Kommentartyp (Schweregrad) für memoQ in der Dropdown-Liste memoQ-Kommentartyp festlegen.
- Wenn alle Elemente und Attribute ausgefüllt sind, klicken Sie auf Im Regelsatz speichern.
Die meisten Teile der Regel sind optional. Der Text (Inhalt) muss natürlich vorhanden sein. In memoQ wird eine Warnung angezeigt, wenn Sie eine Regel ohne Kontext festlegen.
Wenn Sie eine Regel ändern möchten, empfiehlt es sich, die Regel unten auszuwählen, auf Regel löschen zu klicken und sie erneut einzurichten.
Weitere Informationen finden Sie im Thema über XML-Importregeln.
Normalerweise sollten die Regeln genügen, um mehrsprachige XML-Dateien verwenden zu können. Von Natur aus sind sie in ihrer Struktur weniger komplex als "herkömmliche" einsprachige XML-Dateien.
Dennoch müssen Sie möglicherweise Inline-Tags und andere ungewöhnlichere Zeichenentitäten verwenden. In einigen Fällen müssen Sie unter Umständen sogar Bedingungen für die Übersetzung bestimmter Elemente einrichten. Diese können Sie auf den Registerkarten "Sonstige Tags und Attribute" und "Entitäten" einrichten.
Weitere Informationen zum Verwenden von Tags, Attributen und Entitäten in XML-Dateien: Siehe das Thema zum Importieren von XML-Dateien.
Beim Importieren von mehrsprachigen XML-Dateien können Sie auf der Registerkarte Allgemein weitere Optionen festlegen.
- Mehrere Leerzeichen mit nur einem Leerzeichen ersetzen: Normalerweise werden Folgen von Tabstopps, Leerzeichen und Zeilenumbruchzeichen in memoQ in ein einzelnes Leerzeichen umgewandelt. Zudem werden alle Leerräume am Anfang und am Ende von Elementen gelöscht. In der Regel werden in XML-Dokumenten Leerräume zur besseren Lesbarkeit verwendet. Wenn die Leerräume aber Teil der Struktur oder des Inhalts sind, können Sie dies deaktivieren: Deaktivieren Sie dazu dieses Kontrollkästchen.
- Attribut "xml:space" in Datei beachten: XML-Dokumente können Attribute enthalten, mit denen festgelegt wird, ob Leerräume in einem bestimmten Element normalisiert werden sollen (siehe Option oben). Normalerweise werden in memoQ diese Anweisungen befolgt, wenn Leerräume gefunden werden. Um sie zu ignorieren und Leerräume überall gleich zu behandeln: Deaktivieren Sie dieses Kontrollkästchen.
- Segmentierung bei Umbrüchen, wenn Leerräume beibehalten werden: Normalerweise wird in memoQ bei einem Zeilenumbruchzeichen kein neues Segment begonnen. (Für gewöhnlich wird das Zeilenumbruchzeichen gar nicht erst gefunden, da es in ein Leerzeichen normalisiert wird.) Wenn jedoch das Kontrollkästchen Mehrere Leerzeichen mit nur einem Leerzeichen ersetzen deaktiviert ist und Zeilenumbruchzeichen den Anfang eines neuen Segments bedeuten, können Sie dieses Kontrollkästchen aktivieren. Es empfiehlt sich, das Kontrollkästchen Segmentierung bei Umbrüchen, wenn Leerräume beibehalten werden zu aktivieren, wenn das Kontrollkästchen Mehrere Leerzeichen mit nur einem Leerzeichen ersetzen deaktiviert ist.
- Verarbeitungsanweisungen als Inline-Tags importieren: Normalerweise werden Verarbeitungsanweisungen (die mit "<$" beginnen) in memoQ in Form von Inline-Tags (des Typs "mq:pi") importiert. Deaktivieren Sie dieses Kontrollkästchen nicht.
Abschließende Schritte
Gehen Sie folgendermaßen vor, um die Einstellungen zu bestätigen und zum Fenster Dokument-Importoptionen zurückzukehren: Klicken Sie auf OK.
Gehen Sie folgendermaßen vor, um zum Fenster Dokument-Importoptionen zurückzukehren und die Filtereinstellungen nicht zu ändern: Klicken Sie auf Abbrechen.
Wenn es sich um eine Filterverkettung handelt, können Sie die Einstellungen eines anderen Filters in der Kette ändern: Klicken Sie oben im Fenster auf den Namen des Filters.
Im Fenster Dokument-Importoptionen: Klicken Sie erneut auf OK, um die Dokumente zu importieren.
Filter für mehrsprachige XML-Dateien kann der erste Filter in einer Filterkette sein. Nachdem die Spalten importiert wurden, kann in memoQ ein Regex-Tagger ausgeführt werden.