1.Klicken Sie oben im Dialogfeld Einstellungen für Dokumentenimport auf Filterverkettung hinzufügen. Wählen Sie im Dialogfeld Filterverkettung hinzufügen den Regex-Tagger aus:
2.Klicken Sie auf OK. Im Dialogfeld Einstellungen für Dokumentenimport werden jetzt die Optionen für den Regex-Tagger angezeigt:
3.Fügen Sie diesem Dialogfeld drei Regeln hinzu. Zunächst wird eine Regel hinzugefügt, um öffnende XML-Tags zu ersetzen, die wie folgt dargestellt werden: <tag_text>. Füllen Sie die Felder Regulärer Ausdruck, Tag-Typ und Text anzeigen wie folgt aus, und klicken Sie dann nach jeder Regel auf Hinzufügen: Regulärer Ausdruck: <[^/]*?>
Es müssen die kürzesten Zeichenfolgen gefunden werden, die mit < beginnen, mit > enden und keine Schrägstriche enthalten. Mit dem Raster [^/] werden alle Zeichen außer den Schrägstrichen gefunden, und mit dem Raster *? wird an memoQ weitergegeben, dass diese zwar wiederholt, aber so wenig wie möglich benötigt werden. Dadurch beendet memoQ den Abgleich beim ersten ">"-Zeichen.
Hinweis: Wenn zum Suchen nach Wiederholungen statt *? das üblichere Zeichen * verwendet wurde, wird in memoQ nach der längsten Übereinstimmung gesucht und der Abgleich beim letzten ">"-Zeichen im Text beendet – möglicherweise unter Einbeziehung mehrfacher XML-Tags und auch einer großen Menge Text.
Tag-Typ: Öffnen
Text anzeigen: $0
Dadurch wird der Tag-Text in das in memoQ angezeigte Inline-Tag kopiert.
4.Als Nächstes müssen wie folgt dargestellte schließende Tags ersetzt werden: </tag_text>. Regulärer Ausdruck: </[^/]*?>
Dies ähnelt sehr dem vorhergehenden Fall, aber es wird nach Zeichenfolgen gesucht, die mit </ beginnen statt mit <. Innerhalb des Tag-Texts sind Schrägstriche weiterhin nicht zulässig.
Tag-Typ: Schließen
Text anzeigen: $0
5.Als Letztes sind leere Tags zu berücksichtigen, die wie folgt dargestellt werden: <tag_text/>. Regulärer Ausdruck: <[^/]*?/>
Tag-Typ: Leer
Text anzeigen: $0
Nach dem Einrichten der Regeln muss das Dialogfeld Einstellungen für Dokumentenimport wie folgt aussehen:
|