Verwenden Sie dieses Dialogfeld, um zu steuern, wie in memoQ mögliche Begriffe aus den Ausgangsdokumenten, LiveDocs-Korpora oder Translation Memories extrahiert werden. Als Ergebnis erhalten Sie eine Liste mit Kandidaten, die Sie bereinigen, filtern und bearbeiten können, bevor Sie sie in eine Termdatenbank aufnehmen.
Sie können die Liste der Kandidaten auch zum Durchsuchen als Termdatenbank bereitstellen.
Erste Schritte
Wählen Sie auf der Registerkarte Vorbereitung des Menübands die Option Begriffe extrahieren aus. Sie müssen ein Projekt öffnen bzw. erstellen, damit Sie diesen Befehl verwenden können.
Hinweis: Wenn Sie in einem Projekt bereits zuvor eine Terminologieextraktion ausgeführt haben, wird in memoQ statt dieses Dialogfelds das Dialogfeld Begriffe extrahieren angezeigt. Wenn Sie dieses Dialogfeld mithilfe des Befehls Begriffe extrahieren anzeigen möchten, klicken Sie auf der Registerkarte Vorbereitung des Menübands auf Terminologieextraktionssitzungen.
Verwendung
Name der Sitzung
Mit dem Befehl Begriffe extrahieren wird im Projekt eine Terminologieextraktionssitzung erstellt. Eine Sitzung ist erforderlich, da die in memoQ generierte Liste mit Kandidaten viele irrelevante Ausdrücke enthält und zudem zahlreiche zielsprachliche Entsprechungen fehlen. Sie müssen die Kandidatenliste bereinigen und bearbeiten, damit Sie sie einer Termdatenbank hinzufügen können. Die Liste der Kandidaten wird in Ihrem Arbeitsbereich gespeichert, und Sie können die Liste nach Bedarf verlassen bzw. zur Liste zurückkehren.
Im Textfeld Name der Sitzung oben im Dialogfeld müssen Sie einen Namen für die Sitzung festlegen. Der Standardname besteht aus dem aktuellen Datum, Sie können jedoch auch einen beliebigen anderen Namen eingeben.
|
Quellen (Abschnitt)
In diesem Abschnitt können Sie die Materialien auswählen, aus denen die Kandidaten extrahiert werden.
•Kontrollkästchen Zu übersetzende Dokumente: Aktivieren Sie dieses Kontrollkästchen, wenn der ausgangssprachliche Text der zu übersetzenden Dokumente im aktuellen Projekt verarbeitet werden soll. Dieses Kontrollkästchen ist standardmäßig aktiviert, aber nur verfügbar, wenn im aktuellen Projekt mindestens ein zu übersetzendes Dokument vorhanden ist. ▪Optionsfeld Jedes Dokument: Wählen Sie dieses Optionsfeld aus, wenn alle Dokumente im Projekt verarbeitet werden sollen. Dies ist die Standardeinstellung. ▪Optionsfeld Ausgewählte Dokumente: Wählen Sie dieses Optionsfeld aus, wenn die ausgewählten Dokumente verarbeitet werden sollen. Sie müssen ein oder mehrere Dokumente im Bereich Übersetzungen der Projektzentrale auswählen, damit Sie diese Option verwenden können. •Kontrollkästchen Translation Memories: Aktivieren Sie dieses Kontrollkästchen, wenn der ausgangssprachliche Text aus den im aktuellen Projekt verwendeten Translation Memories verarbeitet werden soll. Dieses Kontrollkästchen ist standardmäßig aktiviert, aber nur verfügbar, wenn im aktuellen Projekt mindestens ein Translation Memory verwendet wird. ▪Optionsfeld Alle Memories im Projekt: Wählen Sie dieses Optionsfeld aus, wenn alle im aktuellen Projekt verwendeten Translation Memories verarbeitet werden sollen. Dies ist die Standardeinstellung. ▪Optionsfeld Primäres TM: Wählen Sie dieses Optionsfeld aus, wenn nur das primäre Translation Memory verarbeitet werden soll. ▪Optionsfeld Ausgewählte TMs: Wählen Sie dieses Optionsfeld aus, wenn die ausgewählten Translation Memories verarbeitet werden sollen. Sie müssen ein oder mehrere TMs im Bereich Translation Memories der Projektzentrale auswählen, damit Sie diese Option verwenden können. •Kontrollkästchen LiveDocs-Korpora-Dokumente: Aktivieren Sie dieses Kontrollkästchen, wenn der ausgangssprachliche Text aus den im aktuellen Projekt verwendeten LiveDocs-Korpora verarbeitet werden soll. Dieses Kontrollkästchen ist standardmäßig nicht aktiviert. Es ist nicht verfügbar, wenn im aktuellen Projekt keine LiveDocs-Korpora verwendet werden. ▪Optionsfeld Alle angezeigten Dokumente: Wählen Sie dieses Optionsfeld aus, wenn alle Dokumente aus allen im aktuellen Projekt verwendeten LiveDocs-Korpora verarbeitet werden sollen. Dies ist die Standardeinstellung. ▪Optionsfeld Ausgewählte Dokumente: Wählen Sie dieses Optionsfeld aus, wenn die ausgewählten Dokumente im ausgewählten LiveDocs-Korpus verarbeitet werden sollen. Sie müssen ein oder mehrere Dokumente aus einem LiveDocs-Korpus im Bereich LiveDocs der Projektzentrale auswählen, damit Sie diese Option verwenden können. |
Optionen (Abschnitt)
In diesem Abschnitt können Sie die Terminologieextraktion anpassen.
Hinweis: Die Terminologieextraktion erfolgt in memoQ rein statistisch (basierend auf der Länge und Häufigkeit der Kandidaten); dabei werden keine Methoden der linguistischen Intelligenz (z. B. Stemming oder Parsing) verwendet. Mit den im Folgenden beschriebenen Optionen wird das Statistikverfahren gesteuert.
Allgemeine Optionen
•Textfeld Maximale Länge in Wörtern: Die Anzahl der Wörter im längsten Kandidaten. Es werden keine Ausdrücke aufgelistet, die länger sind. Der Standardwert ist 4. •Textfeld Mindestvorkommen: Es werden keine Kandidaten aufgelistet, die im Ausgangstext nicht mindestens so oft vorkommen, wie mit dieser Zahl angegeben wird. Beispiel: Wenn das Mindestvorkommen mit 3 angegeben ist, enthält die Liste Kandidaten, die im Ausgangstext mindestens 3 Mal vorkommen. Der Standardwert ist 3. •Textfeld Trennzeichen für Ausdrücke: Hierbei handelt es sich um eine Liste mit Zeichen, die den Anfang bzw. das Ende eines Kandidaten markieren. Es werden keine Ausdrücke extrahiert, in denen ein oder mehrere dieser Zeichen vorkommen. •Textfeld Längenfaktor: Hierbei handelt es sich um eine Zahlenangabe zwischen 0,5 und 3, über die gesteuert wird, inwiefern längere Ausdrücke in memoQ bevorzugt behandelt werden sollen. Für jeden Kandidaten (d. h. für jeden extrahierten Ausdruck) wird während der Extraktion ein Wert vergeben. Je größer der Längenfaktor ist, desto größer ist der Unterschied zwischen dem Wert eines längeren und eines kürzeren Ausdrucks. Der Standardwert ist 1,5. •Kontrollkästchen Wörter mit Zahlen ignorieren: Wenn dieses Kontrollkästchen aktiviert ist, werden keine Ausdrücke berücksichtigt, die ein Wort mit einer oder mehreren Ziffern enthalten. Das Kontrollkästchen ist standardmäßig deaktiviert.
Einzelne Begriffe
In memoQ wird ein spezieller Ansatz zum Extrahieren von Einzelbegriffskandidaten verwendet. Mit den folgenden Einstellungen wird gesteuert, wie sie extrahiert werden.
•Textfeld Mindestlänge in Zeichen: Es werden keine Wörter aufgelistet, die kürzer als die hier angegebene Zahl sind. Beispiel: Wenn die Mindestlänge mit 3 angegeben ist, werden Einzelbegriffskandidaten extrahiert, die mindestens 3 Zeichen lang sind. Der Standardwert ist 3. Hinweis: Die Mindestlänge gilt nicht für Kandidaten, die mehrere Wörter enthalten.
•Textfeld Mindestvorkommen: Es werden keine Kandidaten aufgelistet, die im Ausgangstext nicht mindestens so oft vorkommen, wie mit dieser Zahl angegeben wird. Beispiel: Wenn das Mindestvorkommen mit 3 angegeben ist, enthält die Liste Kandidaten, die im Ausgangstext mindestens 3 Mal vorkommen. Der Standardwert ist 3.
Termdatenbank-Lookup
Beim Extrahieren von Kandidaten in memoQ wird ausschließlich nach Ausdrücken im ausgangssprachlichen Text gesucht. Es können jedoch mögliche Übersetzungen für die extrahierten Kandidaten abgerufen werden, indem die im selben Projekt verwendeten Termdatenbanken danach durchsucht werden.
•Kontrollkästchen Nachschlagekandidaten: Aktivieren Sie dieses Kontrollkästchen, wenn die im aktuellen Projekt verwendeten Termdatenbanken nach Übersetzungen für die einzelnen Kandidaten durchsucht werden sollen. Das Kontrollkästchen ist standardmäßig aktiviert. ▪Optionsfeld Alle Termdatenbanken in einem Projekt: Wählen Sie dieses Optionsfeld aus, wenn alle Termdatenbanken im aktuellen Projekt nach den Kandidaten durchsucht werden sollen. Dies ist die Standardeinstellung. ▪Optionsfeld Nur die Termdatenbank mit der höchsten Priorität: Wählen Sie dieses Optionsfeld aus, wenn ausschließlich die Termdatenbank mit der höchsten Priorität nach den Kandidaten durchsucht werden soll. |
Stoppwörter
Es gibt Wörter, die in der Regel nicht am Anfang, am Ende oder innerhalb einer Benennung vorkommen. Wenn ein Ausdruck mit einem dieser Wörter beginnt, damit endet oder eines dieser Wörter enthält, sollte er nicht als Kandidat aufgeführt werden.
Solche Wörter werden als Stoppwörter bezeichnet.
•Im unteren Teil des Dialogfelds Kandidaten extrahieren können Sie Stoppwörter auflisten. Für jedes Stoppwort stehen drei Optionen zur Verfügung: Sie können Wörter vom Anfang, vom Ende oder von einer beliebigen Position in einem Ausdruck ausschließen. •In memoQ können Sie mehrere Stoppwortlisten erstellen, speichern und verwenden. Wenn Sie eine vorhandene Stoppwortliste laden möchten, wählen Sie in der Dropdown-Liste Stoppwortliste eine Stoppwortliste aus. •Wenn Sie die aktuelle Stoppwortliste speichern möchten, klicken Sie neben dem Feld Stoppwortliste auf Speichern unter..., und geben Sie im Dialogfeld Neue Stoppwortliste erstellen einen Namen sowie einen Ausdruck an. Hinweis: Bei Stoppwortlisten handelt es sich um allgemeine Ressourcen in memoQ. Sie können sie in der Ressourcenkonsole speichern, laden und verwalten.
Achtung: Bei der Stoppwortliste im Screenshot handelt es sich um ein Beispiel. Standardmäßig können in memoQ verschiedene Stoppwortlisten vorhanden sein. Es ist auch möglich, dass für Ihre Ausgangssprache keine Standard-Stoppwortliste vorhanden ist.
Wenn Sie ein neues Stoppwort in die Liste aufnehmen möchten, geben Sie das Wort im Textfeld Wort im unteren Bereich des Dialogfelds ein, und klicken Sie neben dem Textfeld auf den Link Hinzufügen.
Beim Hinzufügen des Worts zur Liste sind standardmäßig alle Kontrollkästchen in den Spalten Stoppt dazwischen, Stoppt beim ersten und Stoppt beim letzten aktiviert. Nachdem Sie ein Wort hinzugefügt haben, können Sie ein oder mehrere dieser Kontrollkästchen deaktivieren:
•Stoppt dazwischen: Aktivieren Sie dieses Kontrollkästchen, wenn das Wort nirgendwo in einer Benennung vorkommen darf. Ausdrücke mit diesem Wort werden nicht aufgeführt. •Stoppt beim ersten: Aktivieren Sie dieses Kontrollkästchen, wenn das Wort nicht am Anfang einer Benennung vorkommen darf. Ausdrücke, die mit diesem Wort beginnen, werden nicht aufgeführt. •Stoppt beim letzten: Aktivieren Sie dieses Kontrollkästchen, wenn das Wort nicht am Ende einer Benennung vorkommen darf. Ausdrücke, die mit diesem Wort enden, werden nicht aufgeführt. Wenn Sie ein Stoppwort aus der Liste entfernen möchten, markieren Sie die Zeile, und klicken Sie unterhalb der Liste auf den Link Auswahl löschen.
|
Navigation
Klicken Sie auf OK, um die Terminologieextraktion zu starten. Am Ende des Prozesses wird in memoQ die Liste der Kandidaten auf der Registerkarte des Kandidatenlisten-Editors angezeigt.
Klicken Sie auf Abbrechen, um das Dialogfeld zu schließen, ohne Begriffe zu extrahieren.
|