翻訳メモリとライブ文書資料からのマッチ率

memoQが翻訳メモリライブ文書資料からセグメントを探すと、まったく同じテキストが見つけるだけでなく、少し (あるいはまったく) 異なるセグメントが見つけることもあり、テキストだけでなくコンテキストも同じセグメントを見つけることもあります。

翻訳メモリから一致を使用する場合、同じテキストまたはわずかに異なるテキストの以前の翻訳を再利用します。ほとんどの場合、以前の翻訳を見て、現在のソーステキストに合うように修正する必要があります。理論的には、一致する部分ソーステキストに近いほど作業量は少なくて済みます。

これが、memoQが各翻訳メモリマッチにスコアを与える理由です。スコアは50%~102%のパーセント値です。このトピックでは、さまざまなタイプのマッチ率を要約し、各一致タイプの意味を説明します。

完全一致 (100%)

セグメントテキスト内のソーステキストは、翻訳メモリからの一致と完全に同じです。セグメントのコンテキストが一致していません。または、何もわかっていません。

ほぼ完全一致 (95%-99%)

セグメントのソーステキストは完全一致と同じですが、数字、タグ、句読点、およびスペースが異なるなど、若干の違いがあります。前翻訳では、これが良好一致になります (デフォルトでは、これは設定可能です)。

ファジーマッチ (50%-94%)

ソーステキストは一致するソーステキストに似ていますが、テキストに違いがあります。必要な編集の観点から、ファジーマッチは3つのクラスに分けられます。これらは、memoQが翻訳メモリを使ってテキストを分析し、統計を生成するときに別々にリストされます。

  • 高ファジー (85%-95%):平均的な長さまたは長いセグメント (8~10ワード以上) では、通常1ワードの違いがあります。
  • 中ファジー(75%-84%):平均的な長さまたは長いセグメント (8~10ワード以上) では、通常2ワードの違いがあります。
  • 低ファジー (50%-74%):平均的な長さまたは長いセグメント (8~10ワード以上) では、通常2ワード以上の違いがあります。前翻訳で、「すべての一致」はすべての種類のファジーマッチが組み合わされ、50%から開始されます (デフォルトでは、これも設定可能です)。

注意:セグメントのテキストが平均よりも短い場合、マッチ率の数値と実際のテキストの違いが上記のように明確に対応しないことがあります。

コンテキスト付き完全一致またはコンテキストマッチ (101%)

セグメントテキスト内のソーステキストは、翻訳メモリからの一致と完全に同じです。さらに、ソーステキストのコンテキストも翻訳メモリに保存されたコンテキストと同じです。

  • ランニングテキストでは、コンテキストは前のセグメントと次のセグメントのソーステキストです。
  • 構造化文書 (XMLなど) または表形式文書 (Excel、CSVなど) では、コンテキストは識別子ラベル (ID) です。

二重コンテキストマッチ (102%またはXLT)

セグメントテキスト内のソーステキストは、翻訳メモリからの一致と完全に同じです。さらに、文書と翻訳メモリの両方に両方の種類のコンテキスト (前後のセグメントおよびID) があり、それらも同じです。

コンテキストマッチと二重コンテキストマッチは、文書またはその少なくとも一部が元の文書とまったく同じ場合に、まったく同じ翻訳を再構築するために使用できます。

100%、101%、または102%の一致がありますが、数字の前にアスタリスクが付いています。なぜですか?

翻訳エディタでは、各行の状況セルに、最後に挿入された一致のマッチ率が表示されます。「*100%」、「*101%」、または「*102%」のように表示される場合は、同じセグメントに対して複数の完全一致、コンテキスト一致、または二重コンテキストマッチがあり、そのうちの1つが挿入されていることを意味します。挿入されたものが最良であったという保証はないので、翻訳者はこのセグメントを見る必要があります。

マッチ率が違うのはなぜですか?

memoQでは、テキストが提案するものとは異なるマッチ率が表示されることがあります。一方で、memoQはテキストそのものだけでなく、マッチしたソースも考慮しています。一方、memoQは、特別な場合にマッチした翻訳を修正することができます。

  • ペナルティ:一致にペナルティがある場合、memoQは低いマッチ率を使用します。翻訳メモリライブ文書の設定でペナルティが設定されています。ここでは、memoQがペナルティを適用する可能性のある、最も頻度の高いケースをご紹介します:
    • この一致は、信頼性が低いことがわかっている特定のTMからのものです。
    • この一致は、信頼性が低いと思われる特定のユーザー(翻訳者)からのものです。
    • この一致は、もともと2つのドキュメントの整合に由来するもので、整合リンクが完全にレビューされたかどうかは定かではありません。
    • ライブ文書資料が完全にレビューされてことが確定されていません。
    • この一致は、ライブ文書資料の文書または文書ペアで、文書の整合が完全に確定されていないものです。
  • 自動調整:memoQは可能な限り数字を置き換えますので、元々違う数字だったものがmemoQによって修正され、翻訳ではすでに正しい数字が表示されているというような、ほぼ完全に一致したものを受け取ることがあります。
  • パッチング:セグメントの翻訳では、memoQはタグを調整し、可能な場合は用語ベースの一致テキストも調整します。このような場合、memoQはセグメントのマッチ率を高め、主にファジーマッチで提案されたカテゴリーにマッチするようになります。この方法でマッチが強化されると、パーセント値の前に感嘆符 (!) が付きます。