エンジン

エンジンはコーパスからトレーニングされ、テキストを翻訳するために使用されます。それらは一方向性であり、すなわち1つのソース言語と1つのターゲット言語を持ちます。

エンジンの種類

  • カスタム

    • ドメイン適応型、AIブースト

    • Stock+

  • ストック

カスタムエンジン

globalese by memoQでトレーニングされたすべてのエンジンはカスタムエンジンです。ただし、それらを作成するために使用されるリソースの組み合わせによって、カスタマイズの度合いが異なります。

ドメイン適応エンジン

ドメイン適応エンジンは、マスターコーパスと補助/ストックコーパスの両方を含み、globalese by memoQの独自の自動ドメイン適応技術を用いてトレーニングされたエンジンです。重要なドメイン内TMを「マスター」トレーニングデータとして選択することにより、エンジンはそれらのTMのスタイルと用語に焦点を当てます。ドメイン内データの量が十分でない場合は、エンジンを拡張するために一般的なストックデータを追加することを選択できます。独自の補助データを追加するオプションもあります。

AIブーストエンジン

AIブーストエンジンをトレーニングするオプションは、globalese by memoQ V5から利用可能です。これらのエンジンは、ドメイン適応エンジンの用語とスタイルの正確さを、大規模言語モデルの言語能力と組み合わせています。globalese by memoQ V5では、AIブーストエンジンは現在OpenAIのGPTモデルを使用しています。AIブーストオプションは現在、ドメイン適応エンジンでのみ利用可能です。AIブーストエンジンは、特に動的なキーワードリストをサポートしている場合に、ほとんどの場合で最良の結果を提供します。

MS AzureのGPTモデルは、現在ベータサービスとして提供されていることにご注意ください。AIブーストエンジンは、クラウドテキスト翻訳シナリオでのみ使用できます。

使用例

ドメイン適応エンジンの典型的な使用例は、特定の用語やスタイルを遵守することが重要な場合です。例としては、製品ドキュメンテーション、エンドユーザーマニュアル、またはソフトウェアドキュメンテーションなどで、適切な用語やスタイルを一貫して使用することが不可欠なものです。

必須のトレーニングデータ

以下の表は、最小および推奨セグメント数を示しています。

ストックコーパスを含めるか?

最小ボリューム(セグメント)

推奨ボリューム(セグメント)

はい

15,000マスター

100,000以上のマスター

いいえ

15,000 マスター
200,000 合計

100,000以上のマスター
1,000,000以上の合計

一般的なトレーニング時間

ドメイン適応エンジンの一般的なトレーニング時間は10時間から28時間の間です。

Stock+ エンジン

Stock+エンジンはカスタマイズされたストックエンジン、すなわち、事前にトレーニングされたストックエンジンを自身のマスターデータで拡張してトレーニングしたエンジンです。選択したマスターデータはエンジンの一部となります。マスターコーパスに新しいコンテンツがある場合、エンジンはそれを学習します。ただし、追加されたマスターデータに基づいて、エンジンの用語やスタイルの設定が変更されることはありません。

使用例

stock+エンジンの一般的なな使用例は、大規模なデータセットでトレーニングされた汎用エンジンを使用することが重要でありながら、自分自身のトレーニングデータも組み込んでいる場合です。独自のトレーニングデータのサイズがドメイン適応エンジンのトレーニングに十分でない場合にも、このオプションを使用できます。例としては、年次レポート、ユーザー生成コンテンツ、ウェブページ。

必須のトレーニングデータ

最小で1,000セグメント、最大で1,000,000セグメント。

一般的なトレーニング時間

stock+エンジンの典型的なトレーニング時間は10分から4時間の間です。

ストックエンジン

特定の言語コンビネーションでは、事前にトレーニングされたストックエンジンを使用することもできます。