XML (eXtensible Markup Language) ファイル
XMLは、世界で最も用途の広いデータフォーマットです。XMLファイルには、テキスト、構造化データ、さらにはプログラムコードまで含めることができます。その最大の利点は、おそらくXMLファイルが人間にとってもマシンにとっても完全に読み取れることでしょう。
XMLフォーマットは、人間の心が書き留めると考えるあらゆるものをエンコードできる一種のマークアップを定義します。次のようなものはすべてXMLです:
多くの場合、XMLファイルにはテキストが含まれており、テキストを翻訳する必要があります。
よく知られたドキュメントタイプの多くは、XMLを偽装しています。HTMLはXMLです。Word文書、少なくともDOCXはXMLです。XLIFFファイルはXMLです。翻訳メモリの内容を保持するTMXファイルはXMLです。他にもたくさんありますが、これらはすべて異なるXMLの「フレーバー」です。ある種のXMLは、驚くべきことに、ドキュメントタイプと呼ばれます。
memoQはXMLの処理方法を知っています。しかし、取得した文書がよく知られたXML形式 (HTML、DOCX、XLIFFなど) である場合、memoQには通常、そのための特殊なフィルターがあります。さらに、memoQはそれらを開くと、専用のフィルターを見つけます。Word文書をインポートすると、memoQはXMLフィルターの使用を提案しません。memoQはXMLフィルタを使用してドキュメントの大部分を読み取るという事実にもかかわらず。
多くのオーサリングおよびデータベースシステムでは、コンテンツをXMLファイルに保存またはエクスポートします。memoQで翻訳する場合は、このXMLフィルタを使用してインポートします。
XMLは多言語形式もあり、その場合はマルチリンガル XML フィルタを使用します:複数の言語で同じテキストを含むXMLファイルがあります。これらのファイルをインポートするには、マルチリンガル XML フィルタを使用します。
XML構成は複雑であり、それらを保存する価値があります:memoQがすべてを正しくインポートする準備をするには数時間かかるかもしれません。この作業が完了したら、文書のインポート設定ウィンドウのフィルタ構成ドロップダウンボックスの横にある保存ボタンをクリックします。次回、同じソースからXMLファイルをインポートする必要がある場合は、同じフィルタ構成ドロップダウンボックスから保存済みの設定を選択できます。
操作手順
- XMLファイルのインポートを開始します。
- 文書のインポートオプションウィンドウでXMLファイルを選択し、フィルタと構成を変更をクリックします。
- 文書のインポート設定ウィンドウが表示されます。フィルタドロップダウンから、XML フィルタを選択します。
その他のオプション
XMLファイルを正しくインポートするには、多くの設定が必要です。このトピックでは、次の例を使用して説明します:
他のXML文書と同様に、翻訳が必要な「通常の」テキストがいくつか含まれており、その中には説明的または構造的な情報を主に保持する<doc>のようなタグが散在しています。タグは、値 (id="0527") を持つ属性を持つことができます。これらがmemoQでどのように解釈されるかを次のセクションで説明します。
完了したら
設定を確定して文書のインポートオプションウィンドウに戻るには:OKをクリックします。
フィルタ構成を変更せず文書のインポートオプションにウィンドウに戻るには:キャンセルをクリックします。
文書のインポートオプションウィンドウで:OKを再度クリックすると、ドキュメントのインポートが開始されます。
サンプル文書の結果
一部を翻訳すると、翻訳文書は次のようになります。
このスクリーンショットのポイントは以下の通りです:
- updInfo属性が翻訳対象外として設定されているため、テキストAug-04-2006(NOT TO BE TRANSLATED)がドキュメント内にありません。
-
テキストDiagram for illustration purposesは、個別のセグメントとして表示され、セグメント3のimgタグ内のalt="@2"は、翻訳対象の属性値が翻訳ドキュメントの2つ下のセグメントにあることを表しています。
注意:翻訳対象の属性は、文書のインポート中に収集および保存され、現在のコンテンツのブロックが終了する位置、つまり次の構造タグで翻訳ドキュメントに挿入されます。
- セグメント2で開始タグrefは、必須の属性「target」がない状態で、ターゲットセルに挿入されました。このため、memoQは警告を表示します。
- セグメント3のターゲットセルにプレースホルダタグimgがないため、memoQは警告を表示します。
- セグメント4でエンティティ'©right;'は'©'に変換されています。