HTMLドキュメント

ほとんどのWebページはHTMLドキュメントです。HTMLはHypertext Markup Languageの略です。<title>Document Import Settings</title>のように要素をコード化する最初の主流のマークアップ標準でした。

memoQでは、スクリプトを含むHTMLドキュメントや、本トピック作成時に知られているHTMLのすべてのバージョンをインポートできます。memoQはHTML 5フォーマットもサポートしています。

memoQはPHPもサポートします:このHTMLフィルタを使用して、PHPスクリプトまたはPHPスクリプトを含むページを翻訳します。

  1. HTMLドキュメントのインポートを開始します。
  2. 文書のインポートオプションウィンドウでHTMLドキュメントを選択し、フィルタと構成を変更をクリックします。
  3. 文書のインポート設定ウィンドウが表示されます。フィルタドロップダウンリストからHTMLフィルタを選択します。

    html_filter

文書の一部をインポートする方法をmemoQに指示する

インポートの種類の選択で、インラインタグをマークアップとしてインポートをクリックします。

HTMLドキュメントの特定の部分のインポート方法を制御するさまざまな設定があります。

  • ドロップダウンリストの内容を無視:HTMLコード内のドロップダウンリストのコンテンツを除外するには、これをオンにします。通常、memoQはこれらをインポートします。通常は翻訳する必要があります。しかし、場合によっては、ドロップダウンリストの値を必要とするプログラムコードがあり、翻訳するとなくなる場合があります。
  • 改行しないスペースをエンティティとしてインポート:通常、memoQはノーブレークスペースをインラインタグとしてインポートします。通常の文字として表示する場合は、このチェックボックスをオフにします。ただし、通常の文字としてインポートすると、エンティティではなく文字としてエクスポートされます。(ノーブレークスペースはHTML形式で&nbsp;です)。
  • 空の <img/> と <br/> タグを適用(&E):memoQではでは、旧形式の<img>タグと<br>タグは空のタグとして認識されます。最近のHTMLでは、これらを<img/><br/>として記述します。このチェックボックスをオフにしないでください。
  • <br/> タグをインラインタグとして処理:通常、memoQはインラインタグとして<br/>タグをインポートします。それにより新しいセグメントを始めません。<br/>があるときにmemoQで新しいセグメントを開始する場合は、このチェックボックスをオフにします。
  • アクセスキーをインポート:通常、memoQは翻訳用のアクセスキーをインポートします。アクセスキーは、フォーム内のフィールドまたはボタンに読者が切り替えるのに役立つ、フォーム内のキーボードショートカットです。翻訳しない場合は、このチェックボックスをオフにします。
  • HTMLエンティティを文字としてインポート:通常、memoQはHTML文字エンティティを通常の文字としてインポートします。これにより、テキストが読みやすくなります。これらのエンティティをインラインタグとしてインポートするには (精度を上げるため)、このチェックボックスをオフにします。
  • エクスポート時にHTMLエンティティを常に使用:通常、memoQはすべての文字を文字としてエクスポートします。エンティティからインポートされた文字、またはターゲットエンコーディングから欠落している文字を除く:これらもエンティティとしてエクスポートされます。このチェックボックスをオンにすると、memoQはHTMLエンティティを持つすべての文字をエンティティとしてエクスポートします。
  • 改行文字でセグメントを区切る:HTMLファイルを読みやすくするために、余分な改行使われることがあります。これらの改行を別々のセグメントにインポートし、翻訳後のドキュメントに保持するには、チェックボックスをオンのままにします。これらの改行 (memoQおよび翻訳されたドキュメントの両方) を除外するには、このチェックボックスをオフにします。
  • 処理手順をインラインタグとしてインポート:通常、memoQは解釈されない'<$'で始まる処理命令を1.タグでインポートします。インラインタグとしてインポートするには:このチェックボックスをオンにします。そして、memoQはそれらをmq:pi (処理命令) 型のインラインタグとしてインポートします。
インポートしたファイルとエクスポートしたファイルのエンコーディングを設定する

通常、HTMLドキュメントは、そのエンコーディングを指定します。これはコードページとも呼ばれます。

ほとんどの場合、HTMLドキュメントはUnicode (Unicode形式の1つ) でエンコードされるため、ここで設定を変更する必要はありません。

しかし、memoQがHTMLドキュメントのコードページを認識できない場合、インポートされたテキストは読み取り不能になります。

この場合、ソースドキュメントのエンコーディングを選択する必要があります。指定されていない場合にコードページをインポートドロップダウンから選択します。

エンコーディングがファイルに含まれてなく、文字化けを起こす場合:指定されていない場合にコードページをインポートドロップダウンからエンコーディングを選択し、ファイル内に異なる宣言がある場合にもこのコードページを使用チェックボックスをオンにします。

ソースエンコーディングがUnicodeでなく、ターゲット言語が別のスクリプトを使用している場合:翻訳ドキュメントのエンコーディングをエクスポート用コードページドロップダウンから選択します。

HTMLドキュメントの一部を除外する

文書内の一部が翻訳を必要としない場合は、入力から除外できます。

文書のインポート設定ウィンドウの下部に要素を一覧表示できます。

除外する要素を一覧表示するには、除外するタグのリストを編集をクリックします。除外するタグのリストを編集ウィンドウが表示されます。

editlistofexcludedtags

リストに要素を追加するには:下部のテキストボックスに、開始タグの名前を入力します。たとえば、<title>...</title>要素をスキップする場合は、そこにtitleと入力します。プラス記号をクリックします。

要素の名前がリストに表示されます。

リストが終了したら、OKをクリックします。文書のインポート設定ウィンドウに戻ります。

リストから要素を削除するには:要素の名前をクリックします。下部のマイナス記号をクリックします。

マークアップをmemoQ {タグ} としてインポートしない:memoQには、インラインタグが導入される前に作成された古いHTMLフィルタがあります。このフィルタは互換性のためだけに用意されています。新しいプロジェクトでは使用しないでください。memoQ {タグ} をマークアップとしてインポートはクリックしないでください。

HTMLドキュメント内のPHPスクリプト内のテキストをインポートまたは無視する

PHPはPHP HyperText Preprocessorの略です。インタラクティブなWebサイトを作成するための強力なプログラミング環境です。PHPコードは通常、Webサーバー上のPHPファイルに記述されます。

しかし、PHPスクリプトはHTML文書でも使用できます。これらのスクリプトはサーバーによって処理されます。処理が行われると、WebサーバーはそれらをHTMLテキストに置き換えてから、リーダーのWebブラウザに送信します。

重要なのは、HTMLドキュメントに表示されるPHPスクリプトには、翻訳が必要なテキストを含めることができるということです。HTMLドキュメント内では次のようになります:

html_filter_php-example

(ソース: The PHP manual)

通常、memoQはこれらのPHPスクリプトからテキストをインポートしません。これらを翻訳する場合は、PHP 構成タブの設定を使用します:

html_filter_php

PHPスクリプトからテキストをインポートするには:PHP スクリプトから文字列をインポートチェックボックスをオンにします。

スクリプト内のテキストにHTMLマークアップが含まれている場合は:PHPストリングをHTMLとして解釈チェックボックスをオンにします。通常、memoQはそれを行いませんが、HTMLタグがそこにあると想定するのには十分な理由があります。

memoQは、PHPコマンド (関数と呼ばれる) で引数として使用されるテキストをインポートします。これは、memoQがこれをインポートすることを意味します。

html_filter_php-example

memoQはこれもインポートします:

html_filter_php-example2

(ソース: The PHP manual)

PHP 関数から文字列をインポートチェックボックスをオフにすると、memoQは2番目の例のみをインポートします。

[PHP関数から文字列をインポート] チェックボックスがオンになっている場合は:さらにコマンド (関数) をリストに追加できます。下部のテキストボックスに関数の名前を入力します。プラス記号をクリックします。

HTML 5の「翻訳対象」属性とドキュメントの言語

HTML 5ドキュメントをインポートすると、memoQはtranslate属性を認識します。翻訳対象または翻訳不要な要素をマークします。

  • 翻訳属性が“yes”の場合:memoQは、要素を翻訳対象としてインポートします。要素は、ビルトインフィルタ構成で翻訳不要とマークされている場合でもインポートされます。これは、フィルタ構成によって翻訳不要 (除外された) と定義されていることを意味します。あるいは、翻訳不要要素の子です。
  • 翻訳属性が“no”の場合:memoQはその要素をインポートしません。フィルタ構成で翻訳対象としてマークされている場合でも、要素は除外されます。

    HTML要素にも言語があります:HTML要素は'lang'属性を持つことができます。これはコンテンツの言語を指定します。memoQはlang属性をサポートしています。ドキュメントをエクスポートすると、memoQはlang属性をターゲット言語に変更します。これは、実際に翻訳のためにインポートされ要素に対して有効です。memoQは、プロジェクトのソース言語と一致しない場合、言語コードを変更しません。例えば、文書の一部が英語以外の文書で日本語としてマークされている場合、memoQはそれが意図的であると考えます。言語を一致する場合、memoQではサブ言語が無視され、英語English-USは相互一致します。