HTMLドキュメント
ほとんどのWebページはHTMLドキュメントです。HTMLはHypertext Markup Languageの略です。<title>Document Import Settings</title>のように要素をコード化する最初の主流のマークアップ標準でした。
memoQでは、スクリプトを含むHTMLドキュメントや、本トピック作成時に知られているHTMLのすべてのバージョンをインポートできます。memoQはHTML 5フォーマットもサポートしています。
memoQはPHPもサポートします:このHTMLフィルタを使用して、PHPスクリプトまたはPHPスクリプトを含むページを翻訳します。
操作手順
- HTMLドキュメントのインポートを開始します。
- 文書のインポートオプションウィンドウでHTMLドキュメントを選択し、フィルタと構成を変更をクリックします。
- 文書のインポート設定ウィンドウが表示されます。フィルタドロップダウンリストからHTMLフィルタを選択します。
その他のオプション
インポートの種類の選択で、インラインタグをマークアップとしてインポート(I)をクリックします。
HTMLドキュメントの特定の部分のインポート方法を制御するさまざまな設定があります。
- ドロップダウンリストの内容を無視(R):HTMLコード内のドロップダウンリストのコンテンツを除外するには、これをオンにします。通常、memoQはこれらをインポートします。通常は翻訳する必要があります。しかし、場合によっては、ドロップダウンリストの値を必要とするプログラムコードがあり、翻訳するとなくなる場合があります。
- 改行しないスペースをエンティティとしてインポート(N):通常、memoQはノーブレークスペースをインラインタグとしてインポートします。通常の文字として表示する場合は、このチェックボックスをオフにします。ただし、通常の文字としてインポートすると、エンティティではなく文字としてエクスポートされます。(ノーブレークスペースはHTML形式で です)。
- Enforce empty <img/> and <br/> tags:memoQではでは、旧形式の<img>タグと<br>タグは空のタグとして認識されます。最近のHTMLでは、これらを<img/>と<br/>として記述します。このチェックボックスをオフにしないでください。
- <br/> タグをインラインタグとして処理:通常、memoQはインラインタグとして<br/>タグをインポートします。それにより新しいセグメントを始めません。<br/>があるときにmemoQで新しいセグメントを開始する場合は、このチェックボックスをオフにします。
- アクセスキーをインポート(K):通常、memoQは翻訳用のアクセスキーをインポートします。アクセスキーは、フォーム内のフィールドまたはボタンに読者が切り替えるのに役立つ、フォーム内のキーボードショートカットです。翻訳しない場合は、このチェックボックスをオフにします。
- HTMLエンティティを文字としてインポート(A):通常、memoQはHTML文字エンティティを通常の文字としてインポートします。これにより、テキストが読みやすくなります。これらのエンティティをインラインタグとしてインポートするには (精度を上げるため)、このチェックボックスをオフにします。
- エクスポート時にHTMLエンティティを常に使用(Y):通常、memoQはすべての文字を文字としてエクスポートします。エンティティからインポートされた文字、またはターゲットエンコーディングから欠落している文字を除く:これらもエンティティとしてエクスポートされます。このチェックボックスをオンにすると、memoQはHTMLエンティティを持つすべての文字をエンティティとしてエクスポートします。
- 改行文字でセグメントを区切る(S):HTMLファイルを読みやすくするために、余分な改行使われることがあります。これらの改行を別々のセグメントにインポートし、翻訳後のドキュメントに保持するには、チェックボックスをオンのままにします。これらの改行 (memoQおよび翻訳されたドキュメントの両方) を除外するには、このチェックボックスをオフにします。
- 処理手順をインラインタグとしてインポート(M):通常、memoQは解釈されない'<$'で始まる処理命令を{1}タグでインポートします。インラインタグとしてインポートするには:このチェックボックスをオンにします。そして、memoQはそれらをmq:pi (処理命令) 型のインラインタグとしてインポートします。
通常、HTMLドキュメントは、そのエンコーディングを指定します。これはコードページとも呼ばれます。
ほとんどの場合、HTMLドキュメントはUnicode (Unicode形式の1つ) でエンコードされるため、ここで設定を変更する必要はありません。
しかし、memoQがHTMLドキュメントのコードページを認識できない場合、インポートされたテキストは読み取り不能になります。
この場合、ソースドキュメントのエンコーディングを選択する必要があります。指定されていない場合にコードページをインポート(D)ドロップダウンから選択します。
エンコーディングがファイルに含まれてなく、文字化けを起こす場合:指定されていない場合にコードページをインポート(D)ドロップダウンからエンコーディングを選択し、ファイル内に異なる宣言がある場合にもこのコードページを使用(U)チェックボックスをオンにします。
ソースエンコーディングがUnicodeでなく、ターゲット言語が別のスクリプトを使用している場合:翻訳ドキュメントのエンコーディングをエクスポート用コードページ(X)ドロップダウンから選択します。
文書内の一部が翻訳を必要としない場合は、入力から除外できます。
文書のインポート設定ウィンドウの下部に要素を一覧表示できます。
除外する要素を一覧表示するには、除外するタグのリストを編集(L)をクリックします。除外するタグのリストを編集(L)ウィンドウが表示されます。
リストに要素を追加するには:下部のテキストボックスに、開始タグの名前を入力します。たとえば、<title>...</title>要素をスキップする場合は、そこにtitleと入力します。プラス記号をクリックします。
要素の名前がリストに表示されます。
リストが終了したら、OKをクリックします。文書のインポート設定ウィンドウに戻ります。
リストから要素を削除するには:要素の名前をクリックします。下部のマイナス記号をクリックします。
マークアップをmemoQ {タグ} としてインポートしない:memoQには、インラインタグが導入される前に作成された古いHTMLフィルタがあります。このフィルタは互換性のためだけに用意されています。新しいプロジェクトでは使用しないでください。memoQ {タグ} をマークアップとしてインポート(M)はクリックしないでください。
PHPはPHP HyperText Preprocessorの略です。インタラクティブなWebサイトを作成するための強力なプログラミング環境です。PHPコードは通常、Webサーバー上のPHPファイルに記述されます。
しかし、PHPスクリプトはHTML文書でも使用できます。これらのスクリプトはサーバーによって処理されます。処理が行われると、WebサーバーはそれらをHTMLテキストに置き換えてから、リーダーのWebブラウザに送信します。
重要なのは、HTMLドキュメントに表示されるPHPスクリプトには、翻訳が必要なテキストを含めることができるということです。HTMLドキュメント内では次のようになります:
(ソース: The PHP manual)
通常、memoQはこれらのPHPスクリプトからテキストをインポートしません。これらを翻訳する場合は、PHP 構成タブの設定を使用します:
PHPスクリプトからテキストをインポートするには:PHP スクリプトから文字列をインポート(S)チェックボックスをオンにします。
スクリプト内のテキストにHTMLマークアップが含まれている場合は:PHPストリングをHTMLとして解釈(H)チェックボックスをオンにします。通常、memoQはそれを行いませんが、HTMLタグがそこにあると想定するのには十分な理由があります。
memoQは、PHPコマンド (関数と呼ばれる) で引数として使用されるテキストをインポートします。これは、memoQがこれをインポートすることを意味します。
memoQはこれもインポートします:
(ソース: The PHP manual)
PHP 関数から文字列をインポート(F)チェックボックスをオフにすると、memoQは2番目の例のみをインポートします。
[PHP関数から文字列をインポート] チェックボックスがオンになっている場合は:さらにコマンド (関数) をリストに追加できます。下部のテキストボックスに関数の名前を入力します。プラス記号をクリックします。
HTML 5ドキュメントをインポートすると、memoQは翻訳属性を認識します。翻訳対象または翻訳不要な要素をマークします。
- 翻訳属性がはいの場合:memoQは、要素を翻訳対象としてインポートします。要素は、ビルトインフィルタ構成で翻訳不要とマークされている場合でもインポートされます。これは、フィルタ構成によって翻訳不要 (除外された) と定義されていることを意味します。あるいは、翻訳不要要素の子です。
- 翻訳属性がいいえの場合:memoQはその要素をインポートしません。フィルタ構成で翻訳対象としてマークされている場合でも、要素は除外されます。
HTML要素にも言語があります:HTML要素は'lang'属性を持つことができます。これはコンテンツの言語を指定します。memoQはlang属性をサポートしています。ドキュメントをエクスポートすると、memoQはlang属性をターゲット言語に変更します。これは、実際に翻訳のためにインポートされ要素に対して有効です。memoQは、プロジェクトのソース言語と一致しない場合、言語コードを変更しません。例えば、文書の一部が英語以外の文書で日本語としてマークされている場合、memoQはそれが意図的であると考えます。言語を一致する場合、memoQではサブ言語が無視され、英語とEnglish-USは相互一致します。
完了したら
設定を確定して文書のインポートオプションウィンドウに戻るには:OKをクリックします。
フィルタ構成を変更せず文書のインポートオプションにウィンドウに戻るには:キャンセルをクリックします。
重ねがけフィルタの場合は、チェーン内の別のフィルタの設定を変更できます。ウィンドウの上部にあるフィルタの名前をクリックします。
文書のインポートオプションウィンドウで:OKを再度クリックすると、ドキュメントのインポートが開始されます。