正規表現
正規表現は、テキスト内の文字シーケンスを検索するための強力な手段です。memoQでは、セグメンテーションルール、自動翻訳ルール、または正規表現タグ化ツールのルールを定義するために使用されます。正規表現は、検索と置換や、翻訳エディタのフィルタフィールドでも使用できます。
文字列の検索は、ワードプロセッサやテキストエディタを使用していたユーザーにとっては良く知られているタスクです。検索または検索ダイアログで、もし「cat」を検索すると、「cat」、「cats」、「sophisticated」などの単語 (または単語の一部) が強調表示されます。
正規表現を使用すると、検索する単語をより自由に指定することができます。2、3文字の「c」の後に続く文字「a」、1桁以上の複数の数字を含む、または「cat」、「dog」や「mouse」のいずれかの単語を含むなど、特定のシーケンスを識別できます。さらには引用符の間にある単語の出現などのシーケンスを識別できます。このページを参照し、例を試すことで、正規表現について理解を深めることができるはずです。詳細を学習する準備ができていない場合は、正規表現アシスタントがお手伝いします。
注意:正規表現は、パターンマッチング法の基礎となっている数学的理論に由来しています。regexpやregexなどの省略系で表示されることが多いですが、ここでは、正規表現を使用します。
正規表現の構文には多くのバリエーション (フレーバー) があります:memoQは.NET正規表現エンジンを使用するため、.NETフレーバーが使用されます。この記事では、.NET regex構文の一部のみを説明します。詳細なドキュメントについては、Microsoft Learn Webサイトの関連部分を参照してください。
標準の.NET正規表現機能
memoQでの拡張
シーケンス |
説明 |
---|---|
インラインまたはmemoQタグ |
|
\itag |
インラインタグ |
\mtag |
memoQタグ |