正規表現

正規表現は、テキスト内の文字シーケンスを検索するための強力な手段です。memoQでは、セグメンテーションルール自動翻訳ルール、または正規表現タグ化ツールのルールを定義するために使用されます。正規表現は、検索と置換や、翻訳エディタフィルタフィールドでも使用できます。

文字列の検索は、ワードプロセッサやテキストエディタを使用していたユーザーにとっては良く知られているタスクです。検索または検索ダイアログで、もし「cat」を検索すると、「cat」、「cats」、「sophisticated」などの単語 (または単語の一部) が強調表示されます。

正規表現を使用すると、検索する単語をより自由に指定することができます。2、3文字の「c」の後に続く文字「a」、1桁以上の複数の数字を含む、または「cat」、「dog」や「mouse」のいずれかの単語を含むなど、特定のシーケンスを識別できます。さらには引用符の間にある単語の出現などのシーケンスを識別できます。このページを参照し、例を試すことで、正規表現について理解を深めることができるはずです。詳細を学習する準備ができていない場合は、正規表現アシスタントがお手伝いします。

注意:正規表現は、パターンマッチング法の基礎となっている数学的理論に由来しています。regexpやregexなどの省略系で表示されることが多いですが、ここでは、正規表現を使用します。

正規表現の構文には多くのバリエーション (フレーバー) があります:memoQは.NET正規表現エンジンを使用するため、.NETフレーバーが使用されます。この記事では、.NET regex構文の一部のみを説明します。詳細なドキュメントについては、Microsoft Learn Webサイトの関連部分を参照してください。

標準の.NET正規表現機能

memoQでの拡張

シーケンス

説明

\tag

インラインまたはmemoQタグ

\itag

インラインタグ

\mtag

memoQタグ