【概要】
FUGOで、誤記のチェック機能で検出する単語を新たに登録する方法などについてまとめました。独自にNGワードを追加して、検出したい場合のご参考になればと思います。
この記事では、以下の機能について解説します。
また、最後にFUGO zip版をお使いの方へのTipsを記載しております。
【はじめに】
FUGOには、ユーザーの方が自由に追加できるチェックの種類としては、(単純な)「誤記」と「表記のゆらぎ」の2種類があります。どちらも、対応する辞書ファイル(テキストファイル)に単語を追加することで利用可能です。
具体的には、誤記の場合「typo.txt」、表記のゆらぎの場合「mix.txt」に、チェックしたい単語を所定のルールに従って登録します。
なお、これらの辞書ファイルは、FUGOの「設定」→「誤記(日本語)」または「表記のゆらぎ(日本語)」の画面にある「編集」ボタンをクリックすると、メモ帳で開けます。なお、編集後は、上書き保存して下さい。
なお、これらの辞書ファイルは、FUGOの「設定」→「誤記(日本語)」または「表記のゆらぎ(日本語)」の画面にある「編集」ボタンをクリックすると、メモ帳で開けます。なお、編集後は、上書き保存して下さい。
「誤記」とみなす単語を追加する
単にNGワードを登録する場合は、ルールは、
- 誤記/NGワードとして検出したい単語を、一行に1つ記入
となります。
また、以下のような特殊な記入をすることで、FUGOの振る舞いを変更可能です。
- 先頭に「●」を記入すると、チェック結果は赤色で表示されます
- 先頭に「▲」を記入すると、チェック結果は青色で表示されます
- 半角「#」または「//」(半角スラッシュ2つ)で始まる行は無視されます。コメントやメモの記入にお使いください。
例えば、「されいる」を誤記として検出したい場合、下図のように「されいる」と記入して下さい。
なお、単語の前後の空白は無視されます。
辞書ファイルの記載例 (標準添付のtypo.txt) 分かりやすくするため、コメント扱いの行を緑色で表示しています。 また、改行位置に「↓」を表示しています。 |
正規表現を使って「誤記」とみなす単語を追加する
誤記の辞書ファイルへの記載には、正規表現(*)を使用することができます。
これにより、より複雑な条件で誤記(NGワード)を登録することが可能です。
(*) 複数の単語を一つの文字で表現する方法の一つです。Wordの検索機能で利用できる「ワイルドカード」と似たようなものと思って頂ければ間違いありません。なお、記法は異なりますのでご注意ください。(「正規表現」の機能を大幅に削って、文書作成に特化したものが「Wordのワイルドカード」と思って頂ければ、おおよそ間違いありません。)
FUGOで利用可能な正規表現の記法は、以下の記事をご参照ください。
正規表現を用いた単語の記載例を以下に示します。
- 半角のアルファベットのみからなる単語を検出したい場合
- [a-zA-Z]+
- (解説) aからzまでの半角文字もしくはAからZまでの半角文字のいずれかが1文字以上続く(+)
- 半角のブランク(空白)を検出したい場合
- [ ]+
- (解説) 空白のみの場合、無視されるため(typo.txtの記載に関する例外ルール)
- 全角のブランク(空白)を検出したい場合
- [ ]+
- (解説) 同上
- 読点(。)以後の空白を検出したい場合
- 。[ ]+\r?\n
- (解説) 読点の後ろに、半角または全角の空白が1文字以上続いて後、改行
記載例 |
なお、正規表現について詳しくは、下記Web記事や、専門の書籍などをご参照ください。
「表記のゆらぎ」とみなす単語を追加する
誤記(NGワード)の登録と基本的なルールは同じです。
明細書中に同時に存在する場合に、ゆらぎとみなしたい2つ以上の単語を一行に記入してください。
単語間の区切りは、タブ、半角空白を用いることができます。
なお、正規表現は利用できません。
記入例を以下に示します。
標準添付のmix.txt (一部改変) |
カタカナ用語のゆらぎの自動検出機能
なお、FUGOの「設定」→「表記のゆらぎ(日本語)」において、「」のチェックをONにすることで、カタカナ用語のゆらぎについてはある程度、自動検出できます。
自動検出の設定箇所 |
ただ、化学系の明細書では誤判定が多いなどまだ完成度が必ずしも高くないため、適宜チェック結果を見てON/OFFを決めて頂ければと思います。
FUGO zip版をお使いの方
zipファイルに同梱のtypo.txt、mix.txtはそのままではFUGOから利用されません。
必要に応じて、内容を、設定の「編集」ボタンで開く空のテキストファイルに転記してください。
(typo.txt、mix.txtを、設定ファイルのフォルダにそのままコピーしてもOKです。)