mroongaのカテゴリを追加しました。
MySQLの全文検索プラグイン「mroonga」の記事が増えてきました。
なのでmysql-mroonga
というカテゴリを追加し、一覧性を良くしました。
サイドバーのカテゴリ一覧からも辿れますし、以下URLからも参照できます。
http://y-ken.hatenablog.com/archive/category/mysql-mroonga
groonga/mroongaの文字列正規化機能 (normalizer) の挙動を追ってみる
groonga/mroongaが標準で備える文字列正規化機能(ノーマライザ・normalizer)として、
いわゆるgroonga独自のnormalizer(NormalizerAuto)と呼ばれるもがあります。
これは、大文字・小文字だけでなく、全角・半角を同一視できるという
UnicodeのNFKCを用いた機能です。
とても便利な正規化機能なのですが、この文字列の正規化方法は
MySQLで利用されているCOLLATION(照合順序)とは異なる動作です。
利用シーンによっては、MySQLでの作法に合わせた方が都合が良い場合があります。
そこで、groonga-normalizer-mysql
というパッケージの出番です。
本記事では、それら正規化機能の挙動の違いを追いかけてみたいと思います。
続きを読む