ステミング とは
「ステミング」ということばを聞いたことはあるでしょうか。ビジネスマン、とくにIT業界で働いている人には身近なことばかも知れません。これはWebマーケティングの分野の用語であり、検索エンジンのアルゴリズムで、語形が変化する単語の語幹でマッチングを行うことを意味します。例えば、英語では複数形、過去形、現在進行形などで語尾が変化します。「moves」「moved」「moving」などという形で変化しますが、検索エンジンではステミングという機能によって「move」という語幹によって検索し、マッチングが行われます。これはあいまい検索とも言われますが、このような機能を実装することによって、検索時により広い情報を得ることができるのです。
ステミング のお役立ち情報
「ステミング」という機能は、語形の変化を無視して語幹によってマッチングするものですが、この機能にはどのような意味があるのでしょうか。例えば記憶のあいまいな単語を英語で検索するとき、語形の変化を厳密な形のままでマッチングされると、語形のわずかな変化だけで知りたかった情報が得られない、ということになってしまいます。厳密なマッチングも時には重要ですが、このような場合には逆に不便なものとなってしまいます。そこで実装されるのが「ステミング」というアルゴリズムです。この機能の導入によって、語形の変化は無視されてマッチングされるため、正確な単語の形を記憶していなくても知りたい情報を得ることができるようになるのです。