形態素解析をお手軽に!
「形態素解析」?あまり聞きなれない言葉だとおもいます。
非常に簡単にいえば、
「ある文章をコンピュータをつかって品詞分解すること」
ということができでしょうか。
よりよい表現をご存知の方がいらっしゃいましたらご教授ください。
より詳しい説明をご覧になりたいかたは、「形態素解析」(wikipedia)を参照してください。
ウェブサイトやブログに掲載されている文章は、コンピュータが理解することができません。
「形態素解析」は、コンピュータが文章を理解するためのひとつの手段として利用することができます。
まず、「形態素解析」により、文章を意味のある最小単位(品詞)に分解します。
次に、分解された品詞の出現順序や出現頻度などをコンピュータで調べて、その結果から文章の意味を推測しよういうことです。
ウェブ上には莫大な情報が提供されています。その莫大な情報の中から、必要な情報を集めたり、整理するためにコンピュータを助けを借りることができたらすばらしいと思います。
そこで、簡単に「形態素解析」するためのツールがないかなぁとおもい、検索してみました。
ありました(笑)。
ひとつは、ウェブサービスとして提供されている「MECAPI」です。かなり、難解な文章もきちんと解析してくれます。
ひとつは、「JavaScript で形態素解析もどき」です。こちらは、文書から品詞(じゃないときもある)を正規表現によって切り出すというものです。非常に簡単な仕掛けです。しかし、得られた解析結果をうまく利用すれば、文章の内容を推測することができそうな気がします。
ほかにも、「形態素解析」が簡単にできるツールをご存知の方がいらっしゃいましたら、ご教授ください。
よろしくお願いします。
(感想)
ウェブ上には、ほんとになんでもありますねぇ。
これらを利用すると、簡単に自分だけの情報収集エンジンが開発できそうな気になってしまいます。
実は、すこし手をつけてはいるのですが、今回の「形態素解析」ができるウェブサービス、
JavaScriptの発見は、いろいろな意味で開発を後押ししてくれると思います。
なんとか形にして公開できればと思います。