キーワード抽出

自分が書いたテキストをもう一度見直すとき、必要なのは

  • 時間
  • タイトル
  • カテゴリタグ、あるいはキーワード

であると考えている。時系列とタイトルさえあれば見直すのには十分すぎるのではあるが、、、加えてカテゴリタグがあればあるテーマに沿った内容をいっぺんに抽出するとき非常に役に立つというのは経験的に正しそう。
問題は、カテゴリタグを付けるのが面倒くさいこと。加えて、長文であればキーワード抽出がカテゴリの候補を見つける手がかりが多く、データマイニングの手法が役立つのだろうが、メモは1000文字以下のものが多い。
そんなときもある程度キーワード抽出、カテゴリ候補を示してくれれば役に立ちそうではある。