Webマイニング、3つの分類。
櫻井茂明氏による分類が分かりやすくて良い。メモっておこう。
1. Web content mining
Webページを構成するデータを対象としたマイニング。
データとは具体的にはテキスト、レイアウト情報、サウンド、イメージ等。
ルール発見、表現抽出、トピック階層生成などのテーマがある。
2. Web structure mining
WebはWebページをノード、ハイパーリンクをリンクとしたグラフ構造として捉えることができる。
このグラフ構造を対象とし、有用な情報や知識を獲得することを目的としたマイニングである。
social network analysis(6 digreesとかスケールフリーネットワークとかのアレ)の成果が応用されたりするらしい。
3. Web usage mining
Web閲覧者の行動履歴を対象としたマイニング。
Webサーバのアクセスログや、クライアント(ブラウザ等)のログに対するマイニングや、
統計的に偏りなく抽出された人を対象にURL履歴の収集を行う「Web視聴率」など。
以下参照のこと。
あとで研究会の発表資料が図書館にないか探してみよう。
電子情報通信学会 第1回Webインテリジェンスとインタラクション研究会
http://www.dbsj.org/Japanese/Archives/dbjapan/auto/2005/msg00019.html