Webマイニング、3つの分類。

櫻井茂明氏による分類が分かりやすくて良い。メモっておこう。


1. Web content mining
 Webページを構成するデータを対象としたマイニング。
 データとは具体的にはテキスト、レイアウト情報、サウンド、イメージ等。
 ルール発見、表現抽出、トピック階層生成などのテーマがある。


2. Web structure mining
 WebはWebページをノード、ハイパーリンクをリンクとしたグラフ構造として捉えることができる。
 このグラフ構造を対象とし、有用な情報や知識を獲得することを目的としたマイニングである。
 social network analysis(6 digreesとかスケールフリーネットワークとかのアレ)の成果が応用されたりするらしい。


3. Web usage mining
 Web閲覧者の行動履歴を対象としたマイニング。
 Webサーバのアクセスログや、クライアント(ブラウザ等)のログに対するマイニングや、
 統計的に偏りなく抽出された人を対象にURL履歴の収集を行う「Web視聴率」など。


以下参照のこと。
あとで研究会の発表資料が図書館にないか探してみよう。


電子情報通信学会 第1回Webインテリジェンスとインタラクション研究会
http://www.dbsj.org/Japanese/Archives/dbjapan/auto/2005/msg00019.html