cuttysark

データマイニングとは何か?

2009年07月01日

こんにちは、WEBメディア エヴァンジェリストの押切孝雄です。

「データマイニング」って言葉、聞いたことありますか?

たとえば、テレビの「視聴率」のように、数百世帯程度の視聴動向から、計算して出すものは
データマイニングではありません。

「データマイニング」は、すべてのデータから、法則性を導き出す手法です。

もし、全てのテレビがネットワークにつながっていて、
どのテレビがどの番組を映し出しているかがわかれば、データマイニングできますが、
現在は、サンプルとなる世帯が選ばれて、その世帯の視聴率ですので、
どうしても誤差が出るんですね。

つまり、データマイニングは、全体のデータを対象にしているので、
一部のデータから全体を類推するものではないのです。

インターネット時代以前は、統計が主流でした。
そもそも、大がかりなデータベースを構築すること自体が技術的にもコスト的にも難しかったんです。

現在は、インターネットがありますので、
誰でも簡単にデータマイニングが可能になりつつあります。

たとえば、グーグルに日々打ち込まれる検索の言葉(キーワード)は、
公開されていますので、その気になれば、グーグルのデータベースを活用して
データマイニングは可能なんです。

ちなみに「グーグル・マーケティング」の手法は、膨大なデータから、
有用な事実を見つけ出すデータマイニングの一手法なんです。

人気ブログランキングへ