データマイニングという言葉をご存知でしょうか。
「ビックデータ元年」と言われている2012年から、ビックデータと共によく聞かれるようになりました。
なぜ、いきなりこれらの言葉が聞かれるようになったかというと、ICT技術の進歩によるネットワークやバーコードの発達、そしてハードディスクやメモリの発達により、データ一個あたりの収集コストが桁外れに小さくなりました。さらに、情報を保存しておく機器の進化、インターネットの一般化が大きく関係しています。たとえば一社のスーパーマーケットチェーン店に蓄積されるバーコードデータは100万件以上にも昇ります。また、一人一台スマートフォンとパソコンを持つのが普通の時代になり、ネットワークサーバに貯まるログなどは、天文学的な量の情報が収集保存されています。
それらの膨大な量の情報をビックデータと呼びます。データマイニング 【 Data Mining 】を直訳すると、Data【情報】をMining【採鉱】となります。ビックデータという情報の炭鉱から、有用なデータを掘り当てるという事を意味しています。
最近よく耳にするデータマイニングですが、その歴史は意外に長く、何度かブームを起こしております。コンピュータを用いての、データの収集や解析をすることは、1960年代には既に行われつつありました。そして、1990年代半ばから2000年代初めにかけて一度、データマイニングという言葉と概念が大衆に広まりました。そのブームの火種となった、有名な事例に「おむつとビール」というストーリーがあります。
「ある大手スーパーマーケット・チェーンでPOSデータを分析したところ、顧客はおむつとビールを一緒に買う傾向があることが分かりました。ターゲットが大人の男性と主婦という、一見関係の薄そうな両商品ですが、調査の結果、子供のいる家庭では母親はかさばる紙おむつを買うように父親に頼み、頼まれた父親はオムツを買うついでに缶ビールも購入していた。この法則性に気付いた店長は、おむつとビールを並べて陳列したところ、売り上げが上がった。」
というものです。
というように、データマイニングというのは「いっけん意味のないような大量に蓄積されたデータを解析して、その中に潜むデータ間の相関関係や法則性などを探し出す技術」の事です。現在そのデータマイニングの必要性や可能性が見直され、再度注目されてきております。
コメントする