VNEXTの会社紹介資料
2023/11/14
近年、ビジネスにおいて注目されている「データマイニング」ですが、聞いたことはあるけどイメージがわかないという方もいらっしゃるのでは
ないでしょうか?
データマイニングとは、収集された情報の中から傾向や関連性など「知識」を見出すための技術です。
本記事では、データマイニングの基礎知識からビジネスで注目される理由、データマイニングを実施するポイントなどを詳しく解説していきます。
目次
● データマイニングとは?▶︎ データマイニングで得られる知識▶︎ データサイエンスとの違い● データマイニングが注目される理由● データマイニングの手順と手法▶︎ データマイニングの手順▶︎ クラスター分析▶︎ マーケット・バスケット分析▶︎ ロジスティック回帰分析● データマイニングを実施する際のポイント● データマイニングの活用事例● まとめ |
|データマイニングとは?
データマイニング(Data mining)とは、大量のデータから、統計学やAIなどの分析手法を駆使して「知識」を見いだすための技術のことです。
データマイニングの「マイニング」は、日本語で「発掘」という意味です。
たとえば、大量のデータを鉱山とすると、この鉱山から「知識」という鉱物を発掘するイメージです。
元々はデータベースからの知識発見(Knowledge Discovery in Databases:KDD)と呼ばれていましたが、1996年にデータベースからの知識発見と
データマイニングという語を紐付けた形で定義が提案され、今では同意義で使われています。
コンピューターの高速化やストレージの大容量化、IoT技術などの発達により、リアルタイムで大量のデータを分析するケースが近年増加しています。
その際に、あわせてデータマイニングが行われることも増えているのです。
データマイニングの目的は、大量のデータを分析して知識を獲得し、未来予測に活用することです。
データマイニングは、売上予測や市場動向、ある事象の発生予測やデータの類似性から新たな仮説を立てるなど、膨大なデータをビジネスで活かすことに
役立っています。
|データマイニングで得られる知識
データマイニングを実施して得られる知識は「DIKWモデル」と呼ばれており、それぞれ以下のように分類されます。
■ データ(Data):画像、音声、数値などの収集されたすべての素材
■ 情報(Information):「データ」を整理・カテゴライズしたもの
■ 知識(Knowledge):「情報」を分析した結果得られた法則性やルール
■ 知恵(Wisdom):「知識」を利用して物事を判断する力
データを意味のある情報に変換し、そこから知識を引き出すところまでがデータマイニングの領域です。
知識を利用して、物事を正確に判断するのは扱う人のスキルに依存します。
|データサイエンスとの違い
データサイエンスもデータマイニングと同じく、大量のデータから知識を導き出すことを行いますが、対象としているプロセスの範囲が異なります。
<データサイエンスのプロセス>
- 課題の把握と仮説の立案
- データの取得・蓄積
- データの分析・可視化
- 分析をもとに得られた情報の活用
データサイエンスは、1〜4までを一気通貫することが求められますが、データマイニングは「3. データの分析・可視化」の部分を取り扱います。
つまり、データマイニングは上述の「DIKWモデル」でいう”知識発見”までが範囲となり、データサイエンスの一部となります。
|データマイニングが注目される理由
データマイニングが注目される背景として、以下の2つが挙げられます。
・IoT(モノのインターネット)技術の発展
・データ保管技術の進歩
近年はIoT技術により、さまざまなモノに通信機能が搭載され、それらのデータはインターネット経由で取得できる環境になっています。
また、データ保管技術の進歩により、企業は膨大なデータを収集し、ビッグデータとして保管ができるようになりました。
企業はこのビッグデータを活用することで、マーケティング活動の効率化や精度向上、企業経営や経営判断における重要なデータをデータマイニングから
抽出・蓄積できるなどの理由で注目されているのです。
たとえば、マーケティング分野では、企業市場において次の4Pを明確にすることが課題となっています。
・Product:どのようなサービスを提供するか
・Price:いくらでサービスを提供するか
・Place:どのような手段でサービスを提供するか
・Promotion:どのようにサービスの特徴や魅力魅力を伝えるか
この4Pを明確にするための手段の1つとして、企業はデータマイニングに注目しています。
|データマイニングの手順と手法
次は、データマイニングの手順と方法について解説していきます。
|データマイニングの手順
データマイニングを実施する際の一般的な流れは次のとおりです。
Step1:データマイニングで何を知りたいか、テーマや目的を決める
Step2:目的に沿ってデータ収集する
Step3:データを加工・整理し、分析しやすい形に整える
Step4:データのパターンや関連性などを分析する
Step5:分析結果から要因を特定し、効果検証を行う
続いて、データマイニングの代表的な3つの手法をご紹介します。
|クラスター分析
クラスター分析(クラスタリング)は、データの類似性を基にデータを分類する分析手法の1つです。
クラスターは「集団」や「グループ」を意味します。
クラスター分析は、特にマーケティングの領域で顧客セグメントの分類を行う際に使われます。
たとえば、店舗の来店客を年齢、来店した時間帯、客単価などで分類して分析することにより、今後アプローチすべき年齢層、キャンペーンを実施
すべき時間帯などの仮説を立てられます。
その際、クラスターとして分類した情報を、グラフや表などを使い視覚的に表現することで、仮説を立てるための議論をスムーズに進められます。
|マーケット・バスケット分析
マーケット・バスケット分析とは、ある商品と同時に購入される傾向が強い商品を分析する手法です。
同じ買い物カゴ(バスケット)に入る商品に焦点を当てる分析手法のため、このように呼ばれます。
マーケット・バスケット分析では、データ同士の関係性を分析するもので、ある商品を買った顧客が一見関係のなさそうな別の商品を買うという
関連性を見つけられます。
この手法は、コンビニのPOSデータの分析でよく使われます。また、AmazonやZOZOTOWNなどのECサイトで、レコメンド機能に応用をきかせる
ことができます。
マーケット・バスケット分析の結果を活用すれば「商品の配置を変えて、同時に買ってもらうことを狙う」といった施策の立案が可能になります。
|ロジスティック回帰分析
ロジスティック回帰分析は、発生確率を予測する手法です。
複数の要因(説明変数)を起点として、二択の結果(目的変数)が起こる結果を確率として算出します。
この場合の目的変数は、顧客がある商品を買うか、買わないかというように二択で表現できます。
主に、マーケティング施策に対する顧客の反応を改善するためなどに使います。
たとえば、小さな子供を持つ家族の購入履歴をとってみましょう。
「おにぎりの購入」 と「洗剤の購入」 の関係を見ると、おにぎりの購入が予測値に影響を与えてます。
類似している顧客と傾向は、購入履歴より以下のようになっています。
・顧客2と4:洗剤の購入と一緒におにぎりと子供服を購入
・顧客3と5:洗剤の購入と一緒にはおにぎりを購入しない
これらのデータから、たとえば次のような仮説が立てられます。
・顧客2と4:忙しく働きながら子育てをしている母親 or 父親
・顧客3と5:子育てをしながら料理をする時間もある母親 or 父親
ロジスティック回帰分析によって、ある性質も持つ顧客が何%の確率で商品を買うのかが分かり、その結果、それぞれの顧客に対するオファーは
違ったものを考える必要があることがわかります。
|データマイニングを実施する際のポイント
データマイニングは、マーケティング施策や自社の課題解決につながる分析手法ではあるものの、機械的に実施しただけでは必ずしも成果につながる
結果を導き出せるわけではありません。
収集したデータには誤ったデータも含まれており、より正確で一貫性のある分析を行うためにはデータクレンジングから効率的に進めることが重要です。
実際にデータマイニングを実施する際に押さえておきたいポイントをご紹介します。
|データ管理の場を整理する
データマイニングを行うために、まずはデータの収集が必要です。
元となるデータが多ければ多いほど、有益な情報を採掘できる可能性が高まります。
そのため、データマイニングを実施するにあたり、データウェアハウス(DWH)をはじめとしたデータを管理できる場を設けるのがよいでしょう。
DWHは、AIによる分析やデータマイニングができる形にデータを最適化した上で、大量のデータを保管することができます。
また、DWHの多くには、外部からの攻撃を防御するしくみやデータの暗号化などセキュリティを向上させる機能が備わっているため、データマイニングを
実施するためのデータ保管には必須といえるでしょう。
|データクレンジングを行う
データマイニングの精度をあげるためには、不要なデータを除去しておくことが重要です。
データマイニングで扱うデータには、欠損やノイズが残っている場合や、形式が整えられていないケースもあります。
データに不備がある場合、そのままでは処理できないため、適切な形にそろえるデータクレンジングが必要です。
データクレンジングは個々のデータを手作業で整形していく作業であり、大きな工数がかかることが予想されます。
データクレンジングのスキルを持った人材を確保や、データクレンジングソフトを使い手作業を減らすなど、スムーズに進められる体制を整えて
おきましょう。
|適切なツールを導入する
データマイニングを実施するには、分析手法の選定や効果検証において知識や技術が求められます。
データマイニングを行う人材の育成コスト削減や業務にかかる負担軽減、効果の最大化といった観点からも、データマイニングツールの導入が
おすすめです。
データマイニングを行うためのツールは数多くリリースされており、選択肢は多いです。
しかし、ツールによって適している用途や分析対象となるデータが異なります。
そのため、「なぜデータマイニングをしたいのか」、「データマイニングを通じてどのような知見を得たいのか」を明確にしましょう。
データマイニングにおいては、目的を明確化することが最も重要です。
また、目的に沿ったツールでも使う人によっては使いにくいと感じることもあるので、無料トライアルを実施することをおすすめします。
|データマイニングの活用事例
ビジネスシーンにおいて、実際にデータマイニングを活用している事例を5つご紹介します。
|金融:クレジットカード不正利用の検知
金融業界では、クレジットカードの不正利用を検知する目的でデータマイニングが活用されています。
クレジットカードは多くの人々が日常的に利用するものであるため、日々膨大な利用履歴のデータが蓄積しています。
大量に発生する利用データを分析し、過去の不正利用と類似したパターンを見つけ出すことで、クレジットカードの不正利用を早期に検知できます。
金融業界では、クレジットカードの不正利用の検知以外にも、住宅ローン与信審査や住宅ローン見込み客の推定、金融商品の提供などにもデータ
マイニングを活用しています。
|小売:マーケティング施策立案
クラスター分析やロジスティック回帰分析といったデータマイニングの手法は小売業で活用されるケースが多いです。
膨大な購買データから顧客の購買傾向や嗜好性を分析し、マーケティング施策を立案するケースなどで多く活用されています。
たとえば、上述のマーケット・バスケット分析であれば、同時に購入される傾向の強い商品を割り出し、それらの商品を近い位置に陳列するといった
施策が考えられます。
|製造:設備機器の分析
製造業では、商品よりも製造設備の分析にデータマイニングが活用される傾向にあります。
たとえば、製造現場における機器のメンテナンス効率化に用いられています。
どのようなタイミングで、どのような箇所に故障が生じやすいのかをデータマイニングで把握できれば、効率的なメンテナンスが可能です。
また、得られたデータを、製造機器を設計する段階で活かせば、故障しづらい機器を作ることができます。
|医療:診療データの分析
医療の分野でも、診察データを分析し、人体の状態を判断するなどデータマイニングが活用されています。
医療は、人の経験に頼りがちな分野です。医療機器によって人体の状態を知ることはできますが、そこから判断を下すのは人間である医師の仕事に
なります。
そのため、同じデータを見ても、医師によって判断が異なることがあります。
データマイニングで、膨大なデータを分析し、「このようなデータの時はあの病気である可能性が高い」といった関連性を発見できれば、経験の浅い
医師でも正確な診断が可能です。
|教育:生徒への適切な指導
生徒の得意不得意を細かく把握し、一人ひとりに合った適切な指導をするためにもデータマイニングで得られた知識は活用できます。
膨大な生徒の成績データを分析し、それぞれの得手不得手を把握できるほか、過去の生徒から得られたデータを踏まえれば、現在の生徒の成績が
今後どのように推移するかを予測することも可能です。
こうして得られた知識を授業内容や指導計画に活かすことで、生徒の成績アップに役立てることができます。
|まとめ
データマイニングは、大量のデータから傾向や関連性など「知識」を見出すための技術です。
AIやビッグデータといった最新技術との関わりが深く、クラスター分析やロジスティック回帰分析といったさまざまな手法が用いられます。
データマイニングを成功させるためには、実現したい目的を明確にすることが最重要です。
その上で、DWHなどデータの安全な保管、データクレンジングの体制を確保し、自社に適したツールを活用し進めていきましょう。
データマイニングは多種多様な業界で活用されている技術であり、データマイニングツールの市場は今後も拡大していくことが予想されています。
この機会にデータマイニングを把握し、ビジネスでの活用を検討してみてはいかがでしょうか。