用語集索引

A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   X   Y   Z


用語集索引

A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   X   Y   Z


用語集索引

A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   X   Y   Z

用語集:用語

データマイニング

クイック定義

データマイニングとは、データの異常値やパターン、相関性を見つけ出し、インサイトを獲得するための準備をおこなうことです。

重要ポイント

 

データマイニングとは、データ分析のひとつの領域であり、インサイトを獲得して活用するための生データを準備する最初の段階です。

データマイニングには、履歴データを集め、それを処理して将来の分析に備えることも含まれます。

企業は、プライバシーを最優先に、顧客に価値を提供して同意の上で1stデータを収集することで、データマイニングに関連する潜在的なリスクを回避できます。

データマイニングのプロセスは、常に自社のデータガバナンス戦略と目標に即したものである必要があります。

マシンラーニング(機械学習)とAI(人工知能)は、基本的なデータマイニングの手法を採用し、それを改良しつづけて人間にはできないパターンや答えを見つけ出します。


質問:データマイニングとは何ですか?

回答:データマイニングとは、データ分析のひとつの領域であり、インサイトを獲得して活用するための生データを準備する最初の段階です。データマイニングのプロセスでは、アナリストが大規模なデータセットを調査し、異常値やパターン、相関関係を特定します。データの専門家やマーケターは、この有意義な情報を、結果の予測、ビジネスコストの削減、顧客関係の向上、リスクの低減、組織全体のビジネスインテリジェンス(BI)の向上などの目的で利用できます。

データマイニングにはさまざまな手法がありますが、業界の専門家たちは「データマイニング」という言葉を「データ分析」や「データアナリティクス」といった用語と同じように使っています。

質問:データマイニングはなぜ重要なのですか?

回答:データマイニングのプロセスは、非構造化データをわかりやすく視覚化し、すぐに利用できるようにします。ビジネスインテリジェンスやマーケティング分析など、データを視覚化して活用するモダンなビジネスプロセスでは、大量のデータが必要となります。そのデータは、有意義な情報が得られるように構造化されている必要があります。データを収集しても、その情報がデータウェアハウスに格納されているだけでは意味がありません。データの準備と管理は不可欠です。

データマイニングのプロセスは、組織のあらゆる部門が優れた意思決定をおこなうのに役立ちます。最も価値のあるデータパターンをより明確かつ迅速に特定できるようになります。たとえば、ビジネスインテリジェンス部門は、データインサイトを利用して、最適化する領域を特定できます。分析部門は、予測モデルを構築できます。マーケティング部門は、マーケティングキャンペーンに情報を提供し、ターゲティングと顧客エンゲージメントを改善できます。

質問:データマイニングの仕組みを教えてください。

回答:データサイエンティストは、さまざまなデータマイニング手法を使用します。それらの手法では、さまざまな分析方法や質問を駆使し、手作業での処理やマシンラーニングアルゴリズムを使用して意思決定をおこないます。一般的に、主な手法は大きく3つに分類されます。

記述的モデリング。記述的モデリングは、データセットに共通する類似性を明らかにし、イベントや結果の背景にある理由を特定します。記述的モデリング手法には、次のようなものがあります。

クラスタリング 類似レコードをグループ化し、異常値や外れ値を検出

アソシエーションルール学習 データポイントやその他の記録との関係を特定

主成分分析 変数間の関係を発見

アフィニティグルーピング 目的や関心が似ている人々のグループをセグメント化し、行動を分析

予測モデリング。予測モデリングは、将来の出来事を分類したり、未知の結果を予測したりするものです。予測モデリングの実例としては、ある顧客のクレジットスコアを利用して、その人がローンを返済する可能性を評価する、支出行動履歴を利用して、クレジットカードの不正使用を検知するための異常値を特定することなどがあります。予測モデリング手法には、次のようなものがあります。

回帰 従属変数と独立変数セットの間の関連強度を測定

ニューラルネットワーク コンピュータープログラムと学習アルゴリズムを使用してパターンを検出して予測

デシジョンツリー ツリー形状の図で、それぞれの枝がイベントの発生確率を表す

サポートベクターマシン 関連学習アルゴリズムを用いた教師ありの学習モデル

処方的モデリング。処方的モデリングは、非構造化データを、テキストマイニングと呼ばれるプロセスでフィルタリングして変換し、予測モデルに含めることができるようにします。処方的モデリングでは、内部変数と外部変数に注目し、アクションの方針を提案します。処方的モデリング手法には、次のようなものがあります。

ルールを用いた予測分析 - パターンからif/thenルールを作成し、結果を予測

マーケティングの最適化 - 異なるタイプのメディアをリアルタイムでシミュレートし、可能な限り高い投資回収率(ROI)を得るための適切な組み合わせを決定

質問:企業がデータマイニングから得られるインサイトには、どのようなものがありますか?

回答:ある小売企業が、webサイトやモバイルアプリ、ソーシャルメディア、店頭レポート、コールセンターなど、さまざまなチャネルから商品、顧客、売上に関する生データを取得しているとします。この小売企業は、顧客が既に購入した商品以外にも興味を持つかどうかを把握するために、商品間の親和性をより詳しく調べたいと考えています。データマイニング担当者は、統計やAI、マシンラーニングなどのツールを用いてデータを調査し、商品の親和性にもとづいてさまざまな顧客セグメントに細分化します。これにより、顧客行動に関するさまざまなインサイトが見えてきます。こうした情報があれば、小売企業は、商品に見合った適切な広告を投入し、的確な顧客にターゲットを定めることができます。また、プロパティをまたいだ顧客体験を最適化し、クロスセルを促進することもできます。

質問:データマイニングのリスクは何ですか?

回答:データサイエンスでは、データのプライバシーに関わるリスクが常に存在します。企業がプライバシーを第一に考え、顧客に価値を提供して同意の上で1stデータを収集することで、これらのリスクは回避できます。

質問:データマイニングのメリットは何ですか?

回答:データマイニングというと、データを掘り下げるように聞こえますが、実際には、パターンを見つけ出し、インサイトを使用して顧客体験を向上させることを意味します。効果的なデータマイニングにより、顧客とのやり取りがより円滑になり、一人ひとりのニーズに合わせた適切な体験を提供できるので、顧客に大きな価値を提供できるようになります。

質問:データマイニングのベストプラクティスは何ですか?

回答:ビッグデータを所有していれば、データマイニングとデータの準備が必要になります。データマイニングのプロセスは、常に自社のデータガバナンス戦略と目標に即したものである必要があります。実際にデータを準備するデータサイエンティストは、その結果がビジネスインテリジェンス(BI)やデータ分析、マーケティングにどのように役立つのかを理解しておく必要があります。

質問:データマイニングはどのように進化してきたのでしょうか?

回答:「データマイニング」という言葉が登場したのは1980年代後半から90年代前半ですが、当時はデータベースへの問い合わせという意味にすぎませんでした。クラスター分析などの特定の作業をおこなえる、初歩的な統計ソフトがありました。現在では、作業の大部分は自動化されています。マシンラーニングとAIは、そうした基本的な手法を取り入れて改良しつづけ、人間には発見できないパターンや答えを見つけ出します。

質問:データマイニングは今後、どのように進化していきますか?

回答:今後は、AIがデータマイニングの進化に大きく関わっていくことでしょう。現在、ほとんどのデータマイニングはフラットファイルや構造化データを対象におこなわれています。将来的には、データマイニングは、リレーショナルも含め、あらゆる種類のインタラクションデータを取り込めるようになるでしょう。また、これまで業界が考えてこなかったような、従来とは異なるデータセットをデータマイニングすることも可能になるでしょう。

アドビ製品を活用しましょう

Adobe Experience Cloudを利用して、新たなマーケティングの機会を生み出しましょう。