データ処理は、多くのビジネスにとって不可欠なものとなっています。データウェアハウスがデータの保存と管理に役立つことはご存じだと思いますが、具体的にどのようなものなのか、ほかのシステムやツールとどのように違うのかご存知でしょうか。
この記事では、データウェアハウスがなぜウェアハウスと呼ばれるのか、どのように機能するのか、そしてなぜ多くの企業がデータウェアハウスを利用して、業務や重要な意思決定をおこなっているのかを説明します。これを読めば、データウェアハウスの利点を把握し、ビジネス目標の達成に役立つかどうかを判断できるようになります。
主な内容:
データウェアハウスとは?
データウェアハウスとは、データベースやトランザクションシステムから大量のデータを取得するデジタルリポジトリのことです。その目的は、企業が特に顧客行動に関連する傾向を特定できるように、データを処理、管理、保存することです。データウェアハウスはビジネスインテリジェンスを生成し、組織の各部門がより優れた意思決定をおこなうのを支援することができます。
データウェアハウスは、実際の倉庫のように、材料(データ)を受け取り、それら体系的に整理し、適切なパーツを見つけ、組み立て直し、別の場所で使用できるように、大規模に一元管理する場所として機能します。さまざまなチャネルからの異なるフォーマットのデータは、それを整理し、保存し、アクセスできるようにする処理センターがなければ、役に立たないとは言わないまでも、処置に困ってしまう可能性があります。
データウェアハウスは、画像や動画を含むあらゆる種類のデータに対応し、さまざまなソースから大量のデータを収集するのに適しています。ソースには、たとえば販売時点情報管理(POS)システム、顧客関係管理(CRM)ソフトウェア、顧客データプラットフォーム(CDP)、企業資源計画(ERP)ソフトウェア、ソーシャルメディア、モノのインターネット(IoT)経由のデバイスなどがあります。
信頼できる唯一の情報源としてのデータウェアハウスについては、次の動画をご覧ください。
https://www.youtube.com/watch?v=AHR_7jFCMeY
データウェアハウスの種類
データウェアハウスの概念は何十年も前からあります。伝統的に、ハードウェアとデジタル機器はオンサイトで保管され、管理されていました(オンプレミス)。時がたつにつれて、データ品質とストレージテクノロジーは向上し、分析能力も向上しました。クラウドストレージが発展することでで、中小企業でも、以前は自前でオンプレミスのデータウェアハウスを準備できるほど大規模の企業だけが得ていた利点を享受できるようになりました(クラウド)。
これらふたつのアプローチをそれぞれ詳しく見てみましょう。
- オンプレミス: かつてはこのスタイルが唯一の選択肢でした。長年このスタイルが維持されてきて、今でも維持しているところもあります。オンプレミスのデータウェアハウスとは、自社サーバーでデータをホスティングし、すべての物理的および技術的なコンポーネントを自社で管理することを意味します。クラウドのデータウェアハウスよりもセキュリティが高く、政府機関などでは、特定の規制に準拠するために必要になる場合があります。しかし、オンプレミスでの運用は、ニーズの変化に対応するのが難しいことがあります。
- クラウド: データウェアハウスのクラウドへの移行は増加しています。クラウドのデータウェアハウスには、外部の第三者による管理など、一定の利点があります。自社のサーバーにデータを保存する方法を検討したり、そのインフラを維持したり、必要に応じてシステムを拡張したりする必要がありません。クラウドのデータウェアハウスは低コストで高い柔軟性を提供するため、多くの企業がこのスタイルを選択しています。
データウェアハウステクノロジーの未来
データウェアハウスの将来は、おそらくクラウドベースになるでしょう。この傾向を強めるのは、データをクラウドに保管する次のような利点です。
- 低リスク: 多くの組織は、データをクラウドに保管する方が、ローカルに保管するよりもリスクが少ないと感じています。また、オンサイトのデータ保管で発生する法的問題や規制要件を回避できるという利点もあります。
- 小規模なビジネスにとっての機会: データウェアハウスを構築、稼働し、データを最適化するためには、何十人もの人員を必要とするため、開設に多大なコストがかかります。しかし、クラウドベースのストレージに移行することで、より大量のデータを保存する機会がスモールビジネスに開かれます。クラウドにデータを保管することでコストを大幅に削減でき、オンサイトのサーバーに必要な予算が不要になります。つまり、コストが低いので、中小企業でもクラウドベースのデータストレージの利点を得ることができます。
- セルフサービス: クラウドにデータを保管することで、セルフサービスが容易になります。セルフサービス型のデータウェアハウスにより、ビジネスユーザーは自らデータにアクセスして操作できるようになり、ビジネスニーズの変化に応じて迅速な意思決定ができるようになります。セルフサービスはまた、組織全体でのデータへのアクセスを民主化することもできます。インサイトをより多くの人々に共有し、活用を促すような、データ主導の文化を育むことができます。
- 分析機能: データウェアハウスのもうひとつの将来性は、クラウド上での分析製品との統合です。既に大企業では、データウェアハウスと連携した大規模な分析機能が導入されています。また、さらに一歩進めて、データウェアハウスにAI(人工知能)のコンポーネントを組み込んで、ビジネスの意思決定にマシンラーニング(機械学習)を役立てようとしています。AIの能力も向上しており、データサイエンティストの専門家を雇用する必要もなくなってきています。
オンプレミスであれクラウドであれ、データは段階的にウェアハウス内を移動します。その仕組みを説明にするために、その構造を見てみましょう。
データウェアハウスのアーキテクチャ
データウェアハウスは階層で構成されています。一般的に3層構造になっており、データは複数のソースから取り込まれ、処理され、ユーザーがクエリーを実行したり、使いやすい形式でデータにアクセスできるインターフェイスを通じて利用できるようになります。
- 最下層: 複数のソースやインタラクションからのデータがリポジトリに取り込まれます。データは抽出、読み込み、変換(ELT)のプロセスを経ます。
- 中間層: データが中間層を通過するとき、分析のために再構築されます。実際の倉庫に、製品を分類して保管するためのさまざまな棚やセクションがあるように、データウェアハウスには、データを順序付け、さまざまな用途のために検索しやすくする機能があります。
- 最上層: 最後に、フロントエンドでデータを表示したり分析したりすることができます。ユーザーは、データの保存と順序付けの基礎となる階層に影響を与えることなく、さまざまな目的のためにクエリーを実行することができます。
データウェアハウスは、ひとつの階層から次の階層へと、情報の受け渡し、クリーニング、処理、保存、パッケージングをおこないます。データウェアハウスのアーキテクチャは、ほかのデータ処理ツールや概念がどこに当てはまるかを説明するのに役立ちます。次にこの分野の用語をいくつか見ていきます。
データウェアハウス、データレイク、データマートの比較
データウェアハウスに類似した用語がいくつかあり、よく混同されるので、それらの用語について定義し、その違いについて説明します。
- データレイク: データレイクには、後で利用するデータを保存します。どのような形式のデータでもデータレイクに取り込むことができ、将来のある時点で、それから価値を引き出すことができます。データベースと同様に、データレイクはデータの保管場所ですが、データレイクではフィルタリングも整理もされていません。レイクという名前から巨大なものを想像しますが、データウェアハウスと比較的すると小規模です。
- データベース: データベースは一般的に、リアルタイムで生データを収集するために利用されます。これも比較的小規模なリポジトリで、ここに収集されるデータの種類は特殊です。データベースは構造化、非構造化を問わず、あらゆる種類のデータを保持することができますが、用途はビジネスの一定分野に限定されており、情報は後のために保存されるよりもリアルタイムで使用されます。データベースは、データウェアハウスよりもソースや用途が限定されており、データウェアハウスのような分析機能はありません。
- データウェアハウス: データウェアハウスは、ビッグデータストレージのピラミッドの頂上近くに位置します。データベースやデータレイクよりも規模が大きく、その機能は即時性よりも履歴性が高いものですが、リアルタイムの情報も保存できます。多様な目的のために多様な種類のデータを扱うため、範囲が広く容量も大きなものになります。データウェアハウスの最適な利用方法は、チャネルをまたいでデータを連携することです。
- データマート: データベースと同様に、データマートは、ビジネスの一定分野のデータを保持するのに便利です。データマートは、データベースとは異なり、何らかの方法で処理されたデータを保持します。データマートは、特定のユーザーにとってのワンストップショップのようなものです。データウェアハウスから取得したデータを保存することができ、データの最終的な配信センターとして機能します。別々の目的のために別々のデータマートを構築することもできます。
これらの用語の違いは、これらの用語がどのように関連しているかを見れば、より理解しやすくなります。これらの用語は、多くの場合、時系列的に並べて説明することができます。
- データはさまざまな入力からシステムに取り込まれます。そのデータは、まず データベース または データレイクに保存されます。
- データは処理され、データウェアハウス に移動します。ここでデータを分析することができます。
- データをさらに データマート に移動し、部門ごとに分類することで、より迅速かつ容易に分析することができます。
データウェアハウスの利点
データウェアハウスは、単にデータを保存するだけではありません。データウェアハウスの主な利点は次のとおりです。
- 情報にもとづく意思決定: データウェアハウスならではの広範で質の高いインテリジェンスと分析により、より優れたビジネス上の意思決定をおこなうことができます。
- 統合: さまざまなソースからのデータを一元的に集約することで、全体像を把握し、より迅速な連携をおこない、必要なものすべてを一箇所で利用することができます。
- 標準化: データウェアハウスは、解釈や利用が困難な複数の異なる形式でデータを保存する代わりに、データの健全性と一貫性を保っています。
- スピード: 標準化され、整理されたデータを保存することで、異なる形式で保存する場合に比べて、たとえば各部門からの異なる形式のレポートを分類して調べる必要がなくなるため、クエリを迅速におこなうことができます。つまり、検索に無駄な時間を費やすことなく、分析に時間を割くことができます。
今すぐデータウェアハウスに取り組む
データウェアハウスは、大量の履歴データを一箇所に集め、そのデータを整理し、より優れたビジネスインテリジェンスを構築、強化するため、より優れたビジネス上の意思決定をおこなうことができます。データウェアハウスは、データを複数の分析ニーズに役立てることができる信頼できる唯一の情報源として活用できます。
一般的に、データウェアハウスは大企業向けのものです。しかし、クラウドベースのデータストレージは、中小企業がより大量のデータを保管する新たな機会を提供します。クラウドソリューションであれば、成長に合わせて拡張し、進化する分析ニーズに対応することができます。データウェアハウスは、小規模なシステムでは実現が困難な情報の発見と活用を可能にします。
準備が整ったら、この記事を共有し、自社のビジネスがデータウェアハウスからどのような利点を得られるかについて話し合いましょう。業務をサポートするデータウェアハウスソリューションのリストを作成するのも良いアイデアかもしれません。
アドビがお手伝いします
データウェアハウスは、顧客を把握し、より優れたビジネス上の意思決定に必要な強力なデータ処理基盤を提供することができます。Adobe Analyticsは、チャネルをまたいでデータを統合し、リアルタイムのインサイトを提供するの機能のひとつとしてデータウェアハウスの機能を備えています。