ディープラーニング
用語集:用語
クイック定義
ディープラーニングとは、アルゴリズムと非構造化データを使用して、クラスタリングや分類、将来のデータ予測をおこなう、マシンラーニングのひとつの領域のことです。
重要ポイント
● 人間の脳から発想を得た人工ニューラルネットワークが、ディープラーニングに関するあらゆるもののバックボーンとなっています。
● ディープラーニングは、スマートアシスタントやチャットボックス機能、金融詐欺の検知など、人々が日常的に使用する製品やサービスの多くに組み込まれています。
● ディープラーニングは、カスタマージャーニーのあらゆる段階で、顧客体験を向上させるのに役立ちます。
ディープラーニングに関するさまざまな疑問に、Prithvi Bhutaniが回答します。Prithviは、スタートアップ企業および大規模法人向けSaaS製品プラットフォームについて9年以上の経験を持つ、戦略的プロダクトリーダーです。アドビのプリンシパルプロダクトマネージャーとして、Adobe Analyticsのマシンラーニング(機械学習)テクノロジーの設計、テスト、ローンチを管理しています。
ディープラーニングとは何ですか?
ニューラルネットワークとは何ですか?
ディープラーニングモデルには一般的にどのようなものがありますか?
ディープラーニングの使用例を教えてください。
マシンラーニングではなく、ディープラーニングを使用するのはなぜですか?
ディープラーニングの異常値検出について説明してください。
ディープラーニングのプラットフォームまたはツールにはどのようなものがありますか?
ディープラーニングのメリットは何ですか?
ディープラーニングは今後、どのように進化していきますか?
質問:ディープラーニングとは何ですか?
回答: ディープラーニングとは、AIの一種であるマシンラーニングのひとつの領域であり、テキストや画像などの非構造化データを扱います。一般的なマシンラーニングでは、人間の専門家が階層やパラメーターを設定する必要がありますが、ディープラーニングアルゴリズムでは、データセット内のどの特徴が最も重要なのかを自律的に検出することができます。こうした特徴により、ディープラーニングシステムでは、データのクラスタリングや予測など、人間の脳の学習方法を模倣した作業を実行することができます。ディープラーニングは、人々が日常的に使用している製品やサービスに見られるAIアプリケーションの多くを支えています。
質問:ニューラルネットワークとは何ですか?
回答: 人工ニューラルネットワークは、ディープラーニングに関するあらゆるもののバックボーンとなっています。人間の脳から発想を得たニューラルネットワークは、パターンを識別し、人間の脳が情報を学習し分類する方法を真似ることができます。最終的な目標は、ディープニューラルネットワークをトレーニングして、人間よりも速く、上手に学習できるようにすることです。
ニューラルネットワークには、主にふたつの機能があります。
● クラスタリング - データグループの類似性を検出する
● 分類 - データ間の相関性を導き出す
ニューラルネットワークは、入力層、隠れ層、出力層といういくつかの層で構成されています。3つ以上の層を持つネットワークは、「ディープ」と見なされます。各層にはノードと呼ばれるものがあり、前の層をベースに構築され、プロセスを改良して最適化し、刺激を受けると特定の行動を起こします。
質問:ディープラーニングモデルには一般的にどのようなものがありますか?
回答: ディープラーニングモデルの種類は、基本的にはニューラルネットワークの種類です。
● フィードフォワードニューラルネットワーク。 このネットワークは、最初に登場したニューラルネットワークであることから、「通常の」ニューラルネットワークと呼ばれることがよくあります。このモデルでは、情報は一方向、つまり前方に向かって進みます。他のモデルのように、データがループするような循環性はありません。データは入力層から隠れ層を経て、出力層に達します。フィードフォワードニューラルネットワークは、比較的シンプルですが強力なモデルであり、初心者でも使いやすいモデルです。また、音声認識や画像認識、回帰や予測モデルのデータ分析など、幅広い用途に利用されています。
● 畳み込みニューラルネットワーク。 このタイプのネットワークは、CNNまたはConvNetと呼ばれることがあります。畳み込みネットワークは、フィードフォワードネットワークに似ていますが、直線的ではなく循環的です。データは一定のループでモデル内を移動します。CNNは画像の分類など、さまざまな用途に使用できます。
● リカレントニューラルネットワーク。 このネットワークは再帰型で、メモリー状態と呼ばれるものを保持しています。つまり、以前に実行したアルゴリズムの出力を記憶し、それを使って現在の入力と出力に影響を与えることができます。この機能は、自然言語処理(NLP)モデルに役立ちます。
質問:ディープラーニングの使用例を教えてください。
回答: ディープラーニングは、人々が日常的に使用している多くの製品やサービスに組み込まれているため、ほとんどの人は利用していることに気づいていません。webサイトやモバイルアプリに搭載されているチャットボットの多くは、単にキーワードを探して顧客を特定のトピックに誘導するのではなく、ディープラーニングやNLP処理によって言語を理解し、適切な対応をおこなっています。
AppleのSiri、AmazonのAlexa、Google Assistantなど、あらゆる仮想アシスタントが何らかの形でディープラーニングを利用しています。
金融サービスでは、ディープラーニングの予測アルゴリズムが、株式取引、ビジネス評価、ローン承認、不正行為の検出などに情報を提供するため、ディープラーニングアプリケーションが続々と登場しています。
司法の世界でも、画像認識、音声分析、証拠品の検索を支援するためにディープラーニング技術を使用しています。Microsoft PowerPointなどのツールで見られる画像分析、画像分類、キャプションの自動生成も、ディープラーニングの一例です。
質問:マシンラーニングではなく、ディープラーニングを使用するのはなぜですか?
回答: ディープラーニングと従来のマシンラーニングでは、扱うデータの種類が異なり、アルゴリズムの「学習」の仕方も異なります。目的に応じて、あるタイプの学習が他のタイプよりも有効な場合があります。
マシンラーニングのアルゴリズムは、構造化されたラベル付きデータを使用して予測をおこないます。最初にモデルの入力データに特定の特徴を定義すると、モデルがデータをラベル付けして整理します。マシンラーニングアルゴリズムでは、構造化されていないデータを使用できますが、アルゴリズムを実行する前に、前処理と整理をおこなった場合に限ります。この前処理では、手作業で階層や分類、特徴を決定する必要があります。
一方、ディープラーニングでは、データの前処理は不要です。代わりに、アルゴリズムが非構造化データを取り込んで処理し、どの特徴が重要であるかを認識、判断します。ディープラーニングは、大量のデータや非構造化度が極めて高いデータに適しています。
質問:ディープラーニングの異常値検出について説明してください。
回答: 異常値とは、データポイントにおける外れ値、つまり、まれにしか起こらない逸脱値のことです。異常値検出とは、データの中から標準に当てはまらないパターンを見つけ出すことです。ディープラーニングを異常値検知に使用することには、多くの利点があります。多変量データや高次元のデータを扱うことができ、複雑な関係をモデル化することができます。
質問:ディープラーニングのプラットフォームまたはツールにはどのようなものがありますか?
回答: 代表的なディープラーニングのプラットフォームには、次のようなものがあります。
● TensorFlow- マシンラーニングとモデルトレーニングのための無料のオープンソースソフトウェアライブラリ
● Microsoft Cognitive Toolkit- ディープラーニングアルゴリズムをトレーニングするための無料の使いやすいツール。大量データを利用できる商用グリッドを備える
● H20.ai- オープンソースの拡張性に優れたツールで、予測分析によく利用される
● Torch.AI- グラフィックスプロセッシングユニット(GPU)を念頭に置き、学習しやすいスクリプト言語を用いてマシンラーニングフレームワークをサポートするツール
質問:ディープラーニングのメリットは何ですか?
回答: ディープラーニングは、クラスタリングアルゴリズムによって理想的な顧客を特定し、高度にターゲティングすることで、カスタマージャーニーのあらゆる段階で顧客体験を向上させることができます。また、ディープラーニングは、モデルがデータから学習する内容にもとづいて特性を特定の目標に合わせることで、マーケターが顧客をセグメント化するのに役立ちます。セールス部門は、NLPモデルを使ってセールス時の会話を書き起こして分析し、会話の重要なインサイトを指摘することもできます。ディープラーニングを利用すれば、データ入力を自動化し、インサイトを利用してパーソナライズされたレコメンデーションを提供できます。
質問:ディープラーニングは今後、どのように進化していきますか?
回答: 今後数年間、ディープラーニングは、プライバシーに関する話題において、引き続き重要な位置を占めるでしょう。重要なのは、企業が利用者のプライバシーを確保しながら、ディープラーニングがもたらす競争上の優位性を活用して、課題をより迅速かつ容易に解決することです。
企業が収集するデータ量が増え続ける中で、ディープラーニングは、ビッグデータの課題への対処、複雑なパターンの抽出、データのタグ付け、索引付け、検索などの重要な作業を進めるうえで役立つでしょう。