ADOBE REAL-TIME CDP
マシンラーニング(機械学習)アルゴリズムとは?
マシンラーニングアルゴリズムとは、AI(人工知能)ソリューションがさまざまなタスクを実行するために使用する手法を指します。通常、マシンラーニングアルゴリズムは、入力データを分析して出力値を予測するために使用されます。マシンラーニングアルゴリズムは、取り込むデータのタイプと予測する出力に応じて、回帰または分類によって予測をおこないます。
ママシンラーニングはAIのサブセットであり、市場規模は1,400億ドル以上に拡大しています。マシンラーニングアルゴリズムは、株式取引、病状の診断、需要予測などにおいて、人間がタイミングよく正確に意思決定できるように支援します。
ここでは、マシンラーニングアルゴリズムについて、主な種類、仕組み、ビジネス上のメリットなどを紹介します。
内容
マシンラーニングアルゴリズムの仕組み
マシンラーニングアルゴリズムをゼロから構築する方法
利点と欠点
マシンラーニングアルゴリズムの種類
マシンラーニングの進化的アルゴリズムとは
利用可能な主要なマシンラーニングアルゴリズム
マシンラーニングアルゴリズムの仕組み
マシンラーニングアルゴリズムには多くのタイプがありますが、それらは同じ基本原則に従っています。その原則とは、次のようなものです。
関数の学習
マシンラーニングアルゴリズムは、入力データがどのように出力に影響を与えるのか、つまりどのように出力を決定するのかをマッピングするために、さまざまな関数を学習できます。このプロセスは、y = f(x)という関数で表現できます。
この式において、(x)は入力変数を表し、(y)はMLアルゴリズムが予測する出力変数です。分析の過程で、マシンラーニングアルゴリズムは(f)を決定します。

予測のための学習
マシンラーニングアルゴリズムは関数を学習できますが、学習の主な目的は、変数が方程式に代入されたときに、データがどのように影響を受けるのかを予測することです。マシンは利用可能なデータしか使用できないため、予測には誤差が生じます。
マシンラーニングの関数は、予測における誤差を減らすために最適化されます。時間の経過とともに、アルゴリズムの許容誤差は小さくなっていきます。
関数の多様性
それぞれのマシンラーニングアルゴリズムでは、関数とその表現方法に関する仮説が異なっています。そのため、最も正確な結果が得られるアルゴリズムが見つかるまで、さまざまなアルゴリズムを適用する必要があります。
マシンラーニングアルゴリズムをゼロから構築する方法
効果的なマシンラーニングアルゴリズムを構築するには時間と労力がかかりますが、独自のアルゴリズムを細部にわたり記述することに習熟すれば、その努力は報われます。
マシンラーニングアルゴリズムをゼロから構築する場合は、既存のニューラルネットワークを基盤として使用し、次のシンプルな手順に従うことをお勧めします。
アルゴリズムを理解する
まず、どのようなマシンラーニングアルゴリズムを構築するのかを決定する必要があります。マシンラーニングアルゴリズムの種類を決めたら、その構造、機能、制限について把握します。
可能な限りの調査
続いて、書籍やYouTubeを参考にします。オンラインでもオフラインでも、豊富な情報を見つけることができます。
参考書のようなしっかりしたリソースは、アルゴリズムに関する数学的な詳細を学習するのに最適です。しかし、わかりやすいや説明や実用的な例を知りたいのであれば、チュートリアルビデオを見たり、ブログ記事を参照することをお勧めします。
課題を小さく分割
独自のマシンラーニングアルゴリズムを構築するのは大変に思えるかもしれません。しかし、最初に小さなパーツに分割することで、タスクは管理しやすくなります。
つまり、アルゴリズム全体を一度に構築しようとするのではなく、一度にひとつずつ取り組んで行きます。たとえば、データセットで訓練する前に、アルゴリズムがデータセットを読み取れることを確認します。これは、アルゴリズムにヌル値やカテゴリデータの扱い方を教えることを意味します。段階的なアプローチにより、プロセスはより消化しやすくなり、さらにその先のデバッグ作業が長くなることを防ぐこともできます。
シンプルに取り組む
アルゴリズムで実行するデータセットは、小さくてシンプルなものを選びましょう。そうすることで、アルゴリズムコードへの手入力が簡単になります。開発者がデジタルデバイスを作成する際に使用する一般的な論理ゲートである、NANDゲートを使用することをお勧めします。
マシンラーニングアルゴリズムは、予測モデリングを支援するためにデータを受け取って分析します。
アルゴリズムの検証
アルゴリズムの簡単なテストを実行して最適化したら、より大きな実世界のデータセットを入力します。許容誤差を小さくするために、必要に応じて調整します。可能であれば、既に確立されたマシンラーニングシステムによって分析されたデータを使用し、新しいアルゴリズムの精度を評価できるようにします。
記録
最後に、これまでのプロセスで学んだことをすべて書き留めます。そうすることで、何がうまく行ったのか、今後どのようにプロセスを合理化できるのかを詳しく把握できます。
利点と欠点
マシンラーニングアルゴリズムには多くの長所と短所があります。長所と欠点を把握することで、いつ、どのように使用すべきかを判断できるようになります
主な利点
- アルゴリズムが記述されれば、人による操作はほとんど、またはまったく必要ない: マシンラーニングアルゴリズムが稼動した後は、人間による定期的な介入がなくても分析能力を向上させ、予測をおこなうことができます。
- 傾向やパターンを見つけやすくなる: マシンラーニングアルゴリズムは、コマースの購買習慣などの消費者行動のパターンや傾向を、人が介在することなくピンポイントで特定するのに優れています。
- 稼働とともに、アルゴリズムが継続的に改善: 時間の経過とともに、マシンラーニングアルゴリズムは過去のデータを参照することで、より効率的で正確なものになります。
- 複雑なデータを扱える: マシンラーニングアルゴリズムは多次元データを扱うことができます。つまり、さまざまな変数を含む巨大なデータセットを処理できます。
- 多様なサービスに適用できる: マシンラーニングアルゴリズムは、ヘルスケアからコマースまで、幅広い業界で利用できます。
考えられる欠点
- 学習と訓練に大量のデータが必要: マシンラーニングアルゴリズムの学習や改善には、高品質で偏りのない大量のデータが必要です。
- 長期間の実行に多大な時間が必要: マシンラーニングアルゴリズムにデータを取り込み、分析し、学習する時間が必要です。また、このテクノロジーが効果を発揮するためには、膨大なコンピューターリソースを割く必要があります。
- 結果の解釈が難しい場合がある: マシンラーニングアルゴリズムに人間が理解しやすい結果を生成させるには、意図するユースケースに適した数式を選択する必要があります。
- マシンラーニングはエラーの影響を受けやすい: マシンラーニングアルゴリズムは自律的に実行されますが、特に使用するアルゴリズムのタイプを間違ったり、質の低いデータを与えたりすると、エラーの影響を非常に受けやすくなります。
マシンラーニングアルゴリズムの欠点を認識することで、ビジネスデータから施策につながる予測をおこなうために、この革命的なテクノロジーを適切に使用する方法を知ることができます。
マシンラーニングアルゴリズムのタイプ

教師あり学習
教師あり学習では、マシンラーニングアルゴリズムの入力と出力にラベル付きデータセットを与えます。アルゴリズムには、与えられた入力を使用して、目的の出力を得るための関数またはメソッドを見つけるというタスクが課せられます。
テストの各ラウンドの後、既知のエラーを修正することで、アルゴリズムが間違いから学ぶことができます。
半教師あり学習
半教師あり学習では、アルゴリズムにラベル付き情報とラベルなし情報の両方を与えます。ラベル付きデータにはアルゴリズムがデータを理解するためのタグが付いており、ラベルなしデータにはタグが付いていません。
ラベルなしデータとラベル付きデータを混在させることで、アルゴリズムに非構造化情報を分析することを教えます。
強化学習
強化学習は、学習プロセスを促進するために規則化されたプロセスを使用します。マシンラーニングアルゴリズムに、パラメーター、アクション、拡張可能なデータ表記法(EDN)の値などの詳細なデータセットを提供する必要があります。
このアプローチは、最も多くの人的インプットを必要としますが、試行錯誤的な分析プロセスによりアルゴリズムを教え、非常に効果的にエラーを削減することができます。
教師なし学習
教師なし学習では、アルゴリズムにラベルなしデータを与え、データセット間の関係や相関関係を自由に判断させます。マシンラーニングアルゴリズムは、膨大なデータセットを独自にふるいにかけることになります。
マシンラーニングの進化的アルゴリズムとは
マシンラーニングの進化的アルゴリズムは、複雑な問題を解決するために生物の行動を模倣するコンピューターアプリケーションです。突然変異、組み換え、生殖といったメカニズムを利用しています。
従来のマシンラーニングアルゴリズムが試行錯誤にもとづくに対し、進化的アルゴリズムは自然淘汰のようなプロセスを利用します。
分析の各ラウンドの後、進化的アルゴリズムは予測リストから「弱解を除外し、「強解」を保持します。このプロセスの目的は、どの行動が望ましい出力をもたらす可能性が最も高いのかを特定することです。
マシンラーニングの進化的アルゴリズムは、次のような大きなビジネス上のメリットをもたらします。
- あらゆる問題に対応できる柔軟性の向上
- あらゆる可能なアクションを検討するより優れた最適化
- 数多くの潜在的な問題に対する無制限のソリューション
進化的アルゴリズムは、変数の多い複雑なデータセットを調査するための最適なツールです。マシンラーニングについて、またAIとの違いについて、さらに詳しく学びましょう。
利用可能な主要なマシンラーニングアルゴリズム
マシンラーニングアルゴリズムにはさまざまなものがありますが、ここでは最もポピュラーなものをいくつか紹介します。
- 線形回帰: 線形回帰統計モデルで従属変数と独立変数の間の相関関係を予測できます。たとえば、クリック課金マーケティングの予算を増やすことが、リード、エンゲージメント、ROI(投資回収率)にどのように影響するのかを推定するために、線形回帰モデルを使用できます。
- ロジスティック回帰: この統計モデルは、0または1のようなバイナリ値を推定するために使用されます。ロジスティック回帰は、任意のイベントが発生する可能性を予測するのに役立ちます。
- k近傍法(KNN)アルゴリズム: KNNアルゴリズムは、回帰問題にも分類問題にも使用できます。KNNアルゴリズムを分類に使用する場合は、新しいデータポイントを、その近傍で「投票する」ことによって分類します。新しいケースは、より共通点の多いグループに割り当てられます。
- 決定木アルゴリズム: 問題を分類するのに役立つことから、データサイエンティストが広く利用しているアルゴリズムのひとつです。このアルゴリズムは、主要な独立変数または属性にもとづいて、データセットをいくつかの同種のグループに分割し、それらのグループを逆さまの木のような図表にして表現します。
マシンラーニングアルゴリズムの詳細と、この堅牢なテクノロジーがAdobe Real-Time CDPでどのように活用されているのかについては、概要ビデオまたは製品ツアーをご覧ください。
Adobe Experience Cloudの各製品において、Adobe Senseiが意思決定をどのように支援しているのかをご確認ださい。