機械学習(ML)は人工知能(AI)の応用のひとつであり、自動運転車からマーケティングソフトウェアまで幅広く利用されています。先進的な企業は、イノベーション、プロセス改善、効率向上などのために、ますます機械学習を活用するようになっています。
特定のタスクやプロセスを自動化することで、企業は業務を合理化し、競争優位を築くことができます。意思決定者は、機械学習とその仕組みを理解することで、自社のビジネスに取り入れ、成功に必要な自動化を実現できます。
この記事の内容:
機械学習とは?
機械学習は人工知能の一部であり、過去の経験やデータから自動的に学習し、パターンを見つけて予測を行う能力を機械に与えます。これにより、人間の介入がほとんど、あるいはまったくなくても学習が可能です。処理したデータを用いて、機械学習ソフトウェアは人間の学習の仕組みを模倣し、時間とともに精度を高めていきます。
機械学習は、チャットボット、翻訳アプリ、ストリーミングサービスにおける番組や映画のおすすめ機能、そしてソーシャルメディアのフィードに表示される投稿の背後にある技術です。これは、コンピューターに特定の情報を知るよう明示的にプログラムしなくても知識を獲得させる力を与えます。私たちの日常生活の個人的な機能や仕事上の機能を改善することができます。
機械学習には大きな利点があります。人間の能力をはるかに超える膨大なデータを取り込み、処理し、そこから迅速に学習できるのです。機械学習は物体を識別し、顔を認識できるため、多くの人がスマートフォンで利用している顔認証技術を可能にしています。また、データを迅速に比較し、人間ならはるかに時間を要する多様な選択肢や解決策を提示できます。
さらに、機械学習はマーケティングにおいても重要な要素です。たとえば、ソーシャルメディアプラットフォームが個々人のフィードに広告をターゲティングできるのは機械学習によるものです。機械学習はコミュニケーション能力を拡張し、消費者によりパーソナライズされたエクスペリエンスを生み出します。ヘルプラインやチャットボットも機械学習のおかげで実現しており、企業は人間の労働力だけに頼るよりも多くの顧客を支援できるようになっています。
機械学習(ML)、ディープラーニング(DL)、ニューラルネットワークの違い
機械学習とニューラルネットワークはしばしば同じ意味で使われますが、実際には同じものではありません。ニューラルネットワークは機械学習の一分野であり、ディープラーニングはニューラルネットワークの一分野です。
人工ニューラルネットワークは人間の脳をモデルとしており、数千から数百万の処理ノードが相互に接続され、層に分かれて組織されています。ニューラルネットワークは3つのノード層(入力層、1つ以上の隠れ層、出力層)で構成されています。
各ノードは他のノードと接続しており、それぞれに重みとしきい値があります。ノードの出力が特定のしきい値を上回ると、そのノードがアクティベートし、ネットワーク内の次の層にデータを送ります。それ以外の場合、そのノードから次の層へデータが送られることはありません。
同じく人間の脳の仕組みをモデルとしたディープラーニングネットワークは、多層構造を持つニューラルネットワークです。マサチューセッツ工科大学スローン経営大学院によれば、「多層ネットワークは膨大な量のデータを処理し、ネットワーク内の各リンクの『重み』を決定できる」とされています。
ディープラーニングはラベル付きデータセットをアルゴリズムの指針として利用できますが、必ずしも必要ではありません。ディープラーニングは画像やテキストといった生データを取り込み、自動的に特徴を認識してデータセットを区別します。人間の関与頻度はより少なく、人間の介入に依存する従来型(非ディープ)の機械学習と比べて大規模なデータセットを扱うことができます。
AI、機械学習(ML)、ディープラーニング(DL)の違い
人工知能、機械学習、ディープラーニング(DL)の微妙ながら重要な違いを理解することは、これらの技術を効果的に導入するうえで不可欠です。正しいアプローチを選ぶかどうかは、ビジネス上の課題、利用可能なデータ、リソース、そして戦略的目標にかかっています。
これらの概念間の関係性は、階層構造としてよく表現されます。人工知能(AI)は最も広いカテゴリであり、人間の知能を模倣する機能を機械に与えるすべての技術を含みます。機械学習(ML)はAIのサブセットで、データから学習し、明示的にプログラムされなくても時間とともに改善していくアルゴリズムに焦点を当てます。ディープラーニング(DL)はさらにMLのサブセットであり、複数の層を持つ非常に複雑なニューラルネットワークを用いて、より高度な問題を解決します。
次のように考えるとわかりやすいでしょう。
AIはMLを含み、MLはDLを含みます。
ディープラーニングとは?
ディープラーニングは、入力層と出力層の間に複数の隠れ層を持つディープニューラルネットワークを活用する機械学習の一種です。単純な(または「浅い」)ニューラルネットワークが基本的な予測タスクを処理できる一方で、ディープラーニングモデルは膨大なデータセットを分析し、より単純なモデルでは見つけられない複雑なパターンを明らかにすることが可能です。
この深さによって、ディープラーニングモデルは音声アシスタント、リアルタイムの翻訳、不正検知、自動運転車といった高度な技術を支えています。
まとめ:
- すべてのディープラーニングはニューラルネットワークを用います。
- しかし、すべてのニューラルネットワークがディープラーニングと呼べるほど「深い」わけではありません。
AIとは?
AIとは、機械が人間の知能をシミュレートする仕組みであり、通常は人間の介入なしに高度なタスクを実行します。AIによって、機械は一般的に知的生物に特徴的なタスクを実行します。
実際には、AIとは機械によって実行される人間の思考力のことです。SiriやAlexaのようなバーチャルアシスタントは、AIを利用してユーザーの好みを学習し、適切な結果を提案します。AIを活用したチャットボットを利用すれば、買い物客は通常の営業時間外でもパーソナライズされたサポートを受けられます。
また、AIにはいくつかの種類があることを覚えておくことも重要です。組織は、さまざまなタスクを達成するために、1つまたは複数の種類のAIを利用します。
下の表は、AI、機械学習、ディープラーニングの主な違いを示しています。
機械学習の仕組み
機械学習は本質的にアルゴリズムを使って、より正確な予測を行います。これらのアルゴリズムには以下のようなものがあります。
- 記述的 ― データを用いて何が起きたかを解釈する
- 予測的 ― データを用いて何が起きるかを予測する
- 処方的 ― データを用いて取るべきアクションを提案する

アルゴリズムは3つの部分で構成されています。
- 意思決定プロセス 機械学習アルゴリズムの多くは、入ってくる情報を推測および整理するために使われます。提供されたデータに基づき、アルゴリズムはその中のパターンについて予測を行います。
- 誤差関数 この部分ではモデルの予測を評価します。すでに調べられた例がある場合、誤差関数はモデルの正確さを評価するために比較を行います。
- モデル最適化プロセス モデルがトレーニングセット内のデータポイントに簡単に適合できるように、重みを調整して、調べられた例とモデルの予測の間の差異を減らします。このプロセスはアルゴリズムによって繰り返され、精度がしきい値に達するまで重みが更新され続けます。
アルゴリズムがデータ活用を学ぶ方法はいくつかあり、機械学習には4つの主要なアプローチがあります。
教師あり学習
ラベル付きデータセットを用いてアルゴリズムを訓練するもので、この機械学習のサブカテゴリは与えられた情報に基づいて指示に従います。
マシンはラベル付きデータセットから情報を学習し、与えられた指示に従って出力を推測することが認められます。ラベル付きデータセットはすでに定義済みの入力と出力のパラメータを含んでおり、マシンはその入力と対応する出力を使って学習します。
教師あり学習はさらに2つの大きなカテゴリに分けられます。
- 分類 このアルゴリズムは、出力要素がカテゴリ的な分類問題に対応します。「はい/いいえ」や「真/偽」といった出力がその例です。 日常生活で使われる分類の例としては、メールアプリケーションのフィルタリング機能があり、受信トレイのメッセージとスパムボックスのメッセージを振り分けます。よく知られた分類アルゴリズムには、ロジスティック回帰アルゴリズム、サポートベクターマシンアルゴリズム、ランダムフォレストアルゴリズムなどがあります。
- 回帰 これらのアルゴリズムは、入力要素と出力要素が線形関係にある回帰問題を扱います。これらは、連続的な出力要素がどうなるかを予測します。その例としては、マーケット動向分析や天気予報があります。よく知られた回帰アルゴリズムには、単回帰、ラッソ回帰、多変量回帰などがあります。
教師なし学習
教師なし学習は、ラベル付けされていないデータセットを分析およびクラスタリングし、人間の介入なしにパターンを発見するために使われます。
教師なし機械学習プログラムは、ラベルなしデータを探索し、人間が意図的に探していないパターンを見つけ出します。たとえば、教師なし機械学習プログラムはwebストアの主要顧客層を特定することができます。よく知られた教師なし学習の手法には、最近傍法や自己組織化マップなどがあります。
教師なし学習の利点は、人間の介入なしにグループ間の類似点や相違点を見つけられることです。このアルゴリズムは、未整理のデータセットをパターンや違い、類似性に基づいてグループ化できます。
教師なし学習にはいくつかのサブ分類があります。
- クラスタリング この手法は、対象をそれぞれの違いや類似性といった基準に基づいてクラスターに分けます。その例として、購入商品によって顧客を整理することが挙げられます。
- アソシエーション この技術は、大規模データセット内の変数間の一般的な関係を特定します。データ項目の依存関係を決定し、関連する変数をグラフ化します。
半教師あり学習
その名の通り、教師あり学習と教師なし学習の要素を組み合わせたアプローチです。
半教師あり学習はラベル付きデータセットとラベルなしデータセットを読み込み、アルゴリズムを訓練します。両方のデータセットを組み合わせることで、それぞれ単独で使用した際に生じる問題を解消できます。さらに、半教師あり学習は小規模のラベル付きデータセットを利用して、大規模なラベルなしデータセットを導き、管理します。ラベルなしデータは入手コストが低く、取得の手間も少ないため、このようにデータセットを組み合わせるのが一般的です。
学生と教師の関係を考えてみましょう。学生が教師から情報を受け取る場合、それは教師あり学習にあたります。自宅で独学する場合は、教師なし学習にあたります。しかし、学生が自宅で学習した後に教室で教師と一緒に復習する場合、これは半教師あり学習に相当します。
日常生活における半教師あり機械学習の例としては、顔を識別するwebカメラがあります。
強化学習
強化学習は報酬システムを通じて訓練されます。試行錯誤を繰り返しながら学習し、成功した結果がレコメンデーションを強化します。教師あり学習のようにラベル付きデータはなく、この種の機械学習は、アクションのフィードバックプロセスを通じて経験から学習します。
強化学習は、経験から最適な行動を学び、それに応じてアクションを調整することで、最も適切なアクションを選択します。正しいアクションを取れば報酬が与えられ、誤った行動には罰則が科されます。これにより、システムは正しいアクションを学習していきます。
強化学習はビデオゲーム、ロボティクス、ナビゲーションで広く利用されています。たとえばビデオゲームでは、ゲームが環境を定義し、強化学習エージェントの行動ひとつひとつがそのエージェントの現在の状態を決定します。エージェントは、報酬や罰則といったフィードバックを受け、それがゲームスコアに影響します。
強化学習アルゴリズムには2種類あります。
- ポジティブ強化学習 これはエージェントがある行動を取った後に強化的要素を追加することで、その行動が将来再び起こる可能性を高めるものです。
- ネガティブ強化学習 これはネガティブな条件を取り除くことで特定の行動が再び起こる可能性を高めたり、望ましくない結果を回避する行動を強化したりするものです。
機械学習の活用
大量のデータを扱う多くの業界は、生産性向上のために機械学習技術を活用する価値を見出しています。機械学習は人間の代替ではなく、人間が推奨されるアクションを評価し、より良く、より迅速な意思決定を行うために、情報を素早く正確に抽出するためのツールです。
最も一般的に機械学習が活用されている業界を見てみましょう。
ヘルスケア
機械学習はヘルスケア分野で急速に拡大しています。 スマートウォッチやフィットネストラッカーなどのウェアラブルセンサーやデバイスは、医療従事者が患者の健康状態をリアルタイムで把握するのに役立ちます。ヘルスケアにおける機械学習の利点には次のようなものがあります。
- データをより迅速かつ効率的に分析する リアルタイムで提示および分析されたデータにより、健康上の警告やパターンを簡単に発見でき、診断や治療の更新をより迅速に行うことができます。
- 患者の健康状態をリアルタイムで評価し、よりパーソナライズされたケアを提供する 薬は症状を治療できますが、副作用は患者ごとに異なる場合があります。機械学習は個人の遺伝子を解析し、患者ごとに合わせたケアやターゲット治療を提供できます。
- 新薬開発の迅速化 機械学習は、新薬を作る長く高価なプロセスを加速できます。一部の機械学習ツールは、大規模なデータセットを分析し、新しい潜在的な治療薬候補の発見を支援します。
金融
銀行やその他の金融機関は、大量の機密情報を扱います。多くの企業が、顧客に対してより安全で効率的なサービスを提供するために機械学習技術を採用しています。金融における機械学習の利点には次のようなものがあります。
- データに関する新しいインサイト 新たな投資機会を素早く発見でき、投資家により良いインサイトを提供できます。たとえば、取引の最適なタイミングを把握できることです。
- より優れた不正防止 金融情報を管理する上でセキュリティは極めて重要です。データマイニングによって高リスクプロファイルのユーザーを特定し、サイバー監視システムが潜在的な不正行為を検出するのに役立ちます。
小売
小売業界は機械学習技術を活用して、顧客一人ひとりに異なるエクスペリエンスを提供し、さらなる顧客支援を行っています。機械学習は、小売業者にコストを削減しながら顧客基盤を拡大する可能性をもたらします。主な利点には次のようなものがあります。
- パーソナライズされたショッピングエクスペリエンス 多くのオンライン小売サイトは、最近の購入履歴やブックマークに基づいて商品を提案するために機械学習を活用しています。小売サイト上のチャットボットは、顧客の即時的な質問に対応し、人間の担当者の負担を軽減します。
- マーケティングの改善 機械学習は、商品計画、広告キャンペーンの立案、価格の最適化、顧客インサイトの提供といった分野で有効なツールとなります。
機械学習アルゴリズム
機械学習は、レコメンデーションエンジンやアルゴリズムを構築し、個人ごとに商品やサービスをパーソナライズするために利用できます。
YouTubeやNetflixといった企業は、視聴履歴に基づいて映画や番組を推薦するために機械学習アルゴリズムに依存しています。小売やその他のWebサイトは、保存されたアイテムや購入済みのアイテムに基づいて商品やサービスを提案できます。さらに、ソーシャルメディアプラットフォームも機械学習を利用してレコメンデーションを提示し、ユーザーが「いいね」した投稿やフォローしているアカウントに応じて各人のフィードに異なる投稿が表示されます。
ユーザーエクスペリエンスのパーソナライズや追加インサイトの取得は、組織が顧客をより適切に支援することにつながります。ただし、機械学習技術には独自の課題も存在します。
機械学習の課題
機械学習は多くの業界で企業の効率を高めていますが、他の新しい技術と同様に欠点もあります。特に、倫理面とコスト面での懸念が指摘されています。
-
バイアスと差別
残念ながら、機械学習の訓練に使用されるデータは人間のバイアスを反映する可能性があります。誤りを含む、あるいは特定の人々を除外したデータセットから学習するアルゴリズムは、世界を不正確に表現してしまいます。こうした誤りは世界の正確なモデルを捉えられないだけでなく、差別的になることもあります。多くの企業は自動化の取り組みにおける潜在的なバイアスを排除するために尽力していますが、AIを使用することで望ましくない結果が生じる可能性もあります。
たとえば、Amazonは採用プロセスの簡素化に自動化を利用しましたが、その結果、技術職の候補者に対して性別に基づく差別が意図せず発生しました。同社はそのプロセスを廃止しました。異なる背景を持つ人々から意見やデータを収集することは、バイアスや差別を減らす助けとなります。
-
プライバシー
機械学習にはデータが必要であり、そのためプライバシーの懸念が伴います。あらゆる種類のデータ、特に個人を特定できる情報(PII)を扱う際には、データのプライバシーとセキュリティが最も重要です。世界中でますます多くの立法者が、個人データを保護するためにアクションを起こしています。
EU一般データ保護規則(GDPR)は、2016年に欧州連合で制定された法律で、EUおよび欧州経済圏の人々の個人データを保護し、個人が自らの情報をよりコントロールできるようにしました。アメリカでは、カリフォルニア州が2018年にカリフォルニア消費者プライバシー法(CCPA)を制定し、企業がデータ収集時に消費者へ通知することを義務付けました。
-
コスト
機械学習技術を業務に導入することは高額になる場合があります。通常このプロジェクトを主導するデータサイエンティストは高い給与を必要とすることが多く、機械学習の実践に伴うソフトウェアインフラも高価になる可能性があります。
機械学習は、長期間にわたって生成された大規模なデータセットを検索するために導入され、多くのリソースが必要となります。時間やリソースの消費は多くの企業にとって十分価値のあるものですが、機械学習は投資であることを忘れてはいけません。システムは成長するにつれてより複雑になり、コストも増加する可能性があります。
機械学習で優れた顧客体験を実現
機械学習でセグメント化とパーソナライズを強化する必要がありますか?Adobe Real-Time CDPがどのように役立つか をご確認ください。
関連するユーザー事例
https://business.adobe.com/fragments/resources/cards/thank-you-collections/rtcdp