#ffffff

ADOBE REAL-TIME CDP

マシンラーニング(機械学習)とは?

A man writing on a notepad.

主な定義: マシンラーニングとは、AI(人工知能)のサブセットであり、コンピューターが人間よりも優れたタスクをより速く実行できるようにするシステムで、より多くのデータが与えられることでパフォーマンスが向上します。

マシンラーニングは、一般の人には手の届かない高度な技術のように思えるかもしれませんが、多くの企業にとっては、驚くほど容易にできるツールです。実際、多くの人々が日常的に、マシンラーニングを意識することなく、利用しています。

重要なポイント:

  • マシンラーニングモデルは、ある決定から得られる結果を「学習」することで向上する
  • マシンラーニングには、教師あり学習、教師なし学習、強化学習の3つの手法がある
  • マシンラーニングは、人間の能力や限りある時間では処理しきれないほど莫大なデータを処理する場合に活用するのが適している
  • マシンラーニングを利用して、データアナリストの日常的な反復作業を処理することで、生産性が向上する

ここからは、マシンラーニングの仕組み、種類、長所と短所、将来の展望などを解説します。

内容

マシンラーニングの仕組み

#マシンラーニングの仕組み-1

マシンラーニングの種類

#マシンラーニングの種類-1

マシンラーニングを利用するメリット

#マシンラーニングを利用するメリット-1

マシンラーニングアルゴリズムの課題

#マシンラーニングアルゴリズムの課題-1

企業によるマシンラーニングの活用

#企業によるマシンラーニングの活用-1

マシンラーニングの歴史

#マシンラーニングの歴史-1

マシンラーニングの仕組み

マシンラーニングは、コンピューターシステムが学習して、その成果物を向上させるのを支援するテクノロジーの一種です。マシンラーニングはアルゴリズムを利用して、課題を解決し、より有益な成果物を生成します。

多くのマシンラーニングモデルは、アルゴリズムにデータを入力することで動作します。次に、モデルは自動的に予測の誤りを探します。過去の例を利用して成果物を比較し、問題がないかをチェックします。そこから、人間がその成果物を受け入れるか却下するかを決定します。マシンラーニングモデルを訓練することで、モデルは時間の経過とともに効果が高まり、精度が向上します。マシンラーニングモデルが、より多くのデータとエクスペリエンスを収集するにつれて、人間の介入を必要とすることが少なくなります。

マシンラーニングはAIと似ていますが、異なるものです。マシンラーニングは、時間をかけて反復学習することで、コンピューターがよりインテリジェントになる仕組みです。しかしAIでは、コンピューターがその知識を利用して、人間の介入なしにタスクを実行します。このふたつのテクノロジーの最大の違いは、AIが人間の知能を模倣できるのに対し、マシンラーニングは単にパターン認識にもとづいてタスクを実行するという点です

マシンラーニングの種類

教師あり学習

教師あり学習は、データサイエンスの一種で、データと関連する結果に特定の情報がタグ付けされた、ラベル付きデータを使用します。モデルは、ラベル付きの入力データに割り当てられた結果が、どのような特徴や変数によって予測されるのかを学習します。その後、出力データの情報を使用して、モデル自体のパフォーマンスを評価し、結果を予測します。

教師あり学習には、分類と線形回帰という、ふたつの主要なユースケースがあります。分類は、クラスラベルを予測します。たとえば、顧客があるブランドとの関係を断つかどうかを、購入行動などの属性にもとづいて予測します。

線形回帰は、数値ラベルを予測します。たとえば、顧客から受け取ると思われる予想売上などを特定の属性にもとづいて予測します。結果は、条件ではなく数値変数です。

教師あり学習で質の高い成果物を生成するには、堅牢なマシンラーニングモデルが必要になります。マシンラーニングモデルが、コンピューターが生成できるさまざまな種類の出力にどのような影響を与えるのかを理解しましょう。

教師なし学習

教師なし学習は、ラベル付けされていない生のデータセットから始まります。教師なし学習の主な目的は、データセットと、モデルに追加するデータポイントとの間のつながりを見つけることです。

この方法で、データ内の関係にもとづいたグループ、つまりクラスターを見つけることができ、クラスターを利用して顧客セグメントを構築できます。

強化学習

強化学習は、ラベルの付いていない生のデータをモデルに入力することから始まります。次に、モデルはアクションを起こします。そのアクションにもとづいて、モデルはそれが正しかったか間違っていたかのフィードバックと、そのアクションの結果も受け取ります。モデルは次のアクションを起こし、最適化が達成されるまで学習を続けます。

強化学習の実例としては、Netflixのような動画配信サービスのレコメンデーションアルゴリズムがあります。このサービスでは、利用者の好みかどうかわからない映画を表示し、利用者の「好き」または「嫌い」の評価から、同じ種類の映画を継続的に推奨するべきかどうかを決定するために学習します。

マシンラーニングの歴史

マシンラーニングは、新しいテクノロジーのように聞こえるかもしれませんが、何十年も前から存在しています。今日私たちが知っているマシンラーニングのルーツは、1940年代にまでさかのぼります。

1940年代

1943年、Warren McCulloch氏とWalter Pitts氏が最初のニューラルネットワークを考案しました。これにより、コンピューターは人間の手を借りずに互いに通信できるようになりました。

1950年代

Alan Turing氏が、機械が人間のように振る舞えるかどうかを判断するために、チューリングテストを考案しました。研究者は今日でもチューリングテストを使用して、人間が生成した出力と機械が生成した出力の違いを見分けることができるかどうかを調べています。

1960年代

Thomas Cover氏とPeter Hart氏が、大量のデータからパターンを識別できる最初のマシンラーニングアルゴリズムのひとつであるk近傍法(KNN)アルゴリズムを発表しました。

1970年代

Paul Werbos氏が1974年に発表した「The Roots of Backpropagation(バックプロパゲーションのルーツ)」という論文により、バックプロパゲーション(ニューラルネットワークがパターンをより正確に認識できるようにするテクノロジー)への道が開かれました。

1980年代

説明ベースの学習(EBL)によって、コンピューターがデータを分析し、自分自身を訓練して重要ではないデータを無視することが可能になりました。また、人工ニューラルネットワークのNetTalkは、英語のテキストを正しく発音する方法を学習しました

1990年代

1997年、IBMが開発したスーパーコンピューター、ディープブルーが人間のチェスの名人に勝利し、世界を驚かせました。これにより、マシンラーニングが人間の能力に匹敵し、さらにはそれを上回る可能性があることが世界に示されました。

2000年代

フリーソフトウェアのライブラリであるTorch(その後、PyTorchに発展)は、世界初の大規模なマシンラーニングプラットフォームとなり、マシンラーニングをより身近なものにしました。2000年代には、コンピューターがディープラーニングによってテキストや画像を「見る」方法も学習しました

2010年代

グーグルが、物体を自動的に分類するディープニューラルネットワーク、グーグル・ブレインを開発しました。Facebook、Amazon、Microsoftもマシンラーニングモデルを開発しました。

2020年代

2022年11月、OpenAIのChatGPTが世界を席巻しました。これにより、一般の人々でもマシンラーニングとAIを利用できるようになりました。人々はこのテクノロジーを、履歴書に添えるカバーレターの生成からメール作成まで、さまざまな用途に利用しています。

A timeline showing important moments in machine learning history.

マシンラーニングを利用するメリット

マシンラーニングはビジネスに役立つテクノロジーです。

  • 生産性の向上:従業員の80%以上が、AIによって業務のパフォーマンスが向上すると考えています。通常は人間がおこなう作業を自動化することで、マシンラーニングは組織の生産性を向上させます。
  • 顧客支援: 企業はマシンラーニングを利用して、製品を最適化し、顧客の生活を便利にできます。実際、消費者の62%は、より優れた体験ができるのであれば自身のデータを共有しても構わないと考えています。
  • ヒューマンエラーの削減: マシンラーニングにより、ヒューマンエラーやタイプミスが発生しやすい日常的な手作業を自動化できます。つまり、よりクリーンなデータを活用し、より優れたビジネスインサイトを実現できます。
  • 可用性の向上:消費者の51%が、企業が24時間365日対応可能であることを期待しています。マシンラーニングソリューションを導入することで、昼夜を問わず顧客に対応できるようになります。
  • リスクの排除: コンプライアンスを逸脱すると、多額の罰金やビジネスの損失を被る可能性があります。幸いなことに、マシンラーニングは事前に決められたルールに従うことで、コンプライアンスを大規模に維持できます。
  • 繰り返し作業の削減: マシンラーニングを利用すれば、データ入力のような反復する作業を自動化できるため、従業員はより価値の高い作業に集中できるようになります。実際、従業員の68%は、タスクの実行を支援するAIベースのテクノロジーの導入を望んでいます。
  • インサイトの発見: マシンラーニングを利用すれば、多くの場合、人間の能力では検討の対象になることさえないインサイトを発見することが可能になります。

マシンラーニングアルゴリズムの課題

マシンラーニングシステムを利用する上で、次のようないくつかの課題に直面します。

  • 必要なデータ量: マシンラーニングモデルが効果を発揮するためには、多くの場合、大量のデータが必要になります。
  • データセットのサイズ: データセットのサイズと品質は、モデルの良し悪しを決定する大きな要因です。しかしデータセットが多ければ多いほど、教師あり学習方法で使用するためのデータを正確にラベル付けするために時間がかかります。
  • データタイプの組み合わせ: 堅牢なモデルにするために、データセットに追加するさまざまなタイプのデータについても考慮する必要があります。なぜなら、人間が実際におこなう方法で意思決定を下すように学習させるからです。
  • 潜在的な偏向: マシンラーニングのもうひとつの課題は、特にディープラーニングの場合、倫理上の懸念があることです。モデルの多くは、どのように意思決定を行っているのかを共有していないため、どのような要素を使用しているのか正確にはわかりません。モデルの良し悪しは、入手するデータに依存しますが、モデルがどのような関係を発見するか、それが道徳的に公正であるのかは、まだ明確にはわかりません。
  • 潜在的な不正確さ: マシンラーニングは、人間による出力よりも効果的ではありますが、絶対的なものではないことを忘れるべきではありません。データやロジックに不正確な点があれば、それがマシンラーニングモデルに反映されます。
  • コスト: 企業独自のマシンラーニングソリューションを作成する場合、モデルを構築して保守するデータサイエンティストの雇用に関連するコストが発生します。平均して、モデルを使用する最初の5年間に、企業は6万ドルから9万5,000ドルを費やします。しかし、Adobe Senseiのようなソリューションを選択することで、そうしたコストを削減できます。

マシンラーニングは完璧ではないものの、企業は適切なシナリオとマシンラーニングモデルを選択することで、多くの課題を克服できます。

企業によるマシンラーニングの活用

マシンラーニングアルゴリズムを導入することで、企業のリソースを効率化し、最適化できる事例は数多くあります。よくあるケースとしては、人間の能力では処理することのできないほどの莫大なビッグデータを有し、その中に企業の意思決定につながる重要な情報が含まれている場合です。

このメリットは、テクノロジーに長けた企業だけのものではありません。世界中の企業の68%がマシンラーニングを利用しており、その数は今後も増えていくでしょう。マシンラーニングは非常に有益であるため、その利用はさまざまな業界に広がっています。

医療業界

医療業界では、データ保護法を遵守しながら、多くの患者データを処理するためにマシンラーニングを利用しています。たとえば、初期の段階で病気を発見するために、画像診断の精度を向上させる目的でマシンラーニングを利用している企業もあります。また、不正行為の検出、エラーの発見、治療のパーソナライゼーションにも役立っています。

製造業界

よりスマートな予防保全のために、マシンラーニングを導入するメーカーが増えています。まだメンテナンスの必要のない機械のメンテナンスに時間と資金を浪費する代わりに、メーカーはマシンラーニングを使ってデータの傾向を分析し、メンテナンスする機械を最適化しています。

しかし、製造業でマシンラーニングを利用する方法はこれだけではありません。施設内の半自律走行車や自律走行車の管理にも、このテクノロジーを活用しています。

エンターテインメント業界

Netflixのアカウントを所有していれば、マシンラーニングを実際に利用したことがあるはずです。Netflixのストリーミングサービスでは、マシンラーニングを利用して、サムネールをパーソナライズし、映画や番組をレコメンドして、ストリーミング品質を最適化しています。

Netflix interface which highlights machine learning in practice.

マーケティング

マーケティング部門がさまざまな顧客セグメントの新しいデータを確認しているとします。顧客のさまざまな属性を分類して、パフォーマンスの高いセグメンテーションや、顧客セグメントのAとBの好みがどのような対比関係にあるのかを特定するのは困難です。

利用可能なデータの量を考えると、有用なインサイトを収集することはおろか、マーケティング部門がそのすべてを処理する能力を有していることはまずありません。そこで、人間よりも迅速かつ正確にデータを処理できる、マシンラーニングの出番です。

マシンラーニングによる自動化を利用すれば、人間の能力では見つけられなかったような予測的なインサイトを獲得できます。

金融業界

金融の世界では、ロボアドバイザーが人気を集めています。たとえば、Wealthfrontのようなサービスでは、マシンラーニングとAIを利用して、顧客のポートフォリオ管理を自動化しています。これにより、金融企業は顧客の投資管理に費やす時間を削減しながらも、顧客には管理された投資のメリットを提供できます。

マシンラーニングで優れた顧客体験を実現

マシンラーニングを利用して、セグメンテーションやパーソナライゼーションを向上させるには、Adobe Real-Time CDPがお役に立ちます。

関連トピックス

https://main--bacom--adobecom.hlx.page/fragments/products/cards/rtcdp