マシンラーニングとは?主な手法、AIとの違いなどを解説
マシンラーニング(機械学習)とは、AI(人工知能)のサブセットのことです。より多くのデータが供給されることで、パフォーマンスが向上します。
重要ポイント
- マシンラーニングモデルは、ある決定から得られる結果を「学習」することで向上します。
- マシンラーニングには、教師あり学習、教師なし学習、強化学習の3つの手法があります。
- マシンラーニングは、人間の能力や限りある時間では、処理することのできないほどの莫大なデータを有している場合に活用するべきです。
- マシンラーニングは、データアナリストのの手を煩わせている作業を引き受けることで、生産性を向上させます。
目次
- マシンラーニングとは何ですか?
- マシンラーニングの手法には主にどのようなものがありますか?
- AIとマシンラーニングの違いは何ですか?
- マシンラーニングとディープラーニングの違いは何ですか?
- マシンラーニングの最適な利用方法は何ですか?
- マシンラーニングシステムが不要なのはどのような状況ですか?
- マシンラーニングはどのようにして使いやすくなったのですか?
- マシンラーニングシステムを使うメリットは何ですか?
- マシンラーニングアルゴリズムの欠点は何ですか?
- マシンラーニングは今後、どのようになっていきますか?
マシンラーニングに関する様々な疑問に、Alisha Marfatiaが回答します。Alishaは、アドビのAIエンジンAdobe Senseiの運用および戦略担当プロダクトマネージャーです。アドビに入社して約3年になり、それ以前は、ThreadflipやEverlaneなどの企業でアナリストやコンサルタントとしてデータ分析を担当していました。10年以上に及ぶ、豊かなデータ分析の経験を有しています。
マシンラーニングとは何ですか?
マシンラーニングとは、AIのサブセットであり、AIを応用して、コンピューターが人間よりも効率的かつ高速に作業をおこなえるようにするシステムのことです。より多くのデータが供給されることで、パフォーマンスが向上します。
マシンラーニングの手法には主にどのようなものがありますか?
マシンラーニングには主に3つの手法があります。
教師あり学習 は、データサイエンスの一種で、データと関連する結果に特定の情報がタグ付けされた、ラベル付きデータを使用します。モデルは、ラベル付きの入力データに割り当てられた結果が、どのような特徴や変数によって予測されるのかを学習します。その後、出力データの情報を使用して、モデル自体のパフォーマンスを評価し、結果を予測します。
教師あり学習には、分類と線形回帰という2つの主なユースケースがあります。分類は、クラスラベルを予測します。たとえば、顧客があるブランドとの関係を断つかどうかを、購入行動などの属性にもとづいて予測します。
線形回帰は、数値ラベルを予測します。たとえば、顧客から受け取ると思われる予想売上などを特定の属性にもとづいて予測します。結果は、条件ではなく、何らかの数値変数です。
教師なし学習 は、ラベル付けされていない生のデータセットから始まります。教師なし学習の主な目的は、データセットと、モデルに追加したデータポイントとの間のつながりを見つけることです。この方法で、データ内の関係にもとづいたグループ、つまり クラスター を見つけることができ、クラスターを利用して顧客セグメントを構築できます。
強化学習 では、ラベルの付いていない生のデータをモデルに入力することから開始します。次に、モデルが何らかのアクションを起こします。そのアクションにもとづいて、モデルはそれが正しかったか間違っていたかのフィードバックと、そのアクションの結果も受け取ります。モデルは次のアクションを起こし、最適化が達成されるまで学習を続けます。
強化学習の実例としては、Netflixのような動画配信サービスのレコメンデーションアルゴリズムがあります。このサービスでは、利用者の好みかどうかわからない映画を表示し、利用者の「好き」「嫌い」の評価から、同じ種類の映画を継続的に推奨するべきかどうかを学習します。
AIとマシンラーニングの違いは何ですか?
回答: AIとマシンラーニングの大きな違いは、ルールと仕様に関するものです。たとえば、アメリカ人の顧客がリンクをクリックすると、特定の広告に誘導するプログラムを設計するとします。また、同じリンクをクリックしたアジア圏の顧客には、母国語で書かれた別の広告を表示するようにします。このようなルールを明示的に定義したプログラムでは、マシンラーニングではなく、AIを利用します。
一方、ある企業が、利用者が何をクリックしたか、どこから来たのか、誰なのか、どのように行動したのかなど、いくつかのデータ属性を持っているとします。このデータをモデルに入力して、利用者のペルソナごとに特定の役割を作成することができます。利用者の行動に関する情報とともに、履歴データがモデルに反映されます。このモデルは、既に多くの情報を提供することが可能です。しかし、データを入力し続けることで精度が高まり、ある一定の背景を持つ特定のタイプの利用者が、あるリンクをクリックするかどうかをdできるようになります。このシステムは、先のAIシステムのようなルールベースではなく、マシンラーニングの典型的な例です。
マシンラーニングとディープラーニングの違いは何ですか?
マシンラーニングがAIのサブセットであるように、ディープラーニングはマシンラーニングのサブセットです。これは、私たちの脳のニューロンがどのように通信するかを大まかにモデル化した一連のマシンラーニングテクノロジーです。ディープラーニングは、マシンラーニングの分野を飛躍的に進歩させ、多くの企業がその能力に投資しています。
ディープラーニングはビッグデータを必要とする傾向があり、ニューラルネットワークを使用します。通常、ディープラーニングを使用するのは、利用可能なデータポイント量が十分にある場合で、また相当な計算能力も必要です。
マシンラーニングの最適な利用方法は何ですか?
組織のリソースを最適化するために、マシンラーニングアルゴリズムの導入が必要になるケースは多々あります。よくあるケースとしては、人間の能力では処理することのできないほどの莫大なビッグデータを有し、その中に企業の意思決定につながる重要な情報が含まれている場合です。
例えば、マーケティング部門が様々な顧客セグメントの新しいデータを確認しているとします。顧客の様々な属性を整理して、パフォーマンスの高いセグメントを特定したり、顧客セグメントAと顧客セグメントBの好みを比較したりすることは、利用可能なデータ量が多い場合は困難です。マーケティング部門があらゆるデータを処理できる可能性は低く、有益なインサイトも獲得できないでしょう。このようなときに、マシンラーニングは人間よりも迅速かつ正確にデータを処理できます。マシンラーニングによる自動化を利用すれば、人間の能力では見つけられなかったような予測的なインサイトを獲得できます。
一般的に、今日のAIは応用範囲が狭い傾向があります。つまり、極めて具体的な問題に絞って、一連のルールを適用しています。つまり、AIは最もパフォーマンスの高い顧客を見つけることはできないでしょうし、様々なユースケースに異なるモデルが必要な顧客行動の予測もできないでしょう。マシンラーニングは、問題をより広範囲に定義できるため、このようなタイプの問題解決に適しています。
マシンラーニングシステムが不要なのはどのような状況ですか?
ユースケースの中には、マシンラーニングモデルの作成に時間をかけずに、具体的なルールでプログラムを作成したほうがよい場合もあります。マシンラーニングモデルの作成には、データの収集と整理に多くの時間がかかり、また多くの計算も必要になります。
マシンラーニングはどのようにして使いやすくなったのですか?
最近では、マシンラーニングはデータサイエンティストの専門家だけのものではありません。より多くの人が、使用する製品に組み込まれた機能として、マシンラーニングを利用できるようになっています。たとえば、アドビでは、企業と製品の関係を最適化して、マシンラーニングをより広く利用できるようにしています。アドビのエンジニアとデータサイエンティストは、企業のユースケースにもとづいてマシンラーニングモデルをトレーニングします。そのモデルを製品に落とし込み、より便利で使いやすいものにします。
例えば、Adobe Creative CloudアプリケーションでAIを使用して、編集画像内のオブジェクトを識別する場合を考えてみましょう。アドビが開発したマシンラーニングモデルは、画像からオブジェクトを切り取るときに、そのオブジェクトの輪郭を描くことができます。このように、利用者はマシンラーニングモデルを作成しているわけではありませんが、マシンラーニングを利用して、ワークフローの高速化に役立てています。
マシンラーニングを利用している人が増えているもうひとつの理由は、企業が独自にモデルをトレーニングして、独自のモデルリポジトリを作成するようになったことです。企業は、自社のデータに合わせてカスタマイズした独自のユースケースを持っています。そのため、画一的なモデルではなく、独自のモデルをトレーニングする能力が求められています。
企業は、トレーニングを支援する機能として、自動マシンラーニング(Auto ML)を検討し始めています。データサイエンティストやマシンラーニングエンジニアは、Auto MLを使用して、モデルの学習プロセスの一部を自動化してトレーニングを高速化し、マシンラーニングを普及させるプログラムや技術を開発することができます。
マシンラーニングシステムを使うメリットは何ですか?
マシンラーニングの最大の利点は、手間のかかる作業を自動化して生産性を高めることにあります。さらに、企業では、マシンラーニングを使って製品を最適化し、顧客の手間を軽減しています。たとえば、アドビでは、マシンラーニングを活用した機能を生みだし、莫大なデータを処理して、最もパフォーマンスの高い顧客を把握するような終わることのない作業に、企業が時間を費やす必要がないようにしています。
また、マシンラーニングには、人間の処理能力では見当もつかないようなインサイトを発見できるというメリットもあります。
マシンラーニングアルゴリズムの欠点は何ですか?
マシンラーニングシステムの利用には、いくつかの欠点があります。ひとつは、効果的なマシンラーニングモデルの作成には大量のデータが必要になることです。データセットのサイズと品質は、モデルの良し悪しを決定する大きな要因です。しかし、データが多ければ多いほど、教師あり学習方法で使用するためのデータを正確にラベル付けするために時間がかかります。また、堅牢なモデルにするために、データセットに追加する様々なタイプのデータについても考慮する必要があります。人間がおこなう方法で意思決定をおこうように、学習させるからです。
マシンラーニングのもうひとつの欠点は、特にディープラーニングの場合、倫理に対する懸念があることです。モデルが判断を下す方法の多くは秘密にされているため、モデルがどの要素を使っているのか正確にはわかりません。そのため、モデルの予測が偏っているように思えることがあります。モデルの良し悪しは、入手するデータに依存しますが、モデルがどのような関係を発見するか、それが道徳的に公正であるかどうかは、まだ明確にはわからないでしょう。
マシンラーニングは今後、どのようになっていきますか?
将来的には、コンテンツ生成にマシンラーニングが大きな役割を果たすようになるでしょう。例えば、敵対的生成ネットワーク(GAN)と呼ばれるマシンラーニングでは、コンテンツを予測するだけではなく、実際にコンテンツを制作することができます。これは、「本物」と「偽物」のコンテンツに関わる倫理的な問題など、さらなる懸念を提起するものです。とはいえ、マーケターにとっては、キャンペーン用の広告を手動で作成するのではなく、モデルを使って複数の異なるバージョンを作成できるようになれば、大幅な時間の節約になります。