機械学習は本質的にアルゴリズムを使って、より正確な予測を行います。これらのアルゴリズムには以下のようなものがあります。
- ― データを用いて何が起きたかを解釈する
- ― データを用いて何が起きるかを予測する
- ― データを用いて取るべきアクションを提案する
アルゴリズムは3つの部分で構成されています。
- 意思決定プロセス 機械学習アルゴリズムの多くは、入ってくる情報を推測および整理するために使われます。提供されたデータに基づき、アルゴリズムはその中のパターンについて予測を行います。
- 誤差関数 この部分ではモデルの予測を評価します。すでに調べられた例がある場合、誤差関数はモデルの正確さを評価するために比較を行います。
- モデル最適化プロセス モデルがトレーニングセット内のデータポイントに簡単に適合できるように、重みを調整して、調べられた例とモデルの予測の間の差異を減らします。このプロセスはアルゴリズムによって繰り返され、精度がしきい値に達するまで重みが更新され続けます。
アルゴリズムがデータ活用を学ぶ方法はいくつかあり、機械学習には4つの主要なアプローチがあります。
教師あり学習
ラベル付きデータセットを用いてアルゴリズムを訓練するもので、この機械学習のサブカテゴリは与えられた情報に基づいて指示に従います。
マシンはラベル付きデータセットから情報を学習し、与えられた指示に従って出力を推測することが認められます。ラベル付きデータセットはすでに定義済みの入力と出力のパラメータを含んでおり、マシンはその入力と対応する出力を使って学習します。
教師あり学習はさらに2つの大きなカテゴリに分けられます。
- 分類 このアルゴリズムは、出力要素がカテゴリ的な分類問題に対応します。「はい/いいえ」や「真/偽」といった出力がその例です。 日常生活で使われる分類の例としては、メールアプリケーションのフィルタリング機能があり、受信トレイのメッセージとスパムボックスのメッセージを振り分けます。よく知られた分類アルゴリズムには、ロジスティック回帰アルゴリズム、サポートベクターマシンアルゴリズム、ランダムフォレストアルゴリズムなどがあります。
- 回帰 これらのアルゴリズムは、入力要素と出力要素が線形関係にある回帰問題を扱います。これらは、連続的な出力要素がどうなるかを予測します。その例としては、マーケット動向分析や天気予報があります。よく知られた回帰アルゴリズムには、単回帰、ラッソ回帰、多変量回帰などがあります。
教師なし学習
教師なし学習は、ラベル付けされていないデータセットを分析およびクラスタリングし、人間の介入なしにパターンを発見するために使われます。
教師なし機械学習プログラムは、ラベルなしデータを探索し、人間が意図的に探していないパターンを見つけ出します。たとえば、教師なし機械学習プログラムはwebストアの主要顧客層を特定することができます。よく知られた教師なし学習の手法には、最近傍法や自己組織化マップなどがあります。
教師なし学習の利点は、人間の介入なしにグループ間の類似点や相違点を見つけられることです。このアルゴリズムは、未整理のデータセットをパターンや違い、類似性に基づいてグループ化できます。
教師なし学習にはいくつかのサブ分類があります。
- クラスタリング この手法は、対象をそれぞれの違いや類似性といった基準に基づいてクラスターに分けます。その例として、購入商品によって顧客を整理することが挙げられます。
- アソシエーション この技術は、大規模データセット内の変数間の一般的な関係を特定します。データ項目の依存関係を決定し、関連する変数をグラフ化します。
半教師あり学習
その名の通り、教師あり学習と教師なし学習の要素を組み合わせたアプローチです。
半教師あり学習はラベル付きデータセットとラベルなしデータセットを読み込み、アルゴリズムを訓練します。両方のデータセットを組み合わせることで、それぞれ単独で使用した際に生じる問題を解消できます。さらに、半教師あり学習は小規模のラベル付きデータセットを利用して、大規模なラベルなしデータセットを導き、管理します。ラベルなしデータは入手コストが低く、取得の手間も少ないため、このようにデータセットを組み合わせるのが一般的です。
学生と教師の関係を考えてみましょう。学生が教師から情報を受け取る場合、それは教師あり学習にあたります。自宅で独学する場合は、教師なし学習にあたります。しかし、学生が自宅で学習した後に教室で教師と一緒に復習する場合、これは半教師あり学習に相当します。
日常生活における半教師あり機械学習の例としては、顔を識別するwebカメラがあります。
強化学習
強化学習は報酬システムを通じて訓練されます。試行錯誤を繰り返しながら学習し、成功した結果がレコメンデーションを強化します。教師あり学習のようにラベル付きデータはなく、この種の機械学習は、アクションのフィードバックプロセスを通じて経験から学習します。
強化学習は、経験から最適な行動を学び、それに応じてアクションを調整することで、最も適切なアクションを選択します。正しいアクションを取れば報酬が与えられ、誤った行動には罰則が科されます。これにより、システムは正しいアクションを学習していきます。
強化学習はビデオゲーム、ロボティクス、ナビゲーションで広く利用されています。たとえばビデオゲームでは、ゲームが環境を定義し、強化学習エージェントの行動ひとつひとつがそのエージェントの現在の状態を決定します。エージェントは、報酬や罰則といったフィードバックを受け、それがゲームスコアに影響します。
強化学習アルゴリズムには2種類あります。
- ポジティブ強化学習 これはエージェントがある行動を取った後に強化的要素を追加することで、その行動が将来再び起こる可能性を高めるものです。
- ネガティブ強化学習 これはネガティブな条件を取り除くことで特定の行動が再び起こる可能性を高めたり、望ましくない結果を回避する行動を強化したりするものです。