教師あり学習と教師なし学習: 違い、利点、使用例

公開: 2025-01-17

機械学習 (ML) は、画像認識や自動運転車など、私たちが日常的に利用している多くのテクノロジーを強化します。教師あり学習と教師なし学習という 2 つの基本的なアプローチが、これらのシステムのバックボーンを形成します。どちらも ML モデルをトレーニングするための鍵ですが、方法論、目標、アプリケーションが異なります。

このガイドでは、これら 2 つのアプローチを比較し、その違いを強調し、その利点と課題を探ります。また、さまざまなタスクにどれが最適かを理解するのに役立つ実際のアプリケーションについても説明します。

教師あり学習とは何ですか?
教師なし学習とは何ですか?
教師ありと教師なし: 主な違い
教師あり学習と教師なし学習の利点
教師あり学習と教師なし学習の課題
教師あり学習と教師なし学習の応用
結論

教師あり学習とは何ですか?

教師あり学習では、ラベル付きデータを使用して ML システムをトレーニングします。この文脈では、「ラベル付き」とは、各トレーニングサンプルが既知の出力とペアになっていることを意味します。これらのラベルは専門家によって作成されることが多く、システムが入力と出力の関係を学習するのに役立ちます。トレーニングが完了すると、教師ありシステムはこれらの学習された関係を新しい未確認のデータに適用して、予測や分類を行うことができます。

たとえば、自動運転車のコンテキストでは、教師あり学習システムがラベル付きビデオデータを分析する可能性があります。これらの注釈は道路標識、歩行者、障害物を識別し、システムが現実の運転シナリオで同様の特徴を認識して対応できるようにします。

教師あり学習アルゴリズムは、次の 2 つの主要なカテゴリに分類されます。

分類:これらのアルゴリズムは、電子メールをスパムまたは非スパムとして識別するなど、新しいデータにラベルを割り当てます。
回帰:これらのアルゴリズムは、過去の実績に基づいて将来の売上を予測するなど、連続的な値を予測します。

データセットが増大し、計算リソースが向上するにつれて、監視対象システムはより正確かつ効果的になり、不正行為検出や医療診断などのアプリケーションをサポートします。

教師あり学習について詳しくはこちら→

教師なし学習とは何ですか?

対照的に、教師なし学習では、ラベル付けされた例を使用せずにデータを分析し、統計アルゴリズムに依存して隠れたパターンや関係を明らかにします。教師ありシステムとは異なり、これらのモデルは構造を推論し、新しい情報が利用可能になるとその結果を動的に更新します。教師なし学習はパターン発見には優れていますが、通常、予測タスクにはそれほど効果的ではありません。

具体的な例としては、ニュースアグリゲーションサービスがあります。これらのシステムは、外部ラベルを付けることなく、ニュース速報イベントに関する関連記事とソーシャルメディア投稿をグループ化します。リアルタイムで共通点を特定することで、教師なし学習を実行して重要なストーリーを強調します。

以下に、特殊な教師なし学習アルゴリズムをいくつか示します。

クラスタリング:これらは、消費者をセグメント化し、行動の変化に応じてセグメントを調整するために使用されます。
関連性:これらは、セキュリティ侵害を示す可能性のある異常の特定など、データ内のパターンを検出します。
次元削減:これらは重要な情報を維持しながらデータ構造を簡素化し、複雑なデータセットの圧縮と視覚化によく使用されます。

教師なし学習は、ラベル付きデータが利用できないシナリオでの探索的データ分析と洞察の発見に不可欠です。

教師なし学習について詳しくはこちら→

教師ありと教師なし: 主な違い

教師あり学習と教師なし学習は、ML において異なる役割を果たします。これらのアプローチは、データ要件、人間の関与、タスク、およびアプリケーションが異なります。以下の表はこれらの違いを示しており、さらに詳しく見ていきます。

	教師あり学習	教師なし学習
入力データ	ラベル付きデータが必要です	ラベルのないデータが必要です
客観的	入力特徴に基づいて出力ラベルを予測または分類する	データ内の隠れたパターン、構造、または表現を発見して更新します
人間の関与	大規模なデータセットにラベルを付けるための多大な手作業と、特徴の選択に関する専門家の指導	最小限だが非常に特殊な人間の介入。主に、アルゴリズムパラメーターの設定、大規模なリソース使用の最適化、およびアルゴリズムの研究に使用されます。
主なタスク	回帰、分類	クラスタリング、関連付け、次元削減
一般的なアルゴリズム	線形回帰およびロジスティック回帰、デシジョンツリー、ニューラルネットワーク	K 平均法クラスタリング、主成分分析 (PCA)、オートエンコーダー
出力	新しいデータポイントを分類または回帰できる予測モデル	データのグループ化または表現 (クラスター、コンポーネントなど)
アプリケーション	スパム検知、不正検知、画像分類、価格予測など	顧客セグメンテーション、マーケットバスケット分析、異常検知など

トレーニング段階での違い

2 種類のアルゴリズムの主な違いは、依存するデータセットの種類です。教師あり学習は、大量のラベル付きデータセットからメリットを得ることができます。その結果、最先端の監視付きシステムは、データを選別してラベルを生成するために、大規模で専門性のない人間の作業に依存しています。また、ラベル付きデータは通常、処理に多くのリソースを消費するため、監視付きシステムはスケールの上限ではそれほど多くのデータを処理できません。

教師なし学習システムは、より小さなデータセットで効果を発揮し始め、同じリソースではるかに大量のデータを処理できます。大規模で専門的でない人間の労働に依存しないため、データの取得と処理が容易になります。トレードオフとして、システムは通常、予測タスクに関してそれほど高い精度を達成せず、効果を発揮するには専門的な作業に依存することがよくあります。精度が重要な場合に使用されるのではなく、データの変化に応じて大規模にデータ内のパターンを推論および更新するために使用されることが多くなります。

導入時の違い

教師あり学習アプリケーションには通常、より多くのラベル付きデータを大規模に取得するためのメカニズムが組み込まれています。たとえば、電子メールユーザーは、受信メッセージがスパムかどうかを簡単にマークできます。電子メールプロバイダーは、マークされたメッセージをトレーニングセットに蓄積し、スパム検出用のロジスティック回帰システムをトレーニングできます。これらは、導入時により迅速な意思決定を得るために、より長くリソースを大量に消費するトレーニングと引き換えになります。ロジスティック回帰システム以外の一般的な教師ありトレーニングアルゴリズムには、予測と意思決定、および複雑なパターン認識に広く使用されているデシジョンツリーとニューラルネットワークが含まれます。

教師なしシステムは、大量の非構造化データが関係する問題に適用される場合に優れています。一時的な場合でもデータ内のパターンを検出できるため、教師あり学習のトレーニングが完了する前に検出する必要があります。たとえば、教師なし学習システムの一種であるクラスタリングアルゴリズムは、トレンドの変化に応じて消費者セグメントを検出して更新できます。トレンドがまだ見たことのない新しいパターンに移行した場合でも、再トレーニングのためのダウンタイムを必要とせずに、その関連性は維持されます。

教師なし学習の例は、金融における主成分分析 (PCA) の使用です。 PCA は、大規模な投資グループに適用できるアルゴリズムで、グループの新たな特性を推測して更新するのに役立ちます。これらには、投資リスクの最も重要な原因や収益に影響を与える可能性のある要因など、重要な財務指標が含まれます。教師なし学習システムの他の一般的なタイプはオートエンコーダーです。これは、多くの場合、他の ML アルゴリズムが適用される前の準備ステップとして、データを圧縮および単純化します。

Grammarly で賢く仕事をする

仕事を持つすべての人のための AI ライティングパートナー

教師あり学習と教師なし学習の利点

教師ありシステムと教師なしシステムはどちらも、人間の補助なしの場合を超える規模と速度でデータを処理するのに役立ちます。ただし、さまざまな用途に最適です。以下に、その主な利点のいくつかを対比します。

監視対象システム

重要な履歴データが利用可能な場合の Excel
既知の構造、特性、パターンを持つデータをトレーニングする場合、教師なしシステムよりもはるかに優れています。
データの既知の特性を大規模に検出して適用するのに最適です
人間にとって理解され直感的に意味のある結果を生み出すことができる
新しいデータやまだ見たことのないデータに対してより高い精度が得られる
監視されていないシステムよりも迅速かつ大規模な予測が可能

監視されていないシステム

データ内のこれまで見たことのない、または未知の構造と関係を特定することに特に優れています。
データがあまり構造化されておらず、その特性があまり知られていない場合に効果的です
監視対象システムが適切に機能しない一部の状況で動作する (たとえば、データが利用できない状況、またはデータは利用可能だが人間によって処理されていない状況)
同等の量のデータを扱う監視下システムよりも、トレーニング中に必要なリソースと時間が少なくなります
データが多すぎて監視付きシステムでうまく処理できない場合にトレーニングして使用できる

教師あり学習と教師なし学習の課題

監視ありシステムと監視なしシステムはそれぞれ異なるトレードオフを行い、直面する課題もまったく異なる場合があります。以下では主な違いをいくつか取り上げます。

監視対象システム

人間が処理した大量のデータへのアクセスが必要ですが、それは時々しか利用できない、または簡単に入手できます
多くの場合、より長く、より多くのリソースを必要とするトレーニング段階が発生します
コアデータの特性が変化した場合、すぐに適応するのが難しい場合がある
ビデオやオーディオなどの本質的に非構造化データを処理する際に課題に直面する

監視されていないシステム

新しいデータの例にうまく一般化できないパターンをより頻繁に検出します
監視付きシステムと同じくらい正確にするのが難しい場合がある
これらは人間が解釈するのが難しい結果を生成し、これらの結果の解釈はより主観的になる可能性があります。
現実世界で行われる予測ごとに、より多くの時間とリソースがかかる可能性がある

教師あり学習と教師なし学習の応用

アプリケーションや問題の中には、教師あり学習システムで最もよく対処できるもの、教師なしシステムで最もよく対処できるもの、およびブレンドを使用して最もよく対処できるものがあります。よく知られた例を 3 つ紹介します。

混合学習システムと半教師あり学習

実際のアプリケーションのほとんどは、教師ありモデルと教師なしモデルを組み合わせて使用することに注意することが重要です。学習システムは、予算、データの可用性、パフォーマンス要件、エンジニアリングの複雑さなどに基づいて組み合わせられることがよくあります。場合によっては、両方のアプローチの利点を融合しようとする学習アルゴリズムの特殊なサブセット、つまり半教師あり学習も使用されることもあります。以下の例では、使用される可能性が最も高いシステムまたは主要なシステムを呼び出します。

交通量予測（監視あり）

交通量の予測は難しい課題です。幸いなことに、都市は道路交通量を定期的に監査して記録しているため、ラベル付きデータが大量に入手可能です。教師あり学習の一種である回帰アルゴリズムは、このデータに簡単に適用でき、トラフィックフローの非常に正確な予測を生成できます。彼らの予測は、道路建設、交通標識、信号機の配置に関する意思決定に役立ちます。この段階では、教師なしアルゴリズムはあまり効果的ではありません。ただし、道路構造の変更が実施された後に蓄積される交通データに基づいて実行することはできます。その時点で、これまでに発見されていない新たな問題が発生する可能性があるかどうかを自動的に特定し、推測するのに役立ちます。

遺伝的クラスタリング (教師なし)

遺伝子データの分析は、データ量が大きく、ほとんどのデータが十分に分析されていないため、時間がかかり、面倒な場合があります。遺伝子やその他の遺伝的構成要素がゲノムのどこに保存されているのか、それらがどのように解読され解釈されるのかなど、遺伝データに何が含まれているかについては、多くの場合、あまりわかっていません。教師なしアルゴリズムは、大量のデータを処理できるため、この問題に特に関連します。データの量を計算し、そのデータにどのようなパターンが含まれているかを自動的に推測します。また、似たような遺伝情報を個別のクラスターに収集するのにも役立ちます。遺伝データが類似性に基づいてクラスター化されると、クラスターは簡単に処理およびテストされ、どのような生物学的機能 (存在する場合) に役立つのかを特定できます。

LLM と強化学習 (混合)

大規模言語モデル (LLM) は、教師なし学習システムと教師あり学習システムを組み合わせたアプリケーションの例です。初期システムである LLM は、通常、監視されていないシステムの一例です。 LLM を生成するには、大規模なデータ (たとえば、インターネット上で入手可能なすべての英語テキスト) が教師なしシステムによって分析されます。システムはデータから多くのパターンを推測し、英語で会話するための基本的なルールを開発します。

ただし、LLM が行う推論は、会話において典型的な人間のように聞こえるようにするのには十分ではありません。また、コミュニケーションに対する個人の好みを考慮するのにも役立ちません。教師ありシステム、特にユーザーからの注釈付きフィードバックを使用する強化システム (人間のフィードバックからの強化学習、略して RLHF と呼ばれます) は、この問題を解決する 1 つの方法です。 RLHF を訓練済みの LLM に適用すると、一般に人間とうまく会話できるようになります。また、個人の好みを学習し、特定の人が好む方法で話すこともできます。

結論

要約すると、教師あり学習と教師なし学習は ML の 2 つの基本的なサブセットであり、それぞれに独自の強みがあります。教師あり学習は、ラベル付きデータが豊富で、事前トレーニングに十分なリソースがあり、迅速でスケーラブルな意思決定が必要なシナリオに優れています。一方、教師なし学習は、データ内の隠れた構造や関係を明らかにする場合、特にラベル付きデータやトレーニングリソースが限られており、意思決定により多くの時間と複雑さを対応できる場合に威力を発揮します。両方のアプローチの利点、課題、ユースケースを理解することで、それらをいつどのように効果的に適用するかについて情報に基づいた決定を下すことができます。