コンピューターがデータからパターンを学習して予測、推奨、決定を行う方法

機械学習

機械学習は、コンピューターシステムがルールごとに明示的にプログラムされるのではなく、データからパターンを学習する人工知能の分野です。これは、レコメンデーション、検索ランキング、不正検出、音声認識、医療画像ツール、予測、翻訳、ロボティクス、および多くの最新の AI システムを強化します。

核となるアイデア

データからパターンを学習する

主な種類

教師あり、教師なし、強化学習

用途

予測、分類、ランキング、制御

データ点からパターンを学習する人工ニューラルネットワークの可視化。 — 機械学習システムはデータからパターンを学び、予測、推薦、分類、意思決定を支援します。元のサイトで画像を見る

機械学習とは

機械学習は、例、経験、フィードバックから学習することでタスクを改善するコンピューターシステムを構築する方法です。すべてのルールを手作業で記述する代わりに、開発者はモデルを選択し、データを提供し、目的を定義して、アルゴリズムに内部パラメーターを調整させます。その結果、予測を行ったり、入力を分類したり、オプションをランク付けしたり、パターンを検出したり、新しい状況でのアクションを選択したりできるシステムが誕生します。

データからの学習の仕組み

機械学習プロジェクトは通常、画像、テキスト、トランザクション、センサーの読み取り値、医療スキャン、クリック、音声、その他の記録などのデータから始まります。モデルは、入力を出力に接続するパターン、またはデータ内の構造を明らかにするパターンを探します。トレーニング中に、システムはその出力を目標またはフィードバック信号と比較し、エラーを減らすためにシステム自体を更新します。モデルは受け取ったサンプルの中に隠された近道、ギャップ、バイアスを学習することが多いため、優れたデータが重要です。

教師あり学習

教師あり学習では、ラベル付きの例が使用されます。モデルは、スパムまたはスパムではないとマークされた電子メール、住宅と販売価格の組み合わせ、または医療画像と診断の組み合わせから学習する可能性があります。分類ではカテゴリを予測し、回帰では数値を予測します。ビジネスや科学の問題の多くは、利用可能な機能から既知のターゲットを予測するものとして組み立てることができるため、教師あり学習が一般的です。

教師なし学習と自己教師あり学習

教師なし学習では、明示的なラベルのない構造を探します。類似した顧客をグループ化したり、異常な行動を検出したり、複雑なデータをより単純な表現に削減したり、隠れたパターンを明らかにしたりできます。自己教師あり学習では、欠落している単語や画像部分の予測など、データ自体からトレーニング信号を作成します。現代の言語モデルと視覚モデルの多くは、特定のタスクに適応する前に自己教師あり手法を使用します。

強化学習

強化学習は、エージェントが報酬とペナルティを通じて意思決定を行えるように訓練します。このシステムはアクションを調査し、結果を観察し、長期的な報酬を最大化しようとします。これは、ゲーム、ロボット工学、リソース割り当て、推奨戦略、および制御の問題に役立ちますが、実際の環境は騒音が多く、安全性が重視され、実験には費用がかかるため、難しい場合があります。

トレーニング、テスト、評価

トレーニングデータでは良好なパフォーマンスを示すモデルでも、新しいデータでは失敗する可能性があります。そのため、機械学習では検証セット、テストセット、ベンチマーク、エラー分析、モニタリングが使用されます。評価はタスクによって異なります。分類には精度が重要ですが、実際のシステムでは、精度、再現率、キャリブレーション、公平性、遅延、堅牢性、およびコストがより重要になる場合があります。目標は単にハイスコアを獲得することではありません。これは現実的な条件下では信頼できる動作です。

導入とリスク

機械学習は、製品、職場、病院、銀行、学校、交通機関、公共システムに導入されると重要になります。リスクには、偏った結果、プライバシーの漏洩、過信、脆弱なセキュリティ、不十分な説明可能性、データのドリフト、フィードバックループ、誤用が含まれます。責任あるチームは、データソースを文書化し、制限をテストし、リスクが高い場合には人間の関与を維持し、リリース後のパフォーマンスを監視し、重要な決定に異議を唱えたり理解したりするための有意義な方法をユーザーに提供します。

なぜそれが重要なのか

機械学習が重要なのは、データを大規模な自動化された支援に変えるからです。不正行為の検出、言語の翻訳、コンテンツの推奨、分子の発見、需要の予測、作物のストレスの特定、配送ルートの特定、科学データの分析、生成 AI の強化に役立ちます。ただし、それは魔法ではありません。これは一連の統計的および計算的手法であり、その価値はデータの品質、慎重な目標、適切な評価、および人間の判断に依存します。

重要な用語

モデル入力を出力にマッピングする数学的または計算システム。
トレーニングデータ学習中にモデルを調整するために使用される例。
特徴モデルによって使用される入力信号または測定値。
ラベル教師あり学習におけるターゲットの答え。
一般化トレーニング例を超えて、新しいデータに対してモデルがどの程度うまく機能するか。

一般的なタスク

分類スパムか非スパムなどのカテゴリに入力を割り当てます。
回帰価格、需要、温度などの数値を予測します。
クラスタリング事前定義されたラベルを使用せずに類似した例をグループ化します。
ランキング関連性、有用性、または可能性によって項目を並べ替えます。
異常検出エラー、不正、または障害を示す可能性のある異常なパターンを特定します。

モデルファミリー

線形モデルは、多くの予測タスクにとってシンプル、高速、便利なベースラインです。
デシジョンツリーとランダムフォレストは、データをルールのような分岐に分割します。
勾配ブースティングは、多くの場合、構造化されたビジネスデータや表形式のデータに対して適切に実行されます。
ニューラルネットワークは学習された表現の層を使用し、深層学習の多くを強化します。
トランスフォーマーは、現代の言語、視覚、およびマルチモーダルシステムで広く使用されているニューラルアーキテクチャです。

尋ねるべき質問

モデルは実際にどのような決定や予測をサポートしているのでしょうか?
トレーニングデータは代表的なもので、最新のもので、合法的で、倫理的に使用できますか?
どのような種類のエラーが最も有害で、そのコストは誰が負担するのでしょうか?
現実世界が変化したとき、モデルはどのように監視されるのでしょうか?
人間はいつモデルの出力をレビュー、オーバーライド、または監査すべきでしょうか?