人工知能.com

2017年6月11日

人工知能とエージェント

エージェントと環境

　AIシステムは、エージェントとその環境から構成されます。エージェントはその環境で行動します。環境には他のエージェントが含まれることがあります。

※エージェントとは、ＩＴ用語でＰＣに常駐するプログラムです。

エージェントとは、センサを介して環境を認識し、エフェクタを介してその環境に作用するものです。

人間のエージェントは、センサに目、耳、鼻、舌、皮膚などの感覚器官、エフェクタに手、脚、口などの他の器官があります。
ロボットエージェントは、センサーにカメラと赤外線レンジファインダー、エフェクターにさまざまなモーターとアクチュエーターがあります。
ソフトウェアエージェントは、プログラムのアクションとしてビット列を出力データ化します。

エージェントの用語

エージェントのパフォーマンス測定

　エージェントがどの程度成功したかを判断する基準です。

エージェントの振る舞い

　与えられた一連の知覚の後にエージェントが実行する動作です。

パーセプト（Percept）

　あるインスタンスにおけるエージェントの知覚的入力である。

知的エージェント

　エージェントが日付までに知覚したすべての履歴です。

エージェント機能 - 教訓から行動へのマップです。

合理性

合理性とは、妥当で賢明であり、判断の良い感覚を有するという状態に過ぎない。合理性は、エージェントが認識していることに応じて期待される動作と結果に関係しています。有用な情報を得ることを目的とした行動を実行することは、合理性の重要な部分です。

理想的なエージェントとは何ですか？

理想的な合理的なエージェントは、期待されるパフォーマンスを最大にするための行動を実行することができ、

その知覚順序
その内蔵の知識ベース

エージェントの合理性は、次の4つの要素に依存します。

成功の程度を決定するパフォーマンス指標。
今までのエージェントの知覚した順序。
環境に関するエージェントの事前知識。
エージェントが実行できるアクション。

合理的エージェントは常に正しいアクションを実行します。ここで、正しいアクションとは、エージェントが与えられた知覚した順番で最も成功するアクションを意味します。エージェントが解決する問題は、パフォーマンス測定、環境、アクチュエータ、およびセンサー（PEAS）によって特徴付けられます。

知的エージェントの構造

エージェントの構造は、

エージェント=アーキテクチャ　+　エージェントプログラム
アーキテクチャ=エージェントが実行する機械
エージェントプログラム=エージェント機能の実装

シンプルなレフレックスエージェント

彼らは現在の知覚に基づいてのみ行動を選択する。
正しい決定が現在の教訓に基づいてのみなされた場合にのみ合理的です。
彼らの環境は完全に観察可能です。

モデルベースの反射エージェント

彼らは自分の行動を選択するために世界のモデルを使用します。彼らは内部状態を維持します。

モデル - 世界で何が起こるかに関する知識。

内部状態 - これは、知覚履歴に依存する現在の状態の観察されない側面の表現です。

状態を更新するには、

どのように世界が進化するか。
エージェントの行動が世界にどのように影響するか。

目標に基づくエージェント

彼らは目標を達成するために行動を選択します。目標をベースにしたアプローチは、決定をサポートする知識が明示的にモデル化され、それにより修正を可能にするので、反射エージェントよりも柔軟性がある。

ユーティリティベースのエージェント

彼らは、各州の嗜好（効用）に基づいて行動を選択する。ときに目標は不十分です -

矛盾する目標があり、そのうち僅かしか達成できません。
ゴールには達成の不確実性があり、ゴールの重要性に対する成功の可能性を測る必要があります。

一部のプログラムは、キーボード入力、データベース、コンピュータファイルシステム、および画面上の文字出力に限定された完全に人工的な環境で動作します。

対照的に、ソフトウェアエージェント（ソフトウェアロボットまたはソフトボット）の中には、豊富で無制限のソフトボットドメインに存在するものがあります。シミュレータは非常に詳細で複雑な環境を持っています。ソフトウェアエージェントは、リアルタイムで長い一連のアクションから選択する必要があります。顧客のオンライン設定をスキャンして興味のあるアイテムを顧客に提示するように設計されたソフトボトルは、実際の環境と人工環境で動作します。

最も有名な人工環境はチューリング・テスト環境であり、実際の人工エージェントと他の人工エージェントが同じ地上でテストされます。これは非常に困難な環境であり、ソフトウェアエージェントが人間と同様に実行することは非常に困難です。

チューリングテスト

システムの知的な動作の成功は、チューリングテストで測定できます。テストには2名の人と評価対象のマシンが参加します。 2人のうち1人がテスターの役割を果たします。彼らはそれぞれ別の部屋に座っています。テスターは、誰が機械であり、誰が人間であるかを知らない。彼は入力して両方の知能にそれらを送ることによって質問を尋問し、彼はタイプされた応答を受け取る。

このテストは、テスターをだますことを目指しています。テスターが人間の応答から機械の応答を決定できない場合、機械は知的であると言われる。

環境には複数のプロパティがあります。

離散/連続 - 環境の明確で明確な状態の数が限られている場合、環境は離散的です（例えばチェス）。それ以外の場合は継続的です（たとえば運転）。
観察可能/部分観察可能 - 知覚から各時点で環境の完全な状態を判定することが可能である場合、観察可能である。そうでなければ部分的にしか観察できない。
静的/動的 - エージェントが動作しているときに環境が変化しない場合は、静的です。それ以外の場合は動的です。
単一のエージェント/複数のエージェント - 環境には、エージェントと同じ種類または異なる種類のエージェントが含まれている場合があります。
アクセス可能/アクセス不能 - エージェントの感覚装置が環境の完全な状態にアクセスできる場合、環境はそのエージェントにアクセス可能です。
決定論的/非決定論的 - 環境の次の状態が、現在の状態およびエージェントの動作によって完全に決定される場合、環境は決定論的である。それ以外の場合は非決定論的です。
エピソード的/非エピソード的 - エピソード的な環境では、各エピソードは、知覚するエージェントと、次に行動するエージェントからなる。そのアクションの質は、エピソード自体にのみ依存します。後続のエピソードは、前のエピソードの動作に依存しない。エピソード的な環境は、エージェントが先に考える必要がないため、ずっと簡単です。