エージェントと環境
AIシステムは、エージェントとその環境から構成されます。 エージェントはその環境で行動します。 環境には他のエージェントが含まれることがあります。
※エージェントとは、IT用語でPCに常駐するプログラムです。
人間のエージェントは、センサに目、耳、鼻、舌、皮膚などの感覚器官、エフェクタに手、脚、口などの他の器官があります。
ロボットエージェントは、センサーにカメラと赤外線レンジファインダー、エフェクターにさまざまなモーターとアクチュエーターがあります。
ソフトウェアエージェントは、プログラムのアクションとしてビット列を出力データ化します。
合理性とは、妥当で賢明であり、判断の良い感覚を有するという状態に過ぎない。合理性は、エージェントが認識していることに応じて期待される動作と結果に関係しています。 有用な情報を得ることを目的とした行動を実行することは、合理性の重要な部分です。
理想的な合理的なエージェントは、期待されるパフォーマンスを最大にするための行動を実行することができ、
エージェントの合理性は、次の4つの要素に依存します。
成功の程度を決定するパフォーマンス指標 。
今までのエージェントの知覚した順序。
環境に関するエージェントの事前知識 。
エージェントが実行できるアクション 。
合理的エージェントは常に正しいアクションを実行します。ここで、正しいアクションとは、エージェントが与えられた知覚した順番で最も成功するアクションを意味します。 エージェントが解決する問題は、パフォーマンス測定、環境、アクチュエータ、およびセンサー(PEAS)によって特徴付けられます。
エージェントの構造は、
彼らは自分の行動を選択するために世界のモデルを使用します。 彼らは内部状態を維持します。
モデル - 世界で何が起こるかに関する知識。
内部状態 - これは、知覚履歴に依存する現在の状態の観察されない側面の表現です。
状態を更新するには、
彼らは目標を達成するために行動を選択します。 目標をベースにしたアプローチは、決定をサポートする知識が明示的にモデル化され、それにより修正を可能にするので、反射エージェントよりも柔軟性がある。
彼らは、各州の嗜好(効用)に基づいて行動を選択する。 ときに目標は不十分です -
矛盾する目標があり、そのうち僅かしか達成できません。
ゴールには達成の不確実性があり、ゴールの重要性に対する成功の可能性を測る必要があります。
一部のプログラムは、キーボード入力、データベース、コンピュータファイルシステム、および画面上の文字出力に限定された完全に人工的な環境で動作します。
対照的に、ソフトウェアエージェント(ソフトウェアロボットまたはソフトボット)の中には、豊富で無制限のソフトボットドメインに存在するものがあります。 シミュレータは非常に詳細で複雑な環境を持っています。 ソフトウェアエージェントは、リアルタイムで長い一連のアクションから選択する必要があります。 顧客のオンライン設定をスキャンして興味のあるアイテムを顧客に提示するように設計されたソフトボトルは、 実際の環境と人工環境で動作します。
最も有名な人工環境はチューリング・テスト環境であり、実際の人工エージェントと他の人工エージェントが同じ地上でテストされます。 これは非常に困難な環境であり、ソフトウェアエージェントが人間と同様に実行することは非常に困難です。
システムの知的な動作の成功は、チューリングテストで測定できます。テストには2名の人と評価対象のマシンが参加します。 2人のうち1人がテスターの役割を果たします。 彼らはそれぞれ別の部屋に座っています。 テスターは、誰が機械であり、誰が人間であるかを知らない。 彼は入力して両方の知能にそれらを送ることによって質問を尋問し、彼はタイプされた応答を受け取る。
このテストは、テスターをだますことを目指しています。 テスターが人間の応答から機械の応答を決定できない場合、機械は知的であると言われる。
環境には複数のプロパティがあります。離散/連続 - 環境の明確で明確な状態の数が限られている場合、環境は離散的です(例えばチェス)。 それ以外の場合は継続的です(たとえば運転)。
観察可能/部分観察可能 - 知覚から各時点で環境の完全な状態を判定することが可能である場合、観察可能である。 そうでなければ部分的にしか観察できない。
静的/動的 - エージェントが動作しているときに環境が変化しない場合は、静的です。 それ以外の場合は動的です。
単一のエージェント/複数のエージェント - 環境には、エージェントと同じ種類または異なる種類のエージェントが含まれている場合があります。
アクセス可能/アクセス不能 - エージェントの感覚装置が環境の完全な状態にアクセスできる場合、環境はそのエージェントにアクセス可能です。
決定論的/非決定論的 - 環境の次の状態が、現在の状態およびエージェントの動作によって完全に決定される場合、環境は決定論的である。 それ以外の場合は非決定論的です。
エピソード的/非エピソード的 - エピソード的な環境では、各エピソードは、知覚するエージェントと、次に行動するエージェントからなる。 そのアクションの質は、エピソード自体にのみ依存します。 後続のエピソードは、前のエピソードの動作に依存しない。 エピソード的な環境は、エージェントが先に考える必要がないため、ずっと簡単です。