Chapter2 intelligent agent(知的エージェント)
-
Upload
soichiro-inatani -
Category
Technology
-
view
448 -
download
5
description
Transcript of Chapter2 intelligent agent(知的エージェント)
![Page 1: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/1.jpg)
Chapter 2知的エージェント
稲谷 壮一郎|Soichiro Inatnai
東京農工大学 大学院工学府 情報工学専攻 情報工学専修 1年
中川研究室所属
Artificial Intelligence - Modern Approach
![Page 2: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/2.jpg)
1はじめに
本章では,
1) 知的なエージェントが何をするか,
2) どのように環境に適応するか,
3) どのように評価するか,
4) どうやってエージェントを設計するか
について検討する.
![Page 3: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/3.jpg)
2知的エージェント
エージェントとは,ある環境でセンサで知覚し,ある環境に対してエフェクタを通して動作するもの.
Environment環境
Percepts知覚
Actions動作
図1 一般的なエージェントのモデル図
Sensorsセンサ
Agentエージェント
Effectorsエフェクタ
?
![Page 4: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/4.jpg)
3知的エージェント
ロボットをエージェントと考えると…
図2 H社のASIMO
センサ カメラ(視覚) 赤外線センサ(床面) 超音波センサ
エフェクタ 様々なモーター(関節各部)
環境物理的な現実空間
![Page 5: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/5.jpg)
4本書の目的
ある環境で「うまくやる」( = do a good job of acting)エージェントを設計すること.
Q.「うまくやる」って何?
A. 何を意味するか定義して,「うまくやる」エージェントを設計する方法について学ぶ.( の部分を考える)
Sensorsセンサ
Agentエージェント
Effectorsエフェクタ
?
?
![Page 6: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/6.jpg)
5どのように動作すべきか
合理的エージェント(rational agent)
⇒ 合理的に正しい動作をするエージェント.
「エージェントが最も成功する動作=正しい動作」
エージェントの成功は
”いつ,どのようにして“決定するの?
![Page 7: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/7.jpg)
6エージェントの評価
性能尺度(performance measure)
… エージェントがどれくらい成功したかを客観的に評価する基準
例:汚れた床を掃除するエージェントの場合
8時間ごとに片付けたゴミの量
使われた電気の量
発生した騒音 etc
![Page 8: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/8.jpg)
7合理的と全能(omniscience)
全能のロボットなら, 合理的な選択ができるか?
できる.だが,全能を実現することは不可能.
① 周りを見渡して車がいないことを確認.
② 横断歩道を横切る.
③ 空から飛行機のドアが落ちてきて潰される.
合理性は,分かっていることから
予測できる成功に関係している
不合理?
これは合理的な行動か?
![Page 9: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/9.jpg)
8「合理的である」とは
どんなときも「合理的である」ことは, 4つの事柄に依存する.
成功の度合を定義する性能尺度.
エージェントが知覚したもの全て.(この完全な知覚の履歴を知覚系列と呼ぶ.)
エージェントが環境について知っていること.
エージェントがとることのできる動作.
![Page 10: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/10.jpg)
9理想合理的エージェント
知覚系列のすべてに対して,知覚系列 と エージェント自身が持つ組込み知識に基づいて,性能尺度を最大にする動作を選択する.
合理性において,有用な情報を得るために動作をすることは重要.
① ②
- リスクの軽減
- 性能尺度の拡大
道路を渡るときは左右を見る.
知覚系列を持たない時計は合理的か(?)
![Page 11: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/11.jpg)
10知覚系列から動作への理想的マッピング
どんな 知覚系列 に対しても,それに応じて
エージェントが取るべき動作を特定できる.
理想的エージェントを設計できる.
例:知覚 x に対する平方根 z のマッピング
知覚(Percept) x 動作(Action) z
1.0 1.00000000
1.1 1.04880884
1.2 1.09544511
1.3 1.14017542… …
![Page 12: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/12.jpg)
11自律性(Autonomy)
エージェントの動作が完全に 組込み知識 に
基づいていて,知覚に注意を払う必要がないとき,
自律性 に欠けるという.
行動が自分自身の経験に基づいてなされるときに限り,
そのシステムは 自律的 である.
× 経験をほとんど持たない時は,
設計者が知識を与えなければデタラメに動作する.
![Page 13: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/13.jpg)
12エージェントの構造
エージェントプログラム
… エージェントの知覚から動作へのマッピングを実現する関数
エージェント=アーキテクチャ+プログラム
エージェントを設計する前に,
エージェントの性質を理解する必要がある.
知覚 Percept
ゴール Goal
動作 Action
環境 Environment
![Page 14: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/14.jpg)
13エージェントの構造
エージェントタイプ
知覚 P 動作 A ゴール G 環境 E
医療診断システム
症状,所見,
患者の応答質問,テスト,治療
健康な患者,
コストの最小化
患者, 病院
衛星画像解析システム
異なる強度のピクセル,
色
シーンのカテゴリの
印字
正しいカテゴリ化
人工衛星からの画像
部品移動ロボット
異なる強度のピクセル
部品を掴み,
箱に分類
部品を正しい箱に
入れる
部品を載せたベルトコ
ンベア
対話英語教師タイプされた単語列
練習問題,
示唆,
訂正の印字
学生のテストの点を最大にする
学生の集合
![Page 15: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/15.jpg)
14エージェントプログラム
骨格プログラム(skeleton program)
1. 新たに知覚を得ると内部情報を更新(記憶).
2. 知覚に基づき最良の動作を選択(マッピング).
3. 選択した動作の情報も内部に記憶.
エージェントプログラムが入力として得られる知覚は一つだけ?
ゴールや性能尺度は, 骨格プログラムに含まれない.
![Page 16: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/16.jpg)
15エージェントプログラムのタイプ
単純反射エージェント
記憶を持つ反射エージェント
ゴール主導エージェント
効率主導エージェント
単純低信頼
複雑高信頼
![Page 17: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/17.jpg)
16単純反射エージェント
現在の状態 に適合するルールを見つけて,そのルールに見合う動作を行う
例:前の車が減速した ブレーキを踏む
単純なため,適用できる範囲がとても狭い.
条件-動作ルール(condition-action rule)
![Page 18: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/18.jpg)
17単純反射エージェント
エージェント(Agent)
センサ
エフェクタ
環境
条件-動作ルール 今すべき動作は?
今の世界は?
![Page 19: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/19.jpg)
18記憶を持つ反射エージェント
内部状態(internal state) を用いることで,単純反射エージェントの適用範囲を広げたもの.(内部状態を持つ反射エージェントとも呼ぶ) 時間の経過とともに内部状態は更新される.
世界がどのように変化するかに関する情報
自身の行動が世界にどのような影響を与えるかに関する情報
例:車が車線変更を行う場合
「信号が見えた 車線変更する」という瞬間的な知覚だけでは不十分.
「近くに車が無いか」という状態を内部に保持.
その状態も考慮した上で車線変更するかを決定.
![Page 20: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/20.jpg)
19記憶を持つ反射エージェント
エージェント(Agent)
センサ
エフェクタ
環境
今すべき動作は?
今の世界は?
内部状態
世界の変化則
条件-動作ルール
自身の行動の影響
![Page 21: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/21.jpg)
20ゴール主導エージェント
環境の情報だけで意思決定を行うのは不十分.エージェントには ゴールに関する情報 が必要.
- 例:ゴール = 乗客の目的地
- タクシーの移動方向は目的地に依存する.
探索 や プラニング により動作を決定(3章以降)
未来に関する考慮を含む(条件-動作ルールとの根本的な違い)
「もしこの動作をしたら何が起きるのだろうか」
適応性・柔軟性が高い
What will happen if I do such-and-such?
![Page 22: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/22.jpg)
21ゴール主導エージェント
エージェント(Agent)
センサ
エフェクタ
環境
ゴール 今すべき動作は?
今の世界は?
行動を行うと?
内部状態
世界の変化則
自身の行動の影響
![Page 23: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/23.jpg)
22効率主導エージェント
より性能尺度の高い動作(列)を決定するために,効用関数 を用いる.
矛盾する目標(e.g.安全性 vs スピード)がある場合は,適切なトレードオフを指定する.
確実に目標を達成する動作列が存在しない場合,成功の見込みをゴールの重要性に対して,重み付けする方法をとる.
状態を幸せの度合を表す実数値へマッピングする
![Page 24: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/24.jpg)
23効率主導エージェント
エージェント(Agent)センサ
エフェクタ
環境
効用
今すべき動作は?
今の世界は?内部状態
世界の変化則
自身の行動の影響 行動を行うと?
その状態の幸福度は?
![Page 25: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/25.jpg)
24エージェントと環境
環境(Environment) とは,
「エージェントの外部にあって, エージェントの意思によって変更できないもの全てをさす」
(参考文献[2]より)
環境(シミュレータ)プログラム
… エージェントと環境を結びつける
1. 各エージェントに知覚を与える2. エージェントから動作を受け取る3. 環境を更新
![Page 26: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/26.jpg)
25環境の特徴
環境はいくつかの種類に分類できる.
アクセス可能 vs アクセス不能
決定的 vs 非決定的
エピソード的 vs 非エピソード的
静的 vs 動的
離散的 vs 連続的
異なった環境のタイプに応じて,その環境で効果的に働くためには, 異なったタイプのエージェントプログラムが必要.
右側の環境は複雑.
![Page 27: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/27.jpg)
26まとめ(1)
エージェントは,環境においてセンサで知覚してエフェクタで動作する.
理想的エージェントは,知覚系列と自身の知識に基づいて,性能尺度を最大にするような動作を選択する.
エージェントは,設計者が組み込んだ環境に関する知識よりも,自らの経験に依存して動作を選択する度合を備えた自律性を持つ.
![Page 28: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/28.jpg)
27まとめ(2)
エージェント=アーキテクチャ+プログラム
エージェントプログラムは,内部情報を更新しつつ,知覚から動作へのマッピングを行う.
エージェントプログラムの適切な設計は,知覚,動作,ゴール,環境 に依存する.
![Page 29: Chapter2 intelligent agent(知的エージェント)](https://reader034.fdocument.pub/reader034/viewer/2022052413/559b667d1a28ab2b3c8b476f/html5/thumbnails/29.jpg)
28参考文献
[1] エージェントアプローチ 人工知能
[2] マルチエージェントシステムの基礎と応用―複雑系工学の計算パラダイム 大内 東 (著), 川村 秀憲 (著), 山本 雅人 (著)