# 第一章 Introduction & 第二章 Intelligent Agents ## 第一章 Introduction ### AI 的四種觀點 1. 像人類思考 (Think like humans):認知模型 (Cognitive Model) - 研究大腦內部活動,模擬人類思考方式 - 包括心理學與神經科學路線 2. 像人類行為 (Act like humans):圖靈測試 (Turing Test) - 機器是否能表現出類似人類的智能行為? 3. 理性思考 (Think rationally):思維定律 (Laws of Thought) - 亞里斯多德第一個提出的邏輯推理作為智能的基礎 - 研究理性思考的邏輯規則 - 包括數學與邏輯路線 4. 理性行為 (Act rationally):理性代理人 (Rational Agent) - 做出能最大化目標達成的行動,即便不需要思考(例如反射動作) - 代理人是一個可以感知和行動的實體,即一個函數 $f: P* \to A$ ## 第二章 Intelligent Agents ### Agent 定義 可以觀察環境並採取行動的任何實體都是 agent - 透過 sensors 感知環境 - 透過 actuators 執行行動 - Agent = 架構 + 程式 理性 agent 應該選擇一個預期能夠最大化其績效指標的行動 #### 範例 - 人類: - Sensors:眼耳鼻舌、其他感官 - Actuators:手腳、嘴巴、其他器官 - 機器人: - Sensors:相機、麥克風等 - Actuators:馬達、伺服器等 ### PEAS PEAS 是用來描述 agent 的一種方法,包含以下四個要素: - Performance measure(績效指標) - Environment(環境) - Actuators(執行器) - Sensors(感測器) #### 範例 設計自動駕駛計程車的 PEAS: - Performance measure:安全、快速、守法、舒適、最大化利潤 - Environment:道路、交通規則、其他車輛 - Actuators:方向盤、油門、煞車、喇叭、燈號 - Sensors:相機、雷達、時數表、GPS、里程表、引擎感測器 醫療診斷系統的 PEAS: - Performance measure:Healthy patient, minimize costs, lawsuits - Environment:Patient, hospital, staff - Actuators:Screen display (問題、測試、診斷、處方) - Sensors:Keyboard ### 環境的類型 - Fully observable vs. Partially observable - Agent 使否可以完全感知環境的狀態 - Fully observable:可以完全感知 - Partially observable:只能部分感知 - Deterministic vs. Stochastic - 環境的狀態是否只由當前狀態與 agent 的行動決定 - Deterministic:確定的 - Stochastic:隨機的 - Episodic vs. Sequential - 環境的狀態是否會影響後續的行動 - Episodic:每個行動都是獨立的 - Sequential:每個行動都會影響後續的行動 - Static vs. Dynamic - 在 agent 做出下一個行動之前,環境是否會改變 - Static:環境不會隨著時間改變 - Dynamic:環境會隨著時間改變 - Discrete vs. Continuous - 環境、行動的型態 - Discrete:離散的(有限的) - Continuous:連續的(無限的) - Single-agent vs. Multi-agent - 不只是單純看有沒有其他 agent,而是看 agent 的行動是否會影響其他 agent 的行動 - Single-agent:只有一個 agent - Multi-agent:有多個 agent #### 範例 | | 西洋棋 (有計時器) | 西洋棋 (沒有計時器) | 自動駕駛 | | :--------------: | :---------------: | :-----------------: | :------: | | Fully observable | 是 | 是 | 否 | | Deterministic | 是 | 是 | 否 | | Episodic | 否 | 否 | 否 | | Static | Semi (一半) | 是 | 否 | | Discrete | 是 | 是 | 否 | | Single-agent | 否 | 否 | 否 | ### 代理人類型 - Simple reflex agent:簡單反射代理人 - 只根據當前的感知做出對應的行動 - 例如:自動駕駛車輛的避障系統 - Model-based reflex agent:基於模型的反射代理人 - 加入了內部狀態,考量世界的變化 - 根據當前的感知和內部狀態做出行動 - 例如:自動駕駛車輛的導航系統 - Goal-based agent:基於目標的代理人 - 根據目標決定行動 - 例如:自動駕駛車輛的路徑規劃系統 - Utility-based agent:效用導向代理人 - 根據「最有利」的狀態選擇行動 - 例如:自動駕駛車輛的最佳路徑規劃系統 - Learning agent:學習代理人 - 可根據經驗學習與改進行為 - 例如:自動駕駛車輛的深度學習系統