第 18 章 多智能体决策

  • 18.1 多智能体环境的特性
    • 18.1.1 单个决策者
    • 18.1.2 多决策者
    • 18.1.3 多智能体规划
    • 18.1.4 多智能体规划:合作与协调
  • 18.2 非合作博弈论
    • 18.2.1 单步博弈:正则形式博弈
    • 18.2.2 社会福利
    • 18.2.3 重复博弈
    • 18.2.4 序贯博弈:扩展形式
    • 18.2.5 不确定收益与辅助博弈
  • 18.3 合作博弈论
    • 18.3.1 联盟结构与结果
    • 18.3.2 合作博弈中的策略
    • 18.3.3 合作博弈中的计算
  • 18.4 做集体决策
    • 18.4.1 在合同网中分配任务
    • 18.4.2 通过拍卖分配稀缺资源
    • 18.4.3 投票
    • 18.4.4 议价

小结

  • 当环境中有其他智能体需要合作或竞争时,多智能体规划是必要的。我们可以制定联合规划,但如果两个智能体要就执行哪个联合规划达成一致,就必须以某种协调形式加以加强。
  • 博弈论描述的是在多个智能体相互作用的情况下,智能体的理性行为。博弈论之于多智能体决策,正如决策论之于单智能体决策。
  • 博弈论中的解概念旨在描述博弈的理性结果——如果每个智能体都采取理性行为的情况下可能出现的结果。
  • 非合作博弈论假设智能体必须独立做出决策。纳什均衡是非合作博弈论中最重要的解概念。纳什均衡是一种智能体没有动机偏离其指定策略的策略组合。我们有处理重复博弈和序贯博弈的技巧。
  • 合作博弈论考虑的是智能体为了合作而达成具有约束力的协约以形成联盟的设置。合作博弈中的解概念试图阐明哪些联盟是稳定的(核),以及如何公平分配联盟获得的值(沙普利值)。
  • 对于某些重要得多智能体决策类有专门的技术:任务共享的合同网,被用来有效地分配稀缺资源的拍卖,就共同利益进行议价以达成协约,以及聚集偏好的投票程序。

results matching ""

    No results matching ""