AAAI 2018 五个论文奖全部揭晓，「记忆增强的蒙特卡洛树搜索」获杰出论文

本文作者：杨晓凡

2018-02-05 16:26

专题：AAAI 2018

导语：五篇论文简单介绍

雷锋网 AI 科技评论消息，第 32 届 AAAI 大会（AAAI 2018）日前在美国新奥尔良拉开帷幕，会议时间为 2 月 2 日至 7 日。

作为人工智能领域最悠久、涵盖内容最广泛的学术会议之一，历届 AAAI 都吸引了全世界的人工智能相关领域的研究者参与，会议的论文内容也丰富多彩。近年来参加 AAAI 的中国学者和以及投稿 AAAI 的中国论文也都有明显增加，这也印证了 AAAI 对中国学者们的吸引力。实际上，来自中国的论文投递数在 2017 年为 785 篇，仅以微弱优势超越美国，但在今年实现了 58％的惊人提升，以 1242 篇论文当仁不让地成为 AAAI 2018 的「学术论文第一产地」。但从录用论文的数量来说，中美两国仍然不相上下，均有 260 余篇论文被收录，可见来自中国的投稿数虽然有了大幅提升，但在质量上仍然有进步的空间。

AAAI 2018 今年共收到论文投稿 3808 篇，接受论文 938 篇，接受率 24%。大会评出杰出论文、杰出学生论文各一篇，杰出论文提名、杰出学生论文提名各一篇，以及经典论文一篇。尽管《Memory-Augmented Monte Carlo Tree Search》获得杰出论文的消息早已传播开来，但论文内容还是直到上周末才公开发表；另外，这篇来自阿尔伯塔大学的论文的三位作者中也有两位是华人。

论文获奖介绍

杰出论文 Outstanding Paper：《Memory-Augmented Monte Carlo Tree Search》

记忆增强的蒙特卡洛树搜索
论文摘要：这篇论文提出并评估了记忆增强蒙特卡洛树搜索（M-MCTS），这一方法为在线实时搜索提出了一种新的利用泛化性的方式。记忆增强蒙特卡洛树搜索的关键思路是把蒙特卡洛树搜索和一个记忆结构组合起来，记忆结构中的每个存储位置都可以包含某个特定状态的信息。通过综合类似的状态的估计结果，这些记忆可以生成逼近的估计值。作者们展示了，在随机情况下，基于记忆的逼近值有更高可能性比原始的蒙特卡洛树搜索表现更好。作者们也在围棋游戏中评估了记忆增强蒙特卡洛树搜索，实验结果表明，在同样的模拟步数下记忆增强蒙特卡洛树搜索也比原始版本有更好的表现。
论文地址：https://webdocs.cs.ualberta.ca/~mmueller/ps/2018/Chenjun-Xiao-M-MCTS-aaai18-final.pdf

杰出学生论文 Outstanding Student Paper：《 Counterfactual Multi-Agent Policy Gradients》

反事实多智能体策略梯度
论文摘要：许多现实世界中的问题，比如网络数据包的路由，或者自动驾驶汽车之间的协调，都可以很自然地看作合作性的多智能体系统问题来建模。这就对新的强化学习方法提出了强烈的需求，以便为这些系统高效地学习到区中心化的运行策略。出于这个目的，作者们提出了一种新的多智能体的“执行者-批评者”方法：反事实多智能体策略梯度（COMA）。COMA 中使用一个中心化的批评者估计Q函数和区中心化的执行者，从而优化智能体的运行策略。除此之外，为了解决多智能体间互相建立信任的问题，它使用了一个会把单个智能体的动作边缘化的反事实基准线，同时还能保证其它智能体的动作不变。COMA 中使用了一个批评式的表征，从而使得这个反事实基准线可以在单个前馈流程中进行高效的计算。作者们在星际争霸游戏的单位控制测试环境中评估了 COMA 的表现，使用了非常便于分别观察的去中心化变量。与这个环境下的其它多智能体执行者-批评者方法相比，COMA 的平均表现有显著提高，而且 COMA 得到的最好的智能体的表现可以和顶尖的具有全状态数据的中心化控制方法相提并论。
论文地址：https://arxiv.org/abs/1705.08926

杰出论文提名 Outstanding Paper, Honorable Mention：《Generalized Adjustment Under Confounding and Selection Biases》

对选择偏倚和混杂偏倚的泛化调节处理方法
论文摘要：选择偏倚和混杂偏倚是限制常见推理方法在大尺度环境下使用的最常见的两个障碍。在这篇论文中，作者们泛化了后门调节的想法，以便同时处理这两种偏倚，并且在不引入选择偏倚的情况下利用可能的外部数据（比如来自人口调查的数据）。作者们介绍了调节对（adjustment pair）的思路，并展示了通过调节方法识别因果关系的完整图形条件。作者们还进一步设计了一个算法，以多项式形式列出所有可以处理的调节对，对于希望评估以部分可处理的调节对的特定属性（常见属性包括开销、变化、测量难度）的研究人员来说这会很有用。最后，作者们描述了一种统计性的估计过程，一旦确认了某个设置是可以处理的就可以执行这个过程；它可以用来处理有限样本中的多种问题。
论文地址：https://pdfs.semanticscholar.org/023a/a92487c037a7557b9b74e894003725afd00a.pdf

杰出学生论文提名 Outstanding Student Paper, Honorable Mention：《Adapting a Kidney Exchange Algorithm to Align with Human Values》

改造出和人类的价值一致的肾脏分配算法
论文摘要：如何高效分配有限的资源是经济学和计算机科学两个领域共有的经典问题。对于肾脏移植手术来说，通常会由一个中央市场把一切正常的肾脏捐赠者分配给等待肾脏的病人。在肾脏分配中，病人和捐赠者首先由委员会通过特设的权重决定优先级，然后输入一个分配算法，由它决定哪个病人会分配到哪个捐赠者 —— 以及决定哪个病人分配不到捐赠者。在这篇论文中，作者们提出了一种端到端的方法用于在肾脏分配中根据每个病人的档案估计权重。作者们首先从人类被试者获取了一组他们认为可以用于决定病人优先级的属性（比如医疗特征，生活方式等等）。然后作者们根据不同病人的档案向被试者提问对比问题，并根据他们的回答严格地计算出各个属性的权重。作者们展示了如何在肾脏分配市场的分配算法中使用这些权重。作者们接着在模拟环境下评估了这些权重的影响，发现他们算出的权重的精确值其实影响很小，实际上需要的只是由权重计算出的档案的排序。不过，与完全不给病人排优先级的情况相比，带有权重的算法还是取得了更好的表现，确实有部分类别的病人从前述的测试者的价值评价中获得了优先匹配（或者延后匹配）。
论文地址：https://users.cs.duke.edu/~conitzer/kidneyAAAI18.pdf

经典论文 Classic Paper：《Algorithm and Tool for Automated Ontology Merging and Alignment》

自动本体合并和对齐的算法及工具
这篇论文来自 2000 年的第 17 届 AAAI 大会。这次颁奖是为了表彰这篇论文在本体匹配和集成研究方面的先驱性贡献，论文中分析了这个问题的具体情况，并提出了首个创新的解决方案。
论文地址：https://www.aaai.org/Papers/AAAI/2000/AAAI00-069.pdf
论文作者 Natasha Fridman Noy 应邀在会议上进行了演讲，介绍了论文内容以及这个问题研究的后续变迁，雷锋网 AI 科技评论也将为大家整理呈现演讲内容。请期待后续报道。

雷锋网 AI 科技评论报道

AAAI 2018全揭秘：1242篇中国投递论文领跑全球，录用数和美国平分秋色

AAAI 2018 六大前瞻亮点抢先看，BATJ、滴滴聚首学术顶会｜AAAI 2018

AAAI 2018，腾讯AI Lab 11篇录用论文全解读