您正在使用IE低版浏览器，为了您的雷峰网账号安全和更好的产品体验，强烈建议使用更快更安全的浏览器

此为临时链接，仅用于文章预览，将在时失效

国际正文

发私信给李尊

发送

1

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

本文作者：李尊

2016-07-18 17:01

导语：微软研究院在IJCAI2016的Tutorial上讲述了自己将深度学习、深度神经网络应用于不同场景的情况，本文为第三部分—选中自然语言处理任务的连续表达。

微软研究院在IJCAI2016的Tutorial上讲述了自己将深度学习、深度神经网络应用于不同场景的情况，之前第二部分提到了深度学习在统计机器翻译和会话中的应用，本文为第三部分—选中自然语言处理任务的连续表达。

联合编译：Blake、章敏、陈圳

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达

l 针对信息检索和个人排序的深度语义相似模型（DSSM）
l 在连续语义自然语言处理任务环境中进行深度强化学习
l 针对字幕与视觉问题回答的多元语义学习&推理

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

对自然语言学习连续语义表达，例如：从原始语句到一个抽象语义矢量

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

在许多自然语言处理任务中Sent2Vec非常重要，它可以处理包括网页搜索、广告选取、文本排序、在线推荐、机器翻译、知识架构、问题回答、个性化推荐、图片搜索、图标注释等问题。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

监督问题：

虽然

l 需要学习的文本语义是隐藏的
l 且没有明确的目标学习模型
l 另外不知如何反向传播？

但是幸运的是

l 我们一般知道俩个文本是否“相似”
l 这就是语义表达学习的信号

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

深度架构语义模型

深度架构语义模型/深度语义相似模型，将整个句子转换成连续语义空间。例如：句子变成矢量
DSSM基于字符（非词汇）建立实为了其可拓展性和普适性
DSSM被训练来优化相似驱动对象

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

在字符级别进行编码，即词汇散列。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

在字符级别建立的DSSM，将任意词汇分解成一系列相关字符，倾向于处理大规模自然语言任务。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

DSSM：一个相似驱动Sent2Vec模型

初始化：神经网络使用随机权重进行初始化

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

训练：在语义矢量之间计算余弦相似度

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

运行时间

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

训练目标：基于余弦相似度的损失

使用网页搜索作为示例：

查询q与一系列文档D
目标：给定查询后点击文档的可能性

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

在DSSM中使用卷曲神经网络

在卷曲层对本地文本进行建模
在汇聚层对全局文本进行建模

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

模型在卷曲层捕捉本地本文相关词的意义，并学习了每个本地文本相关词的嵌入矢量。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

CDSSM:在最大汇聚层发生了什么？

将本地主题聚集起来形成全局化
识别最大聚集层的主要词汇/短语
在最大聚集层获得最活跃的神经元词汇

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

针对学习检索的DSSM，训练数据组搜索记录中的语义相关文本组。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

实验设定

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

卷曲深度语义模型取得最佳结果。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

语义匹配示例

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

卷积DSSM:

在卷积隐层一个接一个就行编码
隐层在最后一个词汇对整句进行语义编码
通过余弦相似驱动目标来训练模型

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

使用长短期记忆（LSTM）结果：

LSTM比常规RNN学得快得多
LSTM能有效代表使用矢量句子的语义信息

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

DSSM与Seq2Seq对比

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

给出一个特别用户的文章跨度代表利益实体，并寻找实体的补充文件。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

学习DSSM的语境实体次序

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

从网页浏览日志提取标签对，超链接指向维基百科P`时，P`中的H的锚文本，环境词汇，文本

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

语境实体搜索——实验设置：

1.训练/验证数据是维基页面中18M的用户点击量
2.评估数据：首先采样10k的网页文件作为源文件，然后使用文档中被命名的实体作为查询；第三保留100个返回文件作为目标文件，最后手动标记是否每一个目标文件都可以完好的描述实体。其中总共有870k标签对。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

语境实体搜索的结果

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

一些相关的工作：

深度CNN文本输入（文章中主要的分级任务）
序列到序列的学习；段落矢量（学习段落的矢量）
递归NN（树状结构如分解）
张量积代表（树状代表）
树状结构LSTM网络（树状结构LSTM）

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

强化学习的模型——包括环境状态设置S；行动设置A，以及状态之间的转换规则；状态转换的即时奖励规则和代理观察规则。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

Q-learning用于学习RL的政策（代理在给定的当前状态选择行动时必须遵循的规则）。其目的是找到MDP的最优政策，方法是：学习一个行动-价值函数，a.k.a。Q-函数：用于计算在训练收敛之后的状态上，所采取行动的期待效用。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

最近的成就：深度Q网络在玩五个Atari游戏时，达到了人类级别的性能。其中使用了卷积神经网络计算Q（s，a），并利用大的行动空间，忽略小的行动空间。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

最近的成就（续）：机器人AlphaGO打败了世界围棋冠军。它与深度Q网络设置类似，忽略小的行动空间，它的模型中建立了两个CNNs网络（policy网络和value网络）。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

语言理解的强化学习：以文本串的形式描述状态和行动，代理通过文本串做出相应正确的行动（正确指最大化长期奖励）。然后，环境状态转换到新的状态，代理也得到即时奖励。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

行动空间和状态空间都非常的巨大，而且行动的特征由无界神经语言描述确定。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

在NLP任务中，行动空间的特征由神经语言决定，它是离散的且近乎于无边界。我们提出了深度强化相关网络，将状态和空间都规划到连续的空间中，其中Q-函数是状态矢量和行为矢量的相关函数。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

学习连续空间的视觉化，图2表示了：嵌入状态矢量和相关行动矢量后200,400,600训练片段的文本PCA项目。状态指：当你向前移动时。你周围的人脸上露出了恐怖的表情，并逃离街道。行动1（好的选择）：向上看，行动2（不好的选择）：无视他人的警告继续前进。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

DRRN和DQN在两个文本游戏上的测试结果（学习曲线）

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

表展示了聚集后Q函数的示例值，且DRNN很好的概括了无法看见的行为。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

人类学习处理文本，图像和联合的信息。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

图像侧卷积网络实现过程

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

语言侧卷积网络实现过程

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

图像说明，通过深度学习模式检测图像中的关键概念，MELE从图像检测中产生解释。检测单词后，对其进行重新排列组成句子。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

CaptionBot示例

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

说明到回答问题的过程

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

堆积注意模式推理工程：问题模式，图像模式，多水平注意模式，回答预测器。

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

SAN图像模式

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

SAN中问题模式

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

回答示例

选中自然语言处理任务的连续表达 |微软IJCAI2016演讲PPT

总结：

本部分主要介绍通过DSSM学习Sent2Vec，在连续空间内对NLP任务进行强化学习以及视觉语言联合表达学习等概念。具体包括：

通过DSSM学习Sent2Vec：

DSSM把整个句子放在连续的空间内
基于特征字符级别建立DSSM
DSSM直接优化目标函数的语义相似度

在连续空间内对NLP任务进行强化学习：

使用深度神经网络把状态和行动（无边界NL决定）放入连续语义空间
在连续语义空间计算Q函数

视觉语言联合表达学习：

图像解释——CaptopnBot示例
视觉问题回答——关键在于推理

PS : 本文由雷锋网独家编译，未经许可拒绝转载！

via Microsoft IJCAI2016

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

1人收藏

分享：

相关文章

李尊

编辑

扫描关注作者微信

发私信

当月热门文章

最新文章

热门搜索

高通 LeiPhone Oculus 抖音新能源平板双十一 Kindle Fire Galaxy S4 Verizon CES 2015

为了您的账户安全，请验证邮箱

您的邮箱还未验证,完成可获20积分哟！

重发邮箱修改邮箱

请验证您的邮箱

立即验证

完善账号信息

您的账号已经绑定，现在您可以设置密码以方便用邮箱登录

立即设置 以后再说