您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
新鲜 正文
发私信给格林
发送

7

发表政治演讲的,也可以是人工智能

本文作者:格林 2016-01-20 18:13
导语:政治演讲大多千篇一律,它引导我们去思考一个有趣的问题:有没有可能让机器自动撰写政治演讲稿呢?

发表政治演讲的,也可以是人工智能

不要问国家为你做了什么,而要问你为国家做了什么?

——肯尼迪(1961年)

上面这样经典的政治演讲少之又少,普普通通的演讲倒是很多,比如美国国会的辩论演讲。这些演讲大多千篇一律,都遵循标准的格式,重复相似的论调,甚至使用一样的短语来表述特定的政治立场和观点。看起来好像背后有一套算法在决定它的内容。 

于是它引导我们去思考一个有趣的问题:有没有可能让机器自动撰写政治演讲稿呢?

美国马萨诸塞大学研究人员Valentin Kassarnig为我们带来了答案,他开发了一套撰写政治演讲稿的人工智能(AI)机器算法,机器写出的讲稿几乎可以以假乱真。

分析文本预测单词

从表面上看,基本原理还是很简单的。Kassarnig首先建了一个数据库,从53场美国国会辩论中抽取4000个政治演讲片断,编成一套“机器学习”算法,让它自动撰写稿件。这些政治演讲由5万多个句子组成,平均每个句子包涵23个单词。凯斯塞宁将演讲按政党进行分类,比如哪些是民主党的,哪些是共和党的,看它们是否赞同或者反对某个特定的主题。

魔鬼在于细节,分析数据库是最大的挑战。在尝试了许多种技术之后,Kassarnig最终采用了基于“N-grams(元语法模型即马尔可夫模型)”的方法。他首先用词类法分析文本,也就是用语法规则来给每一个词语和短语作标志(标为名词、动词、形容词等)。然后分析第6个词或者短语,根据前5个词或者短语判断第6个词或者短语最有可能是什么。Kassarnig说:“只要看它前面是5个是什么,我们就可以很快确定所有的单词。”

在分析词的过程中演讲稿会同步生成。Kassarnig需要告诉算法写什么类型的演讲稿,比如是给民主党写还是给共和党写。算法最开始会按给定的类别搜索6个词或者短语组成的数据库,然后用5个词或者短语作为起点来撰写演讲稿。

算法的写作从随机选择的5个词或者短语开始,然后选择可以与之相关联的下一个单词。Kassarnig说:“跟着系统就会自动一个接一个地预测单词,并最终预测演讲的结尾。”

整个过程有一些技巧。例如,算法会知道演讲中最可能出现的特定主题是什么,然后它会挑选其它主题嵌入到演讲中去,它还要决定如何修饰这些主题。

机器的政治写作水平挺高

下面是机器写的一则民主党讲稿:

“议长先生,多年来,因为受到破产法的保护,诚实而不幸的消费者可以为自己的案子进行申诉了,最终他们合理而有效地偿还了债务。系统所采用的方法是管用的,破产法院会评估各种情况,如收入、资产、债务,从而决定哪些债务应该偿还,决定消费者如何自力更生。让我们支持增长和机会,请通过这项立法。”

写出来的文稿还算通顺,毕竟Kassarnig的人工智能算法还没有接受过训练,它只是在最开始时作了标记,并对政治演讲按6个词组或者短语进行过一番分析。他用一些标准对演讲稿进行评估,比如检查语法正确性、句子过渡、讲稿结构和内容,评估发现机器写的东西很不错。Kassarnig说:“特别值得欣慰的是讲稿的语法很正确,句子过渡也非常流畅。”

尽管如此,让机器算法走上政治舞台,Kassarnig并不乐观:“尽管算法的确可以为政治家撰写演讲稿,但它的结果不太可能好。”愿意使用这套算法的政客没几个。

幸好算法还可以用来撰写其它类型的文本,比如新闻,只要根据同样的事件给它们提供一些故事就可以了。它还可以用来写博客,只要为它准备一个很大的数据库,在里面装满相似的文章就行了。 

凯斯塞宁希望大家都来试一试,他已经将源代码发布在GitHub上,快去试下吧。

via techreview

雷峰网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说