您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
业界 正文
发私信给付静
发送

0

用 AI 预测未来靠谱吗?全球 160 个研究团队参赛 5 个月得到答案

本文作者:付静 2020-04-08 18:37
导语:即便是最准确的预测结果也与实际情况存在差距。

我们的人生轨迹可能受家庭、社会、时代影响,也因大大小小的决定被改变。我们无法预知的未来,AI 可以准确地预测吗?

来自普林斯顿大学、加州大学洛杉矶分校、麻省理工学院、弗吉尼亚理工大学等机构的 160 个研究小组参与了“脆弱家庭挑战赛”(Fragile Families Challenge),通过建立统计和机器学习模型,试图预测、衡量美国各地儿童、父母及其家庭的人生轨迹,寻求上述问题的答案。

当地时间 2020 年 3 月 30 日,这一挑战赛的研究成果在线发表于《美国国家科学院院刊》,论文题为 Measuring the predictability of life outcomes with a scientific mass collaboration(通过科学合作探究人生轨迹的可预测性),合著者多达 112 位。

用 AI 预测未来靠谱吗?全球 160 个研究团队参赛 5 个月得到答案

来自 4000 余个家庭的大样本数据集

实际上,探究人生轨迹,更像是一个社会学问题。这不仅仅是预测未来那么简单,它在提供家庭援助、了解社会僵化程度、改善相关政策方面都有一定的参考意义。

这一研究基于一个名为“脆弱家庭与儿童健康研究”(Fragile Families and Child Wellbeing Study)的高质量出生队列数据集——由社会科学家 15 年来收集的大样本数据集,包含来自 4000 多个家庭的 1.3 万个数据点。

研究人员对出生于 1998-2000 年间美国大城市的儿童进行了研究,其中未婚父母所生儿童的占比较大。不难看出,这一纵向研究的目的也在于了解出生在未婚家庭的孩子的生活。

具体来讲,随着孩子年龄的增长,相关数据总共收录了 6 个阶段的情况——小孩刚出生时、1 岁、3 岁、5 岁、9 岁和 15 岁。

值得一提的是,每个年龄段数据收集的范围不同。比如,孩子刚出生时,仅仅收集父母的调查访谈信息;孩子 9 岁时,需要对父母、孩子的主要照顾者(如果不是父母的话)、老师和孩子自己都进行调查访谈,进而收集信息(如下图)。

用 AI 预测未来靠谱吗?全球 160 个研究团队参赛 5 个月得到答案

此外,针对不同年龄段,研究人员对数据的关注方向不一。

例如,孩子刚出生时,对母亲的采访主要涉及儿童健康与发展、父母关系、父亲身份、父母对婚姻的态度、与家人的关系、环境和政策因素、健康状况、人口特征、教育程度、就业及收入情况;而在孩子 9 岁时,对孩子本人的采访主要涉及的话题有父母关系、父母的要求及督促孩子的情况、与兄弟姐妹的关系、日常生活、在校情况、青少年犯罪倾向、任务完成和行为表现及健康、安全状况。

脆弱家庭挑战赛

实际上,这一名为“脆弱家庭挑战赛”的项目可以说是一款游戏——游戏开发者是项目组织者,玩家是参与进来的各个研究团队。

而游戏设定是,项目组织者不公开上述家庭中孩子们 15 岁时的数据,各个研究团队可利用任意的 AI 模型高能玩法准确预测孩子们 15 岁时的人生发展。开发者为玩家提供了 6 种衡量维度,如孩子们的平均学习成绩、孩子们的毅力、家庭经济水平、孩子的主要照顾者的工作和接受培训情况等,玩家需要预测其中的至少一个维度。

如下图,这一研究的背景数据包括来自 4242 个家庭的孩子刚出生时、1 岁、3 岁、5 岁和 9 岁时的共 12942 个变量。而训练数据即是孩子们 15 岁时的 6 种人生轨迹。

用 AI 预测未来靠谱吗?全球 160 个研究团队参赛 5 个月得到答案

实际上,这一游戏设计思路正是计算机科学领域常用的一种研究设计方法「共同任务法」。

雷锋网(公众号:雷锋网)了解到,项目组织者收到了来自全球 68 所大学的 457 份申请,最终这一项目由全球 160 个研究小组协同开展。挑战赛于 2017 年 3 月 5 日至 2017 年 8 月 1 日展开,参与者只要将预测结果上传至挑战赛官网即可。

用 AI 预测未来靠谱吗?全球 160 个研究团队参赛 5 个月得到答案

【脆弱家庭挑战赛官网】

在脆弱家庭挑战赛结束后,组织者将 160 个团队的结果进行分析比较,发现各团队使用了不同的数据处理、统计学习等技术来生成预测,虽然各个团队得到的预测结果之间相差不大,但各预测结果普遍与真实情况差距较大,即便是最准确的预测结果也与训练数据的实际情况存在不小的差距

如下图,研究团队对家庭经济水平、孩子们平均学习成绩的平均预测准确度在 0.2 上下浮动,而对其他几种维度的预测准确度平均约 0.05(雷锋网注:值越接近 1,吻合程度越高;越接近 0,则吻合程度越低)。

用 AI 预测未来靠谱吗?全球 160 个研究团队参赛 5 个月得到答案

当然不可否认的是,各团队对部分预测也是准确的,比如具体某个孩子的学习成绩。

用 AI 预测未来靠谱吗?全球 160 个研究团队参赛 5 个月得到答案

目前看来,我们可以回答文章开头的那个问题了——AI 并不能很准确地预测人生轨迹。

这一结论对 AI 模型在刑事司法、儿童保护服务等场景的应用带来了启示,同时社会学家、数据科学家今后也应谨慎使用 AI 预测模型。正如普林斯顿大学和哥伦比亚大学 “脆弱家庭与儿童健康研究”首席研究员 Sara McLanahan 所说:

结果令人大开眼界,要么运气在我们的生活中扮演着重要角色,要么我们作为社会科学家在研究中忽略了一些重要变量。

引用来源:

[1] https://www.eurekalert.org/pub_releases/2020-03/puww-pto032520.php

[2] https://www.eurekalert.org/pub_releases/2020-03/vt-pto032720.php

[3] https://www.pnas.org/content/early/2020/03/24/1915006117

[4] https://www.fragilefamilieschallenge.org/

雷锋网

雷锋网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

文章点评:

表情
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说