用 AI 预测未来靠谱吗？全球 160 个研究团队参赛 5 个月得到答案

本文作者：付静

2020-04-08 18:37

导语：即便是最准确的预测结果也与实际情况存在差距。

我们的人生轨迹可能受家庭、社会、时代影响，也因大大小小的决定被改变。我们无法预知的未来，AI 可以准确地预测吗？

来自普林斯顿大学、加州大学洛杉矶分校、麻省理工学院、弗吉尼亚理工大学等机构的 160 个研究小组参与了“脆弱家庭挑战赛”（Fragile Families Challenge），通过建立统计和机器学习模型，试图预测、衡量美国各地儿童、父母及其家庭的人生轨迹，寻求上述问题的答案。

当地时间 2020 年 3 月 30 日，这一挑战赛的研究成果在线发表于《美国国家科学院院刊》，论文题为 Measuring the predictability of life outcomes with a scientific mass collaboration（通过科学合作探究人生轨迹的可预测性），合著者多达 112 位。

用 AI 预测未来靠谱吗？全球 160 个研究团队参赛 5 个月得到答案

来自 4000 余个家庭的大样本数据集

实际上，探究人生轨迹，更像是一个社会学问题。这不仅仅是预测未来那么简单，它在提供家庭援助、了解社会僵化程度、改善相关政策方面都有一定的参考意义。

这一研究基于一个名为“脆弱家庭与儿童健康研究”（Fragile Families and Child Wellbeing Study）的高质量出生队列数据集——由社会科学家 15 年来收集的大样本数据集，包含来自 4000 多个家庭的 1.3 万个数据点。

研究人员对出生于 1998-2000 年间美国大城市的儿童进行了研究，其中未婚父母所生儿童的占比较大。不难看出，这一纵向研究的目的也在于了解出生在未婚家庭的孩子的生活。

具体来讲，随着孩子年龄的增长，相关数据总共收录了 6 个阶段的情况——小孩刚出生时、1 岁、3 岁、5 岁、9 岁和 15 岁。

值得一提的是，每个年龄段数据收集的范围不同。比如，孩子刚出生时，仅仅收集父母的调查访谈信息；孩子 9 岁时，需要对父母、孩子的主要照顾者（如果不是父母的话）、老师和孩子自己都进行调查访谈，进而收集信息（如下图）。

用 AI 预测未来靠谱吗？全球 160 个研究团队参赛 5 个月得到答案

此外，针对不同年龄段，研究人员对数据的关注方向不一。

例如，孩子刚出生时，对母亲的采访主要涉及儿童健康与发展、父母关系、父亲身份、父母对婚姻的态度、与家人的关系、环境和政策因素、健康状况、人口特征、教育程度、就业及收入情况；而在孩子 9 岁时，对孩子本人的采访主要涉及的话题有父母关系、父母的要求及督促孩子的情况、与兄弟姐妹的关系、日常生活、在校情况、青少年犯罪倾向、任务完成和行为表现及健康、安全状况。

脆弱家庭挑战赛

实际上，这一名为“脆弱家庭挑战赛”的项目可以说是一款游戏——游戏开发者是项目组织者，玩家是参与进来的各个研究团队。

而游戏设定是，项目组织者不公开上述家庭中孩子们 15 岁时的数据，各个研究团队可利用任意的 AI 模型高能玩法准确预测孩子们 15 岁时的人生发展。开发者为玩家提供了 6 种衡量维度，如孩子们的平均学习成绩、孩子们的毅力、家庭经济水平、孩子的主要照顾者的工作和接受培训情况等，玩家需要预测其中的至少一个维度。

如下图，这一研究的背景数据包括来自 4242 个家庭的孩子刚出生时、1 岁、3 岁、5 岁和 9 岁时的共 12942 个变量。而训练数据即是孩子们 15 岁时的 6 种人生轨迹。

用 AI 预测未来靠谱吗？全球 160 个研究团队参赛 5 个月得到答案