什么是互联网图形？——首席研究员童欣 | 微软亚洲研究院院友会

本文作者：李尊

2016-11-17 20:20

导语：什么是互联网图形？什么是Internet Graphics？

雷锋网按：本文根据童欣博士在微软亚洲研究院院友会成立仪式上所做报告《网络图形，从交互到智能》编辑整理而来，在未改变原意的基础上略有删减。

童欣，微软亚洲研究院首席研究员，研究主管。童欣博士1996年毕业于浙江大学获硕士学位，1999年毕业于清华大学获博士学位并于同年加入微软亚洲研究院。童欣博士的研究方向为真实感绘制、表观建模、纹理合成以及人体动画捕捉。童欣博士曾任Computer Graphics Forum编委，SIGGRAPH Asia 2008、2009，SIGGRAPH Asia 2011，SIGGRAPH 2012， SIGGRAPH Asia 2013论文Committee成员，Pacific Graphics 2013论文主席。

什么是互联网图形？——首席研究员童欣 | 微软亚洲研究院院友会

事情要从15年前说起，2001年的时候，Harry（沈向洋）和百宁（郭百宁）决定要成立一个新的图形组，那么就需要有一个很酷的组名，于是他们决定叫做“互联网图形组”。

名字起得很好，问题也马上来了：基本上每个见到我们的人都问什么是Internet Graphics？

为了回答这个问题，在2001年的时候我们集中全组的力量做了第一个项目，Game Download & Play。

这项目我们想把游戏图形的数据、几何、纹理做一些压缩，那么通过互联网下载的时候，大家就不用等那么长的下载时间了，很快把一部分数据下载到本地之后，大家就可以开始玩游戏了。

这项目可以说非常成功。这之后我们顺利地开始做SIGGRAPH……

转眼到了2010年，百宁把接力棒交给我，让我慢慢开始负责整个图形组，那么我要怎样激励大家、我们组里应该有什么样的愿景。

我也开始思考这些问题，重新在问自己到底什么是互联网图形？

什么是互联网图形？——首席研究员童欣 | 微软亚洲研究院院友会

如果我们看看周围，可以看到很多成功的例子。

Internet与文字结合时效果很好：出现了网络文学、微博、Wikpedia等。
Internet与图片结合时效果也很好：出现了Instagram、美图秀秀、500px等。
Internet与视频结合时效果也很好：出现了Youtube、爱奇艺、网络直播、网红等。

回头再看看Graphics，却好像什么都没发生，就这样过了十年，那么到底出了什么问题呢？

有传言说，如果你站在风口，就算你是一头猪也能飞起来。可是我这么瘦的一个人，站了这么久，怎么还没飞起来，这到底出了什么问题？

我做了一些粗浅的研究，认真想了一想。我发现，飞起来这件事，不是什么都可以，要满足两个条件：

第一、要Everyone

内容最好是每一个人都能产生、都能创造，那么有了网络大家就可以互相交流，你的内容就会有海量增长。

第二、要Everywhere

随着移动平台的发展，如果你这个内容的产生和消费能互联到每一个平台上，让大家在任何地方都能生产消费，这时候你就真的飞起来了。

什么是互联网图形？——首席研究员童欣 | 微软亚洲研究院院友会

那么我们看看图形学到底是个什么状况？

答案很悲惨：在Everyone方面，三维内容的生产，对普通用户而言还是非常难的任务。

最左边大家可以看到传统的造型动画软件，界面很复杂，即使是艺术家也需要好几年的学习才能做好一个模型。另一方面，虽然我们有一些设备帮助大家来做三维内容的捕捉，比如三维扫描仪、光穹、动捕等等，但这些设备都非常昂贵，每个要几百万，还需要专门的场地和专业的操作，普通用户享受不到。

什么是互联网图形？——首席研究员童欣 | 微软亚洲研究院院友会

现状：

我们再看看Everywhere，发展了这么多年，所有三维图形的内容都是通过一个二维的屏幕来传递给大家的——某种意义上来讲，我们的内容和2D的视频就没有太大的区别。

我们的交互就不用提了，我们还得通过鼠标、键盘或者gamepad进行交互，这些交互跟我们在真实三维世界中所做的交互是非常不同的。

由于这些限制，大家就会发现：

到现在为止，图形的生产和消费基本和互联网无关，基本的方式还是少数的艺术家，他们组织在一起，经过艰苦的奋斗，做了一些游戏、电影，然后把东西通过市场分发给成千上万的消费者进行消费。一切还是停留在传统的模式。

什么是互联网图形？——首席研究员童欣 | 微软亚洲研究院院友会

愿景：

基于这样的想法，我们就提出了我们互联网图形组的愿景：

我们希望做一些图形学的工具和系统，能帮助每个人很方便地产生、观看和分享一些三维内容。同时，我们希望能在自然世界和虚拟世界间提供更自然的界面和交互的方式。
另外我们还想在可视的和不可视的抽象信息之间提供一些自然的界面，把抽象的信息变成可视的展现出来。

什么是互联网图形？——首席研究员童欣 | 微软亚洲研究院院友会

过去五年我们为了这一愿景做了很多不同方面的研究，慢慢意识到也许基于智能或者数据的方法是个很好的解决方案。

原因有下面几个：

第一，我们已经有了一些昂贵的设备，这些设备帮助我们捕捉了大量高质量的数据。
第二，我们也有了比较便宜的设备，这些设备可以为我们的系统提供一个初始的输入，不用从零开始了。
第三，一些关于机器学习方面的技术进展可以让我们把这些技术用到图形学的问题里。

什么是互联网图形？——首席研究员童欣 | 微软亚洲研究院院友会

那么也许一个比较好的解决方案是通过低价普及的设备，比如普通相机和深度相机，加上智能的算法，再有些时候需要一些简单的用户输入，来方便地产生三维的内容。

关于智能算法，我们希望它能做两件事：

一是希望能够利用到所有三维数据的本征特性，用这些帮助我们产生内容。
二是可以用机器学习来进行端到端的学习，在输入和输出之间直接建立一些联系。

下面我用我们组研究的一个研究课题三维物体的数字化来进一步说明举例。

三维物体数字化的目标是希望将一个真实世界的三维物体，完美地传递扫描进一个虚拟世界。

为做到这一点，我们不仅仅要捕捉三维物体的几何形状，还要重现它的材质信息。注意，有了几何信息虽然可以知道物体形状，却不知道这个物体是什么，只有有了物体材质表面反射属性以后，我们才能在三维世界中真正栩栩如生地体现出来，大家就会的清楚知道这是真实世界的一个啤酒瓶，上面有一个纸标签，标签上有烫金字……

我想我不需要再说明这样一个工具对VR/AR内容的产生、或者对虚拟购物等应用是多么重要。

什么是互联网图形？——首席研究员童欣 | 微软亚洲研究院院友会

现在我们回想现有的解决方案是什么？

基本上我们可以发现这流水线还是非常长的。
首先用设备扫描三维几何形状，但是扫描得到的这些几何形状在大部分情况下非常糟糕，需要大量人工交互工作来去除噪声、平滑三维模型。
材质捕捉就更麻烦了，我们需要把物体挪到专用的捕捉室，放在专用的设备上，捕捉物体在各种光照、各种视点下的外观，有了这些才能采集出真正的物体形状和材质。
大家可以发现这样一个基本的任务还是有很多障碍，首先去噪方面需要很多手工交互工作，其次材质捕捉设备很昂贵，另外这个流水线很长，需要分开的步骤去先捕捉几何，再用另外的设备捕捉材质。

什么是互联网图形？——首席研究员童欣 | 微软亚洲研究院院友会

那么我们看看我们用一些智能的算法能帮我们做什么事情：

第一个要介绍给大家的是我们去年研发出来的一个数据驱动的模型去噪算法。

这里要做的是希望有个自动的算法，帮我们除去扫描模型上的噪音，同时保留模型上面所有的几何细节，并且算法对不同设备扫描出来的模型都能很好的处理。我们的算法通过收集带噪声的扫描模型和对应的基本没有噪声的高质量模型，先去学习训练这些几何之间的对应关系。基于这个对应关系，我们就可以将一个带有噪声的扫描模型直接对应生成它的没有噪声的模型，从而实现去噪的效果。这是我们组的刘洋研究员带领实习生完成的工作。

什么是互联网图形？——首席研究员童欣 | 微软亚洲研究院院友会