您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
特写 正文
发私信给haoxiaoru
发送

4

Google 鲜为人知的一面:让全世界都没“豆腐”吃

本文作者:haoxiaoru 2016-09-01 12:38
导语:​能力有多大,责任就有多大。

Google 鲜为人知的一面:让全世界都没“豆腐”吃

能力有多大,责任就有多大。

Google 的 Noto 字体项目几年前曝光时,人文学者觉得不可思议,甚至表达过在语言文化方面的担忧。这是个雄心勃勃的项目,试图覆盖全球所有文字和语言,消灭小语种文字无法显示状态下的“豆腐块”(No Tofu,Noto 名字源于此),以及让不同的文字,并排在一起显示的时候,可以和谐相处。

Google 找来全世界字体设计方面的顶尖专家,同自己的设计师、工程师一起默默做了 5 年之后,迎来里程碑—— Noto 字体覆盖的全球人口“接近 100%”。2016年8月中旬,Google 在北京办公室,向十几家媒体分享了 Noto 字体项目的进展,“到目前为止支持 100 多种文字,500多种语言,包括了超过11万的字符”。

负责该项目的团队,属于 Google 内部一个叫“国际化”的部门。这个部门的领导者钟胜华,也来到本次“Google产品之旅”的活动现场。据他介绍,2005年 Google 开始感受到国际化的重要性,由他领导并建立起 Google 国际化部门。当初的宗旨是希望 Google 的众多产品在全世界任何国家、任何地区、任何语言都能给用户最好的体验。 2011年,为了把 Android 和 Chrome OS 操作系统发布给全球用户,这个团队开始为其开发覆盖全世界语言的字体。

Google 的创始人做事风格却不是这样的,通常都是要做就做全部的

“也许其他公司也做国际化,他们会根据哪几个国家、哪几个地区对他们的产品是最重要的,然后集中火力去做这几个国家或者这几个地区。但Google 的创始人做事风格却不是这样的,通常都是要做就做全部的。 ”

参与 Noto 项目的 Google 工程经理陈雍昇进一步介绍:“以前开发字体,第一个决定因素是这个字常不常用,值不值得我们花钱去设计这个字。如果用的几率不是很高,有很多设计字体的制造厂家可能决定不把它纳入。Google 做 Noto 是只要出来 Unicode(万国码)标准就将它纳入,所以反而不需要做什么考虑。”

Google 鲜为人知的一面:让全世界都没“豆腐”吃

陈雍昇告诉雷锋网,Noto 团队最主要考虑的是设计的和谐度,新的字跟其他100多种文字都需要有和谐度。掏出一张人民币,看看背面的 4 种少数民族文字(Noto均支持),就能明白,让上百种文字在排版时“和谐相处”的难度。

Google 花了 5 年时间在字体方面搞“基础设施建设”。做好之后,又把这套字体开源出去,任何人都可以免费下载使用。从计算机的原理上说,字体解决的是输出的问题,国际化团队还有一个输入的问题需要解决。

Google 国际化部门的员工分布在世界各地。其中负责输入法的主力团队在中国,包括刚刚在 iOS 上推出,并引起关注的 Gboard 输入法,也是中国团队参与开发的。Google 在输入法上最大的难点是怎么支持超过 100 种语言,让全世界任何地方的人,都可以使用母语进行输入。

拉丁语系之外大部分的语言在互联网上的信息比例,明显的少于用户数量的比例

这一点中国用户感受不深,因为中文输入法领域,本土企业提供了高水平的产品。但是,放眼全球,据输入法团队的Google工程经理杨帆透露,现在互联网上的信息大部分是英文,而除了拉丁语系之外大部分的语言在互联网上的信息比例,明显的少于用户数量的比例。“所以我们希望解决这个问题,帮助用户可以更好的产生母语的内容。这个是输入法团队存在的价值,我们认为这是对全世界用户都很有意义的事情。 ”杨帆说。

Google 鲜为人知的一面:让全世界都没“豆腐”吃

如果说字体设计是个具备人文艺术方向特质的工作,那么输入法更理性、更技术一些。杨帆的工程团队并没有采用传统的做输入法的方式,而是引入机器学习技术,加快覆盖一种新语言的速度。杨帆介绍,Google输入法的印度版本发布的时候,因为拥有好的软件架构和语言无关的机器学习方法,他们在几个月之内就可以做出 11 种语言(印度宪法承认的语言有15种),甚至软件工程师都不懂印度语。

他告诉雷锋网,Google 做各种语言的输入法有一个通用的方法。首先,保证客户端框架是可以适用所有语言的,团队里有接近20年输入法开发经验的高级工程师,他们设计了可以适应所有语言的框架。“当你要添加语言的时候,不用改代码,只要有更多的数据放到算法模型里去,就可以直接把需要的语言导出来。”

其次,通过机器学习的方法,建立通用的数据索引和输入模型,这些都是和语言无关的。“这跟传统做法很不一样,传统做法是一个语言就需要一个语言的模式,如果用机器学习就可以用一个比较通用的模式做到全球化。”

Google 用这样的方法,做了全球 100 多种语言的基础功能。然后再对每个语言做深入的做用户调研,去做各种语言特殊的功能。

Google 鲜为人知的一面:让全世界都没“豆腐”吃

本次活动,来自 Google 上海的“用户体验经理 ”张英惠,还分享了由 Google 倡导的,用来表达职业和活动的 Emoji 表情。过去,女性的表情只有剪头、按摩、结婚、公主等,职业和活动的表情均是以男性为蓝本的。Google 的 Emoji 团队,让(不同肤色的)男女都有各种职业可选择,让女性“想当医生的当医生,想当工程师的当工程师,想当摇滚歌手的也可以。”

这套表达职业的 Emoji 已经被 Unicode 接纳,接下来就会看大其他各个大公司和软件平台设计出相应的职业表情版本。张英惠说,“希望我们的工作,能够帮助世界往更多元化和性别平等的方向继续迈进。”

Google 在做很多事情,但在推动全球化方面的基础工作,很少出现在中文媒体的版面上。这些事情显然没有无人驾驶汽车和热气球性感,却是这家公司在全球各地拥有众多粉丝的重要原因之一。 

雷峰网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

帅编辑

你猜猜猜
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说