2017年度AI最佳雇主
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
特写 正文
发私信给陈留
发送

0

iPIN :深挖语义搜索技术的市场红利

本文作者:陈留 2016-05-23 19:00
导语:iPIN 的核心技术优势是基于文本内容做深度学习,机器能够在读懂文本之后进行思考并采取行动,在技术范畴内属于认知智能阶段。

今年8月,雷锋网将在深圳举办一场盛况空前的全球人工智能与机器人峰会。届时雷锋网(搜索“雷锋网(公众号:雷锋网)”公众号关注)将发布“人工智能&机器人Top25创新企业榜”榜单。目前,我们正在拜访人工智能、机器人领域的相关公司,从中筛选最终入选榜单的公司名单。如果你也想加入我们的榜单之中,请联系:2020@leiphone.com。

iPIN :深挖语义搜索技术的市场红利

(iPIN 创始人杨洋)

“很多人认为我们只是一家高考志愿填报公司”,面对雷锋网采访,iPIN 公司CEO 杨洋首先纠正道。

如果去到iPIN 的官网,你可能也会有类似的感受。由于正处毕业季,后续新产品正处于准备发布的阶段,所以官网重点展示了“完美志愿”这款产品。但是,在杨洋的规划里,“iPIN 致力于成为全球最大的人工智能个性化信息服务提供商”,完美志愿只能算是宏大愿景的冰山一角。

填过高考志愿的都有印象,人手一本厚厚的专业查询手册,在几百页的手册上考生需要先查学校,再查往年的分数段,然后就是查找合适的专业,但这个专业具体学什么,学校专业实力如何?未来的就业情况怎样?都没有详细介绍,即便是上网查询也不一定能得到满意的解答。因此对于寒窗苦读的学子们来说,在人生的重要转折点,要想选择一所合适的学校、理想的专业,并不是一件容易的事情。如何快速高效地实现高考志愿填写?针对这一刚需,完美志愿应运而生。

iPIN :深挖语义搜索技术的市场红利

“完美志愿从本质上讲解决了志愿填报效率低下与信息不对等的问题”,一位业内人如此评价。考生只需要输入所在地区、分数、期待学校、个人兴趣、就业方向等条件就可以快速高效找到能够匹配的学校。此外,为了满足多方面的填报需求,完美志愿还能提供学校的综合评级、录取概率、毕业生月薪、社会知名度等分析项,从而帮助考生快速做出选择。另外,考生也还可以根据自己的兴趣、性格等需求来去做个性化选择,所有的操作都是全自动化的,当然其中的部分功能是要付费才可以使用。

根据iPIN 方面提供的数据显示,完美志愿于2015年6月上线,一个月获得300万+用户,日均UV 50万+,包括百度、新浪和360 都直接采用iPIN 提供的就业分析数据。尽管国内每4-5个高考学生就有一个用过完美志愿的服务,但对杨洋来说,完美志愿只是他技术创业的第一步。

“人工智能技术发展分四个阶段:计算智能、感知智能、认知智能 、类人智能。”完美志愿属于第一阶段——计算智能,服务器通过对海量数据资料的计算处理来查询结果,但这并不能体现iPIN 在技术领域的全部优势。iPIN 的核心技术优势是基于文本内容做深度学习,机器能够在读懂文本之后进行思考并采取行动,在技术范畴内属于认知智能阶段。

自从深度学习概念被提出之后,深度学习被广泛的应用于脸部识别、图片识别等方向,但很少有针对文本去做深度学习的公司。区别于我们日常所使用的关键词搜索,基于文本内容做深度学习可以实现语义搜索的结果。传统的关键词搜索,主要针对网页内容去做关键词提取来查找相关结果,而语义识别则需要在理解文本内容之后去做相关内容搜索。所以相比关键词搜索,语义搜索能够找到关联度很高的内容,对应的搜索更准,结果信息更丰富。

iPIN 旗下的“职场GPS”采用的正是语义搜索技术。用户输入相关搜索词,就可以在全网范围内准确的找到相关职业。比如,输入“喜欢打扮”,最终的结果就会出现“化妆师、礼仪形象师”等推荐职位,而在推荐职位的介绍中可能并没有“喜欢打扮”这一关键词。所以,这一核心还是基于文本语义的精确理解。

另外一款即将上线的产品HaoHR 同样是基于语义搜素技术,但用户定位略有不同。“以往招聘业务不好做的关键原因是由于HR知识面有限,另外关键词搜素能力并不精准,导致简历搜索效率并不是很高。HaoHR 的出现,将轻松解决这一难题“。技术方面,HaoHR 采用“文本匹配”技术,用户可以输入更宽泛的搜索文本,而且不限文本长度,甚至支持输入整个招聘职位描述匹配简历。比如,想搜索“程序员”简历,以往只能搜索“程序员,C++、Phyton”等专业性关键词,但现在可以把整段的招聘需求输入,haoHR 后台会根据对语义理解去查找匹配的简历,得到更全面的简历推荐。另外,HaoHR 整合了多个平台的简历,保证了简历匹配度高达50%。据杨洋介绍,目前HaoHR正处于内测阶段,包括阿里巴巴、腾讯、迅雷等互联网公司内部已经开始使用这一服务来招聘人才。

“技术层面,我们让机器去理解什么是公司、职业、学校、专业,这可不是简单的编写判断规则就可以搞定的,必须要有知识图谱对文本进行不断的训练,才能实现语义判断”。所谓知识图谱,就是从各类结构化、半结构化、非结构化数据中抽取实体、实体属性、实体之间的关系,并组合成一张网络,借助这一网络能够反映真实世界的相关信息,因为在真实的世界中,人类的认知就是由实体、属性和实体间的关系构成。用杨洋的话来说,知识图谱就好比一本教材,这本教材有清晰的目录,各章节之间彼此都有一定的关系。知识图谱能力强大与否,取决于教材目录的分类与准确性。

iPIN :深挖语义搜索技术的市场红利

(图片来源infoQ)

在这方面,“iPIN 编教材的方式是颠覆性的,我们采用全量化的判断标准“。以人为例,iPIN 将人具体分类为300多个维度,这些维度包括学历、智商、稳定性、成长空间等,分类非常精细。通过各个维度的定量分析,而非主观方面的定性判断,让主观的描述更精准量化,最终实现代替人去做分析。“目前,像我们一样针对文本做Deep learning 的公司还很少,在已有的几家公司里,iPIN 在技术上是比较领先的“,杨洋补充说道。

iPIN :深挖语义搜索技术的市场红利

杨洋表示,公司目前的业务项目都是他在美国读博项目的延伸。作为美国天普大学(Temple University )的信息学博士,杨洋师从信息分析领域的大牛Pei-yu Chen和Rajiv Banker。博士毕业之后,杨洋曾担任哈工大副教授和YY 语音全球化项目的负责人。公司另一位创始潘嵘,中山大学教授,原美国HP实验室数据科学家,2005年包揽KDD CUP全部世界冠军。另外,学术圈资历深厚的香港科技大学计算机系系主任, AAAI Fellow以及ACM杰出科学家杨强教授在公司内部担任董事一职。公司技术合伙人李训耕、技术副总裁赵泛舟作为杨洋前YY 同事,两人各自在MSN、腾讯微博担任过技术总监一职。纵观国内甚至国际上的所有创业公司,iPIN 团队的技术实力上都是首屈一指的。也正因为有这方面的技术积累,使得iPIN 对技术背后的市场有足够高的期待。

“文本深度学习的技术应用市场足够大,我们希望能够用技术来颠覆所有相关领域”,杨洋还是一如既往的自信。今年6月,iPIN 将在北京举行产品发布会。除了完美志愿之外,职场GPS、HaoHR 两款产品将正式对外发布。目前,iPIN 的产品线已经涵盖“职场、法律、金融、招聘”等多个领域,对于估值几十亿的iPIN 来说,此前多年的低调研发已结出果实,等待他们的将是巨大的技术红利市场,未来还有更多领域亟待他们去发掘。

雷锋网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

文章点评:

表情

编辑

人们总是高估短期而低估长期的科技能力!个人微信:18503053326
当月热门文章
最新文章
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说