编辑推荐推荐书籍

自然语言商业化 AdMaster建NLP实验室
来源:互联网  (转载协议)   发布日期:2014-11-16 09:34   浏览:9396专栏投稿 值班编辑:QQ281688302

说起自然语言技术,想必很多的人都非常陌生。但是如果说Apple的siri、智能搜索引擎,你就会明白自然语言技术,其实研究的是人与计算机之间进行有效通信的各种理论和方法,也是斯皮尔伯格电影中《人工智能》描述的那样,最终极有可能赋予机器人情感。可现实的

赞助本站

说起自然语言技术,想必很多的人都非常陌生。但是如果说Apple的siri、智能搜索引擎,你就会明白自然语言技术,其实研究的是人与计算机之间进行有效通信的各种理论和方法,也是斯皮尔伯格电影中《人工智能》描述的那样,最终极有可能赋予机器人情感。可现实的情况是自然语言上还处于起步阶段,如何利用自然语言创造价值成为理论研究和商业公司共同期望的结果。2014年11月7日,中国领先的营销数据技术公司AdMaster(精硕科技)和南京大学计算机系共同宣布正式成立自然语言处理(NLP)联合实验室。

自然语言商业化 AdMaster建NLP实验室

AdMaster联合南京大学计算机系合作的联合实验室项目隶属于AdMaster Academy,是其成立以来第二个联合国内知名高校共同推动行业发展和学术研究的重要举措。AdMaster和南京大学双方高层领导均出席了启动仪式,包括:AdMaster创始人兼首席技术官洪倍、南京大学计算机系党委书记武港山教授、南京大学自然语言处理实验室主任陈家骏教授、南京大学自然语言处理实验室戴新宇副教授、AdMaster上海研发中心总经理殷磊先生。对此采访了几位负责人,为大家分析此次合作的意义。

在消费者为中心的数字营销时代,基于电商舆情来研究自然语言是AdMaster&南京大学联合实验室的主要方向。这是因为电商平台、社交媒体等观点变得日益重要,结合AdMaster长达近十年的广告数据分析经验,实现电商舆情碎片化整合,深度挖掘商业应用价值。而对于南京大学来说,传统的中文言、词性、语境和情感的博大精深,通过技术实现机器自动识别和抽取,从而辅助、甚至代替传统人工标注的难题,这让研究在人工智能道路又多了一个前进的方向。

课题研究主要集中对舆情文本进行断句,并对文本进行分词与标注词性,通过词性情感来判断识别分类,是语言学的研究方法的一种。这也是在如今大数据时代下,计算机学和统计学说难以覆盖到的领域。南京大学陈家俊教授表示,南京大学计算机系先后承担过自然语言领域多项国家科技攻关项目,在语言学和统计学上硕果累累,这也给自然语言处理商业化道路提供了理论支持。

目前实验一期主要研究数据:分为电商平台数据、AdMaster第三方数据、新浪等社交平台数据和一些开放性数据等,数据容量高达百万级别。如何从碎片化的舆情中挖掘潜在商业价值,成为了难中之难。事实上,中文词性在不同语境的完全不同,无法确定,这也是过去语言学研究的瓶颈。但是在大数据时代,若有足够多的数据,预测结果将不需要依靠归纳、统计、因果等传统内在联系,数据本身就能说明问题,这是我们对于数据的理解。

自然语言商业化 AdMaster建NLP实验室

▲AdMaster创始人兼首席技术官洪倍

套用AdMaster创始人兼首席技术官洪倍的一句话,通过自然语言技术研究电商舆情,我们至少可以帮助电商平台第一时间锁定假货卖家,避免给用户造成更多损失。而对于研究本身,推动该领域学术研究进入高效的机器学习阶段。

登陆 | 注册 欢迎登陆本站,认识更多朋友,获得更多精彩内容推荐!

赞助本站

人工智能实验室
网友评论
好车贷
本月热点
热门排行
展开