展会信息港展会大全

自然语言处理技术在互联网中的应用
来源:互联网   发布日期:2012-02-15 22:39:47   浏览:28311次  

导读:随着人机交互技术的快速演进,让机器来适应人的科技理念已深入人心。作为其中重要的发展方向之一,自然语言处理技术也的得到迅猛发展和应用。 区别于如编程语言等为计算机而设的人造语言,自然语言是指人们随文化自然演化而成的语言。自然语言处理(Natural...

    随着人机交互技术的快速演进,让机器来适应人的科技理念已深入人心。作为其中重要的发展方向之一,自然语言处理技术也的得到迅猛发展和应用。

   区别于如编程语言等为计算机而设的“人造”语言,自然语言是指人们随文化自然演化而成的语言。自然语言处理(Natural Language Processing,下文简称NLP)是人工智能和语言学领域的分支学科。并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统 。

   在2007年时,淘宝广告技术部广告算法负责人吴雪军(当时他还在百度,是百度自然语言处理、网页分析、网盟广告等方向的技术负责人。 )在北京参加一个NLP技术探讨会,会上专家们讨论的主要议题是自然语言技术能否在现实中应用。

淘宝广告技术部广告算法负责人吴雪军

   4年过去了,吴雪军认为这段时间正是NLP的快速应用时期,在8月3日晚上的CTO俱乐部沙龙中,他同词网CEO张跃(张跃还是CTO俱乐部自然语言处理文本挖掘专委会 会长,本次沙龙的发起人)分享了NLP技术在搜索、广告和数据挖掘领域的应用和发展。

   吴雪军的分享相对偏技术底层,下图是他展示的NLP技术的整体技术体系,NLP将分析对象分为四层:数据、词汇(Term)、短串、篇章。每一级都对应不同的处理方法和适应领域。

   在搜索引擎中,NLP技术主要用于短串分析/相关性以及网页分析/索引。以其中一部分词汇的分层和权重为例,比较容易为用户理解的是短串的改写,例如同义词替换、语义归一化(“红烧肉菜谱”、“红烧肉怎么做”相同意义的输入返回结果也应该相同)、省略(“英雄无敌之十二翼天使”同“十二翼天使”)、纠错(“英非迪尼”同“英菲迪尼”)。

   此外,互联网广告是具有不亚于搜索的极高技术复杂度的产品。NLP技术也被广泛应用在广告请求分析、触发/相关性计算和广告关联度计算中。

词网CEO张跃

   对于互联网网站来说,提高流量和用户黏性是最核心的需求,而基于海量数据的语义挖掘,提升内容关联性可有效帮助网站改善这个指标。随后的演讲中,词网CEO张跃结合自己的几个创业项目讲解了NLP技术在互联网数据挖掘上的应用。

   第一个是模仿Google Wonder Wheel的搜搜词,基于动态的互联网资料,可以动态按照关联程度将输入对象的相关事物展示出来。

   另一个是英语作文批改网站,学生输入自己所写的英语作文,系统自动和服务器端庞大的英文语料库做匹配,返回指导修改意见及文章评分。

   自然语言处理技术所带来的创新体验令人激动不已,但两位讲师都表示,歧义的广泛存在令NLP技术离高度成熟并利用在通用领域还有一段很难跨越的距离。

赞助本站

人工智能实验室
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港