展会信息港展会大全

统计自然语言处理基础
来源:互联网   发布日期:2011-09-07 11:51:57   浏览:13495次  

导读:统计自然语言处理基础计算机_人工智能_综合教材_研究生/本科/专科教材_工学_计算机教材_计算机教材_本科/研究生_计算机专业教材_计算机专业课程_人工智能与神经...

内容简介

   近年来,自然语言处理中的统计学方法已经逐渐成为主流。本书是一本全面系统地介绍统计自然语言处理技术的专著,被国内外许多所著名大学选为计算语言学相关课程的教材。本书涵盖的内容十分广泛,分为四个部分,共16章,包括了构建自然语言处理软件工具将用到的几乎所有理论和算法。全书的论述过程由浅入深,从数学基础到精确的理论算法,从简单的词法分析到复杂的语法分析,适合不同水平的读者群的需求。同时,本书将理论与实践紧密联系在一起,在介绍理论知识的基础上给出了自然语言处理技术的高层应用(如信息检索等)。在本书的配套网站上提供了许多相关资源和工具,便于读者结合书中习题,在实践中获得提高。
   本书不仅适合作为自然语言处理方向的研究生的教材,也非常适合作为自然语言处理相关领域的研究人员和技术人员的参考资料。
   近年来,统计自然语言处理(或称统计语言学)异军突起,现已成为自然语言处理研究的主流。
   本书是一本全面系统地介绍统计自然语言处理技术的专著,已经被国内外许多所著名大学选为计算语言学相关课程的教材。本书涵盖的内容十分广泛,分为四个部分,共16章,包括了构建自然语言处理软件工具将用到的几乎所有理论和算法。为了方便学生和研究人员建立自己的语言处理系统,本书不仅提供了宽广而精确的数学和语言学理论基础,还详细讨论了统计语言模型,并覆盖了搭配查找、语义消歧、概率分析、信息检索和其他应用。
  

作译者

  Christopher D. Manning
美国斯坦福大学计算机科学与语言学助理教授,从事有关人类语言的智能化处理与生成系统及其形式化的研究工作,重点关注语言的概率模型、统计自然语言处理、信息抽取、文本理解和文本挖掘、基于约束的语法(HPSG和LFG)理论及其概率的扩展、句法的类型学、计算词典编撰学(包括XML,XSL和信息可视化方面的工作)以及在计算语言学和机器学习领域里的其他课题。
Hinrich Schutze
德国斯图加特大学自然语言处理学院教授。研究兴趣包括统计自然语言处理、文本挖掘和数.. <<

目录

第一部分 基础知识
第1章 绪论
1.1 理性主义者和经验主义者的方法
1.2 科学内容
1.3 语言中的歧义问题是自然语言难以处理的原因
1.4 第一手资料
1.5 深入阅读
1.6 习题
第2章 数学基础
2.1 概率论基础
2.2 信息论基础
2.3 深入阅读
2.4 习题
第3章 语言学基础
3.1 词性和词法
3.2 短语结枸
3.3 语义和语用
3.4 其他研究领域
3.5 深入阅读
3.6 习题

.第4章 基于语料库的工作
4.1 基础知识
4.2 文本
4.3 数据标注
4. 4 深入阅读
4.5 习题
第二部分 词 法
第5章 搭配
5.1 频率
5.2 均值和方差
5.3 假设检验
5.4 互信息
5.5 搭配的概念
5.6 深入阅读
5.7 习题
第6章 统计推理:稀疏数据集上的n元语法模型
6.1 bins:构造等价类
6.2 统计估计
6.3 组合估计法
6.4 结论
6.5 深入阅读
6.6 习题
第7章 语义消歧
7.1 预备知识
7.2 有监督消歧
7.3 基于词典的消歧
7.4 无监督消歧
7.5 什么是语义
7.6 深入阅读
7.7 习题
第8章 词汇获取
8.1 评价方法
8.2 动词子范畴
8.3 附着歧义
8.4 选择倾向
8.5 语义相似性
8.6 统计自然语言处理中词汇获取的作用
8.7 深入阅读
8.8 习题
第三部分 语 法
第9章 马尔可夫模型
9.1 马尔可夫模型
9.2 隐马尔可夫模型
9.3 隐马尔可夫模型的三个基本问题
9.4 隐马尔可夫模型:实现、性质和变形
9.5 深入阅读
9.6 习题
第10章 词性标注
10.1 标注中的信息源
10.2 马尔可夫模型标注器
10.3 隐马尔可夫标注器
10.4 基于转换的标注学习
10.5 其他模型和语言
10.6 标注准确率和标注器的应用
10.7 深入阅读
10.8 习题
第11章 概率上下文无关文法
11.1 概率上下文无关文法的一些特征
11.2 概率上下文无关文法的问题
11.3 词串概率的计算
11.4 内部-外部算法的问题
11.5 深入阅读
11.6 习题
第12章 概率句法分析
12.1 一些概念
12.2 一些方法
12.3 深入阅读
12.4 习题
第四部分 应用与技术
第13章 统计对齐和机器翻译
13.1 文本对齐
13.2 词对齐
13.3 统计机器翻译
13.4 深入阅读
13.5 习题
第14章 聚类
14.1 层级聚类
14.2 非层级聚类
14.3 深入阅读
14.4 习题
第15章 信息检索
15. 1 信息检索的背景
15.2 向量空间模型
15.3 词条分布模型
15.4 潜在语义索引
15.5 篇章分割
15.6 深入阅读
15.7 习题
第16章 文本分类
16.1 决策树
16.2 最大熵建模
16.3 感知器
16.4 k最近邻分类
16.5 深入阅读
16.6 习题
附录a 统计表
参考文献
符号表

译者序

   近年来,统计自然

赞助本站

人工智能实验室
AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港