预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10
亲,该文档总共39页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
自然语言处理(一)机器翻译系统(二)自然语言理解(三)情报自动检索数理语言学定义:二、任务和理论依据数理语言学的特点数理语言学的理论来源三、研究内容:数理语言学分支学科介绍统计语言学又称计量语言学,它主要是应用统计程序来处理语言资料,如统计语言单位出现的频率。研究作者的文体风格,在比较语言学中采用数学公式衡量多种语言的相关程度,在历史语言学中确定不同时期语言的发展特征,以及从信息的角度分析语言信息的传输过程等等。美国人齐夫把词的频率分布和“消耗最小准则”这一基本生物学理论联系起来,总结出了著名的齐夫公式。(所谓齐夫公式就是描述某种语言中词的顺序号与出现的频率关系的经验公式。)使用频率原理分布原理(离散原理)使用度原理《现代汉语频率词典》频率排序:“提纲”,序号6942;频率级次745,词次13;使用度9。“哨棒”,序号7170;频率级次745,词次13;使用度7。“听”,序号118;频率级次116;词次1415;使用度1130。“党”,序号119;频率级次117;词次1412;使用度829。分布排序:“各”,序号209;分布篇数123;分布类数4,词次1344,使用度931。“门”,序号210;分布篇数123;分布类数4,词次863,使用度642。2,代数语言学1985年上海知识出版社出版了冯志伟编著的《数理语言学》,较为系统的阐述了数理语言学的理论知识,包括该学科的重要定律和术语,1997年北京语言文化大学出版社,出版了方立编著的英文版的《数理语言学》这两本书成为我国目前研究数理语言学的集大成者,此外在数理语言学领域研究取得较大成绩的还有白世云、张世武、孙锐欣、盛金标等学者思考与练习