首页 >> 语言学 >> 比较语言学
基于依存句法标注树库的汉语语体差异研究
2015年06月23日 16:33 来源:《语言文字应用》(京)2012年第4期 作者:刘丙丽 牛雅娴 刘海涛 字号

内容摘要:书面语中名词、动词、形容词的比重比口语大,口语中代词、量词结构和“的”字结构的比重比书面语大。通过统计研究已进行过句法标注的文本,我们发现在不同语体中充当相同句法成分的各词类所占比重有较大差异,主要表现在以下几方面:书面语中主语大多数由名词充当,口语中主语大多数由代词充当,比重均达到60%左右。比如主语中名词和代词的构成,在书面语中名词占主导地位,在口语中代词占主导地位,两种词类的比例呈此消彼长的关系。1996.[19]张志公.汉语口语(序)[Z].陈建民《汉语口语》[M].北京:北京出版社。

关键词:口语;书面语;词类;汉语;语法;定语;形容词;依存;名词;补语

作者简介:

  作者简介:刘丙丽,中国传媒大学文学院在读博士;牛雅娴,中国传媒大学文学院硕士(北京 100024);刘海涛,浙江大学外语学院博士生导师,三人研究方向均为计算语言学、计量语言学(浙江 杭州 310058)。

  内容提要:本文以依存语法为理论基础,旨在统计真实语料中汉语语体的句法成分差异。采用《新闻联播》和《实话实说》两个依存树库分别作为书面语体和口语体的代表,同时又建两个小型依存树库作为补充,在这些语料基础上统计了不同句法成分的成分差异。结果发现,不同语体中充当相同句法成分的各词类所占比重有较大差异,主要表现在书面语中主语大多数由名词充当,口语中主语大多数由代词充当;定语与词类的对应较为分散,书面语的定语构成中名词占绝对优势等。

  关 键 词:口语;书面语;语体;依存语法;句法功能  

  标题注释:【基金项目】本文受国家社科基金重大项目“现代汉语计量语言学研究”(批准号:11&ZD188)的资助。

 

  一 引言

  口语和书面语的区别,一直是语体学以及词汇学、语法学的研究重点之一。有关书面语的研究历史很长,这里不再赘述。而口语研究早在19世纪末就已经受到学者们的重视。Sweet(1890)用音标描写了英语口语的特点,Palmer撰写了《英语口语教学语法》。早期关于汉语口语语法的著作,有赵元任(1979)的《汉语口语语法》,主要是为外国人学汉语提供一些方便,由吕叔湘翻译后带到中国。全书以北京话口语为语料,对汉语口语语法进行了深入描写,产生了非常广泛的影响,不过正如张志公(1984)所说,写这本书时,赵先生因久居国外,“书中的用例,显得有点过时了”。后来陈建民(1984)详细分析了口语在语音、句法、词汇等诸多方面的特点,开启了国内口语研究的先河。20世纪80年代,研究成果更为丰富。陆俭明(1980)、陈章太(1981)、陈建民(1982)等文对于研究不同类型的语体具有指导意义。90年代以来,张伯江、方梅(1996)以北京口语为语料,结合语体特点发掘出大量别人没有注意到的语法事实。刘宁生(1997)印证了朱德熙提出的“研究北京口语语法,有利于我们去发现现代汉语里最根本的语法事实”这一观点。周一民(2002)的文章对重新认识现代汉语有着重要意义。戚晓杰(2008)从“分裂性”角度论述了汉语口语、书面语的差异;吴春相、金基石(2008)探讨了心理距离与言语表达的口语特征和书面语特征的关系;李佐丰(2009)提出“屏幕语体”是与口语、书面语并立的第三种语体,兼有二者的一部分特征。戴艳琪(2008)对汉语口语和书面语在语言系统上的差异做了具体描述。可见,越来越多的学者们意识到了口语和书面语在许多方面存在较大差别,而这些研究多是通过传统的研究方法,并非基于大量真实语料,也没有通过有效的数据进行对比研究,因此缺乏足够的说服力,也很难发现常规认识以外的语言规律。

  本文将就这一问题进行深入探讨,希望通过构建句法标注语料库来解决内省方法存在的不足,采用依存语法的理论以解决短语结构树结构复杂的缺陷,通过研究不同语体中句法成分在词类构成上的差异,发掘口语与书面语之间的差异,对其进行量化描写和比较研究,希望可以为语体研究和语法研究提供一些新的发现和思路。

分享到: 0 转载请注明来源:中国社会科学网 (责编:隋萌萌)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们