首页 >> 头条新闻
工程语言学:现代科技手段助力甲骨文研究
2014年01月22日 07:23 来源:中国社会科学报 作者:王广禄 字号

内容摘要:1899年,王懿荣发现甲骨文,发轫于此的甲骨文研究为此前只有典籍记载的“中华文明5000多年”一说提供了实物证据,有物证可考的中华信史自此向前延伸了1100多年。工程语言学运用现代科技手段对甲骨文进行信息化处理,为甲骨文图形复原和相关研究拓展了一条新途径。字形复原研究为甲骨文信息化处理打下了基础,江苏师范大学语言科学学院讲师酆格斐表示,在字形特征提取方面,通过对原始甲骨文图形进行预处理,可准确地把甲骨文从背景噪声中分离出来,应用数学形态学方法对甲骨文进行图像处理和分析,提取表现甲骨文字形特征的主要指标。甲骨文研究则涉及更多学科,字形复原只是为甲骨文研究做了重要的基础工作,图像还原后,其具体是哪个文字、代表什么意义等,还需古文字学家做大量工作。

关键词:甲骨文字形;复原;噪声;图像;古文字;甲骨文研究;信息化处理;杨亦鸣;修复;数学

作者简介:

  文字的出现是人类进入文明时代的标志之一。1899年,王懿荣发现甲骨文,发轫于此的甲骨文研究为此前只有典籍记载的“中华文明5000多年”一说提供了实物证据,有物证可考的中华信史自此向前延伸了1100多年。甲骨文是我国目前发现的最早的一种成熟文字系统,有效地对其进行保护和研究意义重大。工程语言学运用现代科技手段对甲骨文进行信息化处理,为甲骨文图形复原和相关研究拓展了一条新途径。

  甲骨文研究面临多重难题

  100多年来,中外学者在甲骨文的搜集辨伪、字形考释、甲骨缀合、甲骨刻辞的分期断代等方面取得了巨大成就。研究显示,殷墟出土的甲骨文资料至少在15万片以上,发表和出版的甲骨文资料与研究文献达万余种(篇),中外学者先后从事甲骨文研究的有数千人。

  然而,当前甲骨文研究仍面临一些问题,究其原因,教育部“长江学者”特聘教授、江苏师范大学语言能力协同创新中心主任杨亦鸣认为,首先,由于年代久远,出土的完整甲骨极少,绝大部分是破碎的,重新缀合难度极高。此外,甲骨深埋地下数千年,刻在上面的字形受到腐蚀,笔画大都不甚清晰。其次,在甲骨文字形实现全面数字化之前,很难对甲骨文字形进行识别和检索。再次,甲骨文字形著录书籍较昂贵,全套《甲骨文合集》共13册,重达几十公斤,售价近万元,普通研究者难以获得。江苏师范大学语言科学学院副院长余光武表示,甲骨文字形识读研究仍显薄弱,已发现的4500多个字中,目前可完全识读的不足1500个,这也制约着甲骨文的研究。

  “我们今天看到的甲骨文瘦劲挺直,两端尖锐,转折处往往以两条直线相接成屈折状。这样的字形一般是现代人根据甲骨上字形的特点临摩而成,或是对拓下来的字形进行修整得来。”杨亦鸣说,这项工作就是甲骨文字形复原,是甲骨文信息化处理的重要组成部分。

  传统复原效果不尽人意

  近年来,古文字的信息化处理成为学界研究热点。甲骨文的信息化处理研究范围较为广泛,包括破碎甲骨的计算机辅助拼接,甲骨文字形的复原、数字化、输入编码、艺术变形、计算机识别、计算机辅助断代分期等。

  杨亦鸣表示,甲骨文字形复原是重要的基础性工作,有手工处理和计算机辅助处理两种途径。纯粹的手工处理效率很低;采用某些图像处理软件可最大限度恢复甲骨文字形的原始面貌,但涉及非常复杂的手工交互,且需要经验丰富的专业人员进行操作。

  江苏师范大学语言研究所讲师顾绍通指出,目前国际上流行的图像修复算法有偏微分方程图像复原法、整体变分和基于曲率的扩散模型方法、径向基函数修复法、纹理合成法、基于Cahn-Hilliard方程的图像修复法等。“这些方法均采用图像处理的方法修复破损区域,且目前的修复效果不尽人意。”

  信息化新方法优化甲骨文字形复原

  杨亦鸣带领的研究团队发现,甲骨文上的噪声点符合数学统计上的泊松分布特征,绝大多数噪声区域的面积很小,区域面积大的噪声点很少。利用这一统计特征可以消除甲骨文上被污染的噪声区域,保留甲骨文字形笔画区域。

  进一步的研究发现,清除噪声点后的甲骨文字形边缘呈现锯齿形态,仍然不具备甲骨文字形的原始面貌,但字形边缘可近似看作分形特征,因此基于分形几何的字形复原方法变得可行。

  余光武表示,对字形边缘进行压缩变换可使其变得平滑,再通过计算分形维数控制字形边缘的平滑程度,字形图像边缘因腐蚀所造成的凹凸形态得到平滑处理,甲骨文字形的原貌实现了较好的恢复,获得接近甲骨文字形原貌的字形成为可能。“利用计算机技术实现甲骨文字形的自动修复,大大减轻了人工修复甲骨文字形的劳动强度。”国家社科基金首批资助期刊《语言科学》编辑部主任张强说。

  字形复原研究为甲骨文信息化处理打下了基础,江苏师范大学语言科学学院讲师酆格斐表示,在字形特征提取方面,通过对原始甲骨文图形进行预处理,可准确地把甲骨文从背景噪声中分离出来,应用数学形态学方法对甲骨文进行图像处理和分析,提取表现甲骨文字形特征的主要指标,进而构造基于数学形态学方法的甲骨文字形特征提取系统,提取出反映甲骨文笔画形态和结构的字形特征;在分期断代方面,可采用数学形态学图像处理方法提取甲骨文图像的特征向量,基于已人工断代的甲骨文样本,实现并训练贝叶斯分类器,从而获取待分期断代甲骨文与“五期”分法的映射关系。

  杨亦鸣表示,作为工程语言学的一个研究领域,甲骨文字形复原研究涉及语言学、文字学、计算机科学、数学等学科,需要具有不同专业背景的研究人员进行协作研究。甲骨文研究则涉及更多学科,字形复原只是为甲骨文研究做了重要的基础工作,图像还原后,其具体是哪个文字、代表什么意义等,还需古文字学家做大量工作。他强调,“已进行的甲骨文信息化处理研究工作和发明的方法,可运用于金文、篆文等其他古文字和少数民族古文字复原等研究工作中。”

分享到: 0 转载请注明来源:中国社会科学网 (责编:刘宇)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
11.jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们