邓晓华：壮侗语族语言的数理分类及其时间深度

2010-03-07 作者：邓晓华来源：sinoss　

　　成果名称　　壮侗语族语言的数理分类及其时间深度　　　　　　
　　成果类型　　论文　　　　　　
　　出版时间　　2007、11　　　　
　　出版单位　　中国语文　　　　　
　
　　成果内容简介
　　1. 篇章结构、基本观点:
　　1).本文运用词源统计分析法的原则，对壮侗语族语言作出数理分类以及亲缘关系程度的描述，并通过树枝长短来表示距离关系。显示壮侗语族语言的类簇和分级层次。表明计量的统计的结果跟传统的定性分类大致相同，但计量的方法更为科学，分类更为合理准确。从分类的结果看，更正了一些传统的错误分类，对解决学术界长期以来因传统分类引起的争论，提出了更科学的方法和结论：研究证明临高分别跟黎和壮的亲缘关系最近；而传统的分类都认为临高话只跟壮语关系最近，而与黎关系最远，临高与黎体现为不同语支之间的关系。
　　2).计算出壮侗语族的语言及方言分裂的年代,并分析其形成过程。不仅仅计算出每对语言的分离时间，而且计算出树图各个分离点的分离时间。试图采用几种不同的语言进化理论来解释东亚语言区域的形成过程，以便建立一种多学科的理论框架。
　　3).从壮侗语言进化树形图的结构变化，提出应当重新检讨传统的西方历史语言学的谱系分类的框架，即仅仅只在一个语言的平面上，人为的划分语族、语支、语言、方言；这种方法太过于简单，并已过时，体现不出语言的分层和整体结构。语言进化树形图能够改进传统的分类理论，更好的反映语言的分层和整体之间的相互关系。
　　4).认为南岛语族生活在以华南为中心的广大区域，约4000B.P.开始分离，并经东南沿海或西南-中南半岛向台湾及南洋群岛扩散。

　　2.主要创新和学术价值:
　　传统的语言分类方法，凭经验作定性分析，无法作语言之间亲缘距离关系程度的数量描述。因此相关结论的可信度均值得重新商榷。本文的目的是根据计算语言学的原则，利用计算机手段以及分子人类学和词源统计法等先进方法，对壮侗语族的语言及方言的发生学关系做出科学的测定和分类。所使用的数理树图可以从整体上把握所有语言的相互关系，并可以发现一些有意义的理论问题。与传统语言学研究不同在于：这种方法可以用公式来推导，并可反复使用和验证。
　　这对解决长期以来的学术界因为传统的分类而产生的争论，提供了一个数理分类的样品。而其成功的范例的研究方法，可推广至更多的语言及方言的分类。研究具有方法论上的贡献。
　　本文的意义在于建立起壮侗语族的语言及方言的分类的数学模型，建立基于语言遗传信息的系统树与基于生物遗传标记的系统树的亲缘距离以及地理分布的距离的比较研究基础。这是运用计算语言学结合遗传学来处理中国语言信息的开创性研究。

　　3.研究方法:
　　本文采取词源统计分析法以及分子人类学常用的距离法和特征法。分项比较这几种方法的分类结果，并在理论及方法上以说明和修正。最后对壮侗语系统树做综合性的深度分析。我们也重视传统的经验的分类结果，可根据一些已经确定系属的语言及方言，来检测我们的树形图的“拓扑”的可信度以及分析方法的实用性。

　　4.学术影响或社会效益等:
　　研究发现一种语言中的不同的词汇范畴具有不同的变化程度，即使是基本词汇的变化程度也不能假定为一种相同的值的理论。斯瓦迪士（Swadesh）的词表虽已成功适用于世界上上千种语言（“罗赛塔计划”Rosetta Project），但却无法以中国的语言来验证。本研究认为斯瓦迪士的100词可以用作汉藏语系的语言及方言分类的标准。本研究具有语言理论上的贡献。
　　在本研究中，我们发现词源统计法结合距离法和特征法完全可用来给中国的语言及方言做出科学的分类。
　　计算出语言分裂的时间深度是语言学最具有挑战意义的工作之一。我们的计算结果不同于许多语言学家已有的看法。其结论与考古学与人类学的最新研究成果一致。希望揭示东亚语言与民族演化进程的特殊性以及历史比较法的局限性。
　　而我们的研究成果已被考古学家民族学家所采用。

　　成果社会反映
　　1，人大复印报刊资料《语言文字学》2008年第2期全文转载（见附录1）。
　　2，该文发表后，已引起学术界重视，多位著名学者引用并给与好评，例如著名考古学家吴春明认为：“最新的研究已经质疑西方的历史语言学在“今南岛语族”的取样上缺乏华南材料的漏洞，比较华南壮侗语族，发现确实存在不少“古南岛语底层”，这就为研究华南土著与南岛语族的文化关系开辟了一个新的思路”（见附录2）。
　　3,知名语言学家徐文堪以本文为研究的背景和依据，进而深度研究汉藏语系（见附录3）。

　　成果引用或被采纳情况
　　成果被《南方文物》（2008年第2期）、《传统中国研究集刊》（第五辑，2008年）等刊物引用多次。