人类文字的演化
发布网友
发布时间:2022-11-17 20:59
我来回答
共1个回答
热心网友
时间:2023-09-10 11:01
文字是人类文明发展、传承的基础。在吴军老师有关信息论的专栏中,有关文字演化的内容与大家分享如下。
一,象形文字的演化
最初“象形文字”和真实的物体非常相似,但不同的地区有不同的表达方式,但是这些象形文字彼此之间缺乏共性。
而文字演化的第一步是抽象化。下面一张图描述了美索不达米亚文字(上)、古埃及文字(中)和古代中国的文字(下),对“鱼、鸟、戚、矢(“有的放矢”的“矢”,也就是箭)、壶”这五个字抽象化的过程。
后面逐渐地,这些象形文字就被抽象化成一些直线或者弧线了。在中国和美索不达米亚,由于早期的文字是刻在金石、竹木和泥板上,因此,更多被抽象化成点和线的组合,这样便于刻写。
而古埃及是写在莎草纸上的,能够使用曲线书写,因此多用曲线进行抽象化。但不管怎么样,抽象化之后,就可以总结出共性了。
接下来文字演变的第二步,是文字信息矢量化的过程,我们就以汉字为例来说明。
绝大多数汉字被映射到两个维度上,即一个表意的偏旁维度和一个提示读音的发音维度,如“湖”,有些时候,提示读音的维度本身也表意。
再往后,表达含义的偏旁已经和原来的图画不太像了。而这些偏旁就构成了文字的基本单元,而且慢慢固定下来了。
以后有新的概念需要创作出新字时,使用那些基本单元,即偏旁部首,重新组合就可以了。比如唐朝的宗秦客为武则天发明了一个“曌”字,意思是日月当空,献给武则天拍马屁。
事实上,很多古代人所表达的信息今天早已经过时了,因此大量的古体字其实今天已经废了。虽然《康熙字典》里收集了47000个汉字,但是3000多个一级国标汉字已经能覆盖今天98%以上的文本了。
类似地,在《牛津词典》中有大约1/4的词今天已经不用了。今天的人,更习惯于用现有的字发明新词,而不是造字。
二,拼音文字的演化。
拼音文字的简化主要是围绕读音进行的。
在美索不达米亚人发明了楔形文字后,它很快就由象形文字变成了拼音文字。但是那些拼音文字并不简单,每一个表达意思的拼音其实是一堆很复杂的小箭头(很像楔子,所以也被成为楔形文字)。
后来楔形文字被当地的闪米特人学会了,他们中间有一支非常善于远洋经商的族群——就是腓尼基人。
腓尼基人将美索不达米亚的文字传播到地中海各岛屿。但是,在经商途中,商人们可没有闲情逸致刻写精美漂亮的楔形文字,于是他们对这种复杂的拼音文字进行了进一步简化,就剩下几十个字母了。
可以讲,从复杂的楔形文字,变成简单的几十个字母,是一个巨大的进步,它使得人类学习读写变得很容易。再后来希腊人从腓尼基字母中总结成24个希腊字母,而罗马人又将它们变成22个拉丁字母。
随着罗马的扩张,征服了很多外国土地,吸纳了很多外国人,有些外国的人名和地名就无法表示了,于是罗马人在字母表中加入了x,代表所有那些无法表示的音和词,这既是英语里包含x的单词特别少的原因,也是后来人们用x表示未知数的原因。
再后来拉丁文里的i被拆成了i和j两个字母,v被拆成了u,v,w三个字母,最终就形成了今天英语的26个字母。
今天欧洲其它的拼音文字大多源于拉丁语,虽然它们字母表的多少略有区别,而且读音不同,但是写法上相似,因为同一种写法表达的是同一条信息。
虽然象形文字和拼音文字的形成和进化代表了两种不同的信息编码方式,但是它们都利用了信息论中矢量化的原理。
在欧洲的拼音文字中,虽然没有表达意思的偏旁部首,但是有很多词根,前缀和后缀起到了表达意思的作用,也就是说这些语言实际上将表达信息的基本单元(单词)用一个词根、前缀、后缀这样三维的矢量表示了。
于是,稍微有些语言基础的人,可以猜出一些没见过的单词的含义。正因为这个原因,拼音文字比汉语容易学。