文字是人类用符号记录表达信息以传之久远的方式和工具。现代文字大多是记录语言的工具。人类往往先有口头的语言后产生书面文字,很多小语种,有语言但没有文字。文字的不同体现了国家和民族的书面表达的方式和思维不同。文字使人类进入有历史记录的文明社会。
文字概念
定义
文字是人类用表义符号记录表达信息以传之久远的方式和工具。现代文字多是记录语言的工具,人类往往先有口头的语言后产生书面的文字,很多
小语种,有语言但没有文字。
文与字
【
东汉】
许慎《〈
说文解字〉叙》:“盖依类象形,故谓之文;其后形声相益,即谓之字,”也就是说,“文”是独体字(包含
象形字和
指事字),而“字”是由
独体字组合的
合体字(包含
会意字、
形声字、
假借字)。
分类
文字按字音和字形,可分为
表形文字、
表音文字和
意音文字。按语音和语素,可分为
音素文字、
音节文字和
语素文字。
表形文字是人类早期原生文字的
象形文字,比如:
古埃及的
圣书字、
两河流域的
楔形文字、
古印度文字、
美洲的
玛雅文和早期的汉字。
表音文字用少量字母(大多不到50个)组成单词记录语言的语音进行表义的文字。表音文字可分为
音节文字和
音素文字。音节文字是以音节为单位的文字,如日文的假名。音素文字是以音素为单位的文字,比如
英文字母26个,西文字母29个,
俄文字母33个。
意音文字是由表义的象形符号和表音的
声旁组成的文字,汉字是由
表形文字进化成的表意文字。汉字也是
语素文字,也是一种二维文字。
要素
语言的三要素是:语音、词汇和语法,文字的三要素是:音——语音、形——字符形状、义——意义。学习一门语言,往往连带学习它的文字,
语言文字的要素有重复,合并同类型为四要素:语音、字符、词汇、语法。
属性
文字是不同国家和民族约定俗成的,由众多笔画简单的符号组成的,表达信息和传承文化的字符系统。
字符笔画简单
文字的笔画往往不多,复杂的符号就是图画了,虽然也能表义,但不便于书写和传播。
约定俗成
文字是不同民族和国家创造的约定俗成的字符系统,个人自创的不被民族和国家广泛认可的字符不算真正的文字。
系统
少数几个孤立的字符难以表达万事万物的海量信息,还不是文字,文字是由众多字符组成的一个表义的
符号系统。基本的字符越少,意味字符的组合越长越复杂,
基本字符越多,意味表达信息越简单。改革文字会牵一发而动全身。
发展史
文字突破口语受到时间和空间的限制,是人类可以在
书面语的基础上完整地传承人类的智慧和
精神财富,使人类能够完善
教育体系,提高自己的智慧,发展科学技术,进入
文明社会。
普通文字是用简单图形形成,早期更加接近图画,更加接近几何线条。例如
拉丁字母是简单的直线、弧线和
点构成。汉字主要是由直线构成,所以叫做“方块汉字”。古代的
甲骨文汉字,
埃及象形文字和
玛雅文字等古老文字图画性比较强。
由于特殊人群视觉能力的局限,还可以发明变异的
视觉符号或者触觉符号来代替普通文字。
盲文是为了适应没有视觉能力的盲人发明的触觉符号。
手语是为了适应没有语音能力的
聋哑人发明的用手舞动的动态视觉符号。旗语是为了适应航海等远距离听觉和视觉局限发明的用
旗子舞动的动态视觉符号。
在电子
信息传输的初期,人们还采用
阿拉伯数字代替汉字传输书面语。这种数字代码可以给任何文字编码。但是汉字因为数量多,需要专门的代码
翻译人员才能使用。
有人把文字分成线性文字和非线性文字。这样有一定道理,但无论是普通文字还是代码文字都有线条和点等
视觉元素。
1.表形文字/象形文字
描画事物形状的文字是象形文字或表形文字。像中文中的“日”“月”等字都属于象形文字。象形文字是文字萌芽时期的产物,主要的优势便是易于理解,一看便懂,用于记录语言会有些困难,尤其是记录
虚词,可以分为四种类型——刻符、岩画、
文字画和图画字。不过到今天,这种表达意义的符号依旧很常见。比如网络上流行的
颜文字和绘文字(
emoji)。
拼音文字是一种使用少量的字母记录语言中的语音的文字,主要分以下四大类:
(1)Consonant alphabets/Abjads(辅音文字)
基本特征:正式书写系统只表记语流中的辅音
音位;
辅音字母依照在语流中出现的顺序,呈线性排列。
基本特征:有独立的
元音字母和辅音字母分别表记元音和辅音(有些语言中也存在既能表示元音又能表示辅音的字母)。字母依照所代表的音位在语流中出现的顺序,呈线性排列。元音字母和辅音字母在形态和位置上不带有各自的分类属性。元音字母可以独立表记音节,辅音字母通常要和元音字母拼合才能表记音节。
(3)Syllabic alphabets/Abugidas(音节拼写文字)
基本特征:音节的书写呈线性排列,每个音节内音位的书写并非呈线性排列。在每个音节中,以表记该音节起始辅音或零辅音的辅音字母(类似汉语拼音体系的声母)为中心,在周围特定方位(上下左右半包围等)以添加符号、符号组合、辅音字母、辅音字母和符号的组合等形式,表记韵头、
韵腹、
韵尾以及声调(如有)等。辅音字母可以单独出现,代表该辅音与特定元音拼合成的音节。元音符号不能单独出现,表记
纯元音或以元音开头的音节时,必须伴随零辅音字母。当辅音字母和添加部分共同构成音节时,在有些文字中,为保持音节字形结构的平衡和美观,字母或符号的形态会发生变化。
基本特征:每个音节有一种或多种独立不可拆分的表记形式,音节文字中不含有任何表记元音辅音音位的部分。书写时,依照所代表的音节在语流中出现的顺序,呈线性排列。音节文字又分成整体音节文字和非整体音节文字。日语假名是整体音节文字。非整体音节文字又分成半
音素化音节文字和全音素化音节文字。半音素化音节文字例如阿拉伯文字,每个字(字母)内部的主体部件写音节中的辅音音素,
元音音素可以不写或者用附加部件写。
在音节文字中,韩文是例外。韩文(
谚文)表示音素的字母按音节组合起来写成一个方块字,但其实它并不属于学术定义上的音节文字,而和拉丁字母一样属于音位文字,只不过它的字母排列不是线形拼写,而是依照音节块形拼写而已。谚文的方块字才能为字,把音素字母看成构件。所以谚文应该看作是音节文字。
3.语素文字/意音文字
意音文字,或称
语素文字、语素——音节文字、语词-音节文字,是一种
图形符号既代表语素,又代表音节的文字系统。一般来说意音文字可以分解为字位,一个字位代表一个语素。语素文字的文字本身可能有表示声音、意义或是形状的部份。
基本特征:每个单字表记独立语素,不直接表记发音(注意并不是“完全不表记发音”)。
每个单字创制时通常有唯一对应的音节,但由于语音历史演变、文字借用等因素,现今单字和具体发音之间的映射关系已非常复杂。
对应相同音节的可能有非常多的不同单字。在不结合语意的前提下,无法判断每个音节所对应的具体是哪个单字。
(二)文字的发展史
最原始的文字大多是图画符号,即通过象物来表达。
古代埃及文字中,也有几个图画符号来表达其音组合后对应事物的做法。
苏美尔文字也经历过这个时期。但值得注意的是,汉字的“象形”与古西方文字的“象形”是两个完全不同的概念,事实上
古埃及文字中绝大部分图画符号并非以形表意,而是
表音符号。实质上类似于
字母文字。举个例子来说,在古埃及文字语法中,看起来像是各种鸟的符号,其实跟鸟无关,而是表示不同的的发音。所以所谓的“
古埃及象形文字”,其实是世界上最早的拼音文字。(按:早年中国学者在翻译“hieroglyph”时错误的放弃了直译法,而是比较形象的根据古埃及文字的图画特征,套用
汉字造字法中的象形,翻译为象形文字流传至今。)
随后
楔形文字放弃了图画符号,不再以形表音,而是用线条来
标音,我们看到的众多字母体系,从
腓尼基字母借用古埃及象形文字的形而用其声,再经过一系列演变,分化出
希腊字母,
罗马字母,
阿拉伯字母,
西里尔字母等等,从古代到现在的字母文字,几乎都可追溯到腓尼基字母。在
东亚,日本利用汉字,从其草书和楷书形态演化出
平假名和
片假名。
文字变化的机理和拼音文字存在的原因在哪里?很重要的一点是文字还没发生和成熟之前,言语已经高度成熟了,即使是没有文字的民族,它们的口语也能涵盖日常生产生活的诸多内容。在语言还没有产生之前,人们已经能认识周围事物,而文字则是对周围事物的抽象化体现,又比如在汉字这样的意音系统里,虚词普遍采用了“假借”手法,譬如“然”即是今天的“燃”的
本字,
火字旁乃是后人为了和“虚词”用法相区分而加上去的(容易注意到,火字旁其实是和“然”字的火字底(四点底)相重复的),以今人度之,即如画一个抽象符号即可。
中国汉字
汉字历史
汉字是世界上最古老的文字之一,对周边的影响也是非常巨大的,是其它文字的母字。它是记录事件的书写符号。在形体上逐渐由图形变为由笔画构成的方块形符号,所以汉字一般也叫“方块字”。它由
象形文字(
表形文字)演变成兼表音义的
意音文字,但总的体系仍属表意文字。所以,汉字具有集形象、声音和辞义三者于一体的特性。这一特性在世界文字中是独一无二的,因此它具有独特的魅力。汉字是
汉民族几千年文化的瑰宝,也是我们终生的良师益友,每个人的
精神家园。汉字往往可以引起我们美妙而大胆的联想,给人美的享受。
各地出土的陶器上的一些
陶符纹饰,已具有文字的雏形。从我们能看到的现存最早的成批的文字资料──商代
甲骨文字算起,汉字已经有3600年的历史。由于甲骨文字已经是相当成熟的文字体系,我们可以推断汉字的发生一定远在3600年以前。汉字的发展可以划分成两个大阶段。从甲骨文字到
小篆是一个阶段;从
秦汉时代的隶书到如今是一个阶段。
2013年7月6日,来自全国的古文字研究专家们齐聚平湖,现场对这些符号进行论证。专家们认为
庄桥坟遗址出土的确为良渚原始文字,是迄今为止在我国发现的最早的原始文字。国家文物局考古专家组成员、
中国考古学会理事长
张忠培表示,庄桥坟遗址所有
出土文物是真实而有科学依据的。
汉字演变
八千多年前的河南舞阳
贾湖遗址(距今9000—7800年),出土了一批
刻符,号称
贾湖刻符。有的学者认为只是刻符,有的认为是文字。
香港中文大学饶宗颐曾对
贾湖契刻进行了深入探讨考证,提出“贾湖刻符对汉字来源的关健性问题提供了崭新的资料”。贾湖21个刻符里,已认识的11个字,分别属于反映易学里离、坤两卦之象的
卦象汉字。
七千多年前的蚌埠
双墩遗址,发现630多个
刻划符号,丰富多样,就同期国内外文化遗存来说,都十分罕见,惊人。符号种类之多、内容之丰富是同时期其他遗址所无法比拟的。
双墩刻符的功能可以分为表意、
戳记、计数三大类。 2009年10月24日至25日,30多位来自国内外的著名专家学者聚集
蚌埠,就“蚌埠双墩遗址刻划符号暨早期文明起源”展开研讨。众多与会专家一致认为,双墩刻符反映了早期双墩先民的
生活形态,已经具备了原始文字的性质,是汉字源头之一。
距今6000年前的属于
仰韶文化的
半坡遗址的陶钵口沿上刻的二三十种刻划符号,即
半坡陶符,
于省吾认为“是文字起源阶段所产生的一些简单文字”。其中一些是数字。
属于
长江下游区域
良渚文化的
江苏省
青墩遗址,距今5000年前,有数字刻符。
属于长江下游区域良渚文化的
浙江省
庄桥坟遗址刻符,距今5000年前,有的
连字成句了。
骨刻文是指在
兽骨上刻画的符号——象形文字或
图形文字,在山东集中发现(
赤峰、关中等地也有发现),是我国最早的以记事为主的可识文字。2005年,著名
考古学家、
山东大学美术考古研究所所长
刘凤君教授发现,后称“
骨刻文”,并认定刻画工具为玛瑙等锐角宝石,形成约在公元前2600~前1300年之间,是
龙山文化时期流行的文字。自2010年底开始,著名学者、
山东省旅游行业协会专职副会长
丁再献研究员将骨刻文成功系统破译,从文字的起源和构造等方面较全面的论述了与
甲骨文及现代汉字的传承关系。
山西省
襄汾县的
陶寺遗址,据
放射性碳素断代并经校正,其年代约当公元前2500~前1900年。1984年考古工作者在陶寺遗址中发现一片
扁壶残片,残片断茬周围涂有红色,残片上朱书两个文字,其中的一个字为“文”,另外一个字专家们有“
尧”“易”“命”等多种解释。
中国社会科学院考古研究所研究员、信息中心主任
朱乃诚表示,朱书文字比甲骨文还早了1500年。考古学家
苏秉琦先生曾这样评价:“
陶寺文化不仅达到了比
红山文化后期社会更高一阶段的‘
方国’时代,而且确立了在当时诸方国中的中心地位,它相当于古史上的
尧舜时代,亦即
先秦史籍中出现的最早的‘中国’,奠定了华夏的根基。”
襄汾县所靠近的东南方
翼城县就是传说的陶唐氏唐尧的后代的封国唐。
河南省
洛阳市
偃师二里头
夏墟出土的陶器有24个水书文字。
一种比较折衷的意见认为中国文字“形成比较完整的文字体系”则在距今4000年前的
夏朝中、后期。当然,这不是公认看法,因为夏代出土的文字还少。
商代前期的甲骨文遗存主要发现于郑州商城。1953年4月,郑州二里岗遗址出土1段牛肋骨,上刻3行11字,“乙丑贞:从受……七月又モ土羊”,也有人释为“又土羊乙贞从受十月”。这段文字在功能上与殷墟甲骨文“甲申卜又土”相同,甲骨出土区绝无殷代晚期遗存,应属早商二里岗期。1954年9月,郑州二里岗遗址CIT30探沟内又出土1件残骨器,上刻不完整的正三角形,中间有一个“ㄓ”字。二里岗之外,郑州商城的其他区域也偶有甲骨的发现。1989年秋,河南省水利第一工程局项目工地二里岗上层的灰坑内发现1件用动物肢骨加工的骨料,正面有2个刻划文字,或释为“厄弜”。1990年夏,考古人员在清理郑州电力学校二里岗上层夯土坑H10时,在填土中发现1件残骨片,骨料正面偏上部中间有2个刻画文字,释为“弜厄”。这些商代早期文化遗址中发现的刻骨卜辞,是中国迄今所发现的最早甲骨卜辞,也为商后期甲骨文字找到了源流。
如今看到的,已经初具规模、比较完备的文字是
殷商时期的甲骨文。清朝末年在河南
安阳小屯村发现了许多
龟甲和兽骨,上面刻有文字,引起了学术界的极大兴趣,并把这种文字叫作甲骨文。
有金文铸铭的商代前期文物,在国内遗址有5处发现,2件收藏于国外机构。郑州商城白家庄墓葬出土1件青铜尊,颈部刻有3个等距离的龟形图象。唐兰释为“黾”,也有认为是龟徽,应为族徽文字。1964年郑州杨庄出土1件爵,腹部一侧饰饕餮纹,另一侧为对称的双目,曹淑琴认为是商周金文中常见的“图一”字。1978年郑州市中牟县大庄遗址发现1件青铜戈,直内长援,援两侧各有一“臣”字。陕西岐山县京当也出土1件青铜戈,铭文和郑州中牟出土的戈相同。山西长子县北郊发现1件青铜甗,内壁有一阳文铭,形象为菱形框内放一箭头,一般认为是“侯”字。另外,旧金山亚洲艺术博物馆和西雅图艺术博物馆分别收藏1件青铜鼎,两鼎纹饰几乎一样,内壁均铸有铭文“癸图二”,应为同时制作的一对礼器。李学勤认为西雅图艺术博物馆收藏的金文方鼎就是陈梦家所辑《劫掠》67方鼎;并指出二里岗期有铭文的青铜器,比较可信的只有《劫掠》397父甲角,而西雅图鼎铭“癸”字四角不出头的特点,是年代较早的旁证。这些商代前期铜器铭文的字形和铸造位置,与商代后期的同类铭文一致,展示出较为明显的相继关系。
随着社会的发展,字体也不断地在演变。从
殷商到秦统一之前的
金文,就是在甲骨文的基础上发展而来的。金文是
铜器铭文的通称,古代的铜器多为钟鼎,所以也叫钟鼎文。金文笔画也比甲骨文丰富多了,大小匀称,也有了行款,并有了一定的
装饰性。
我们学过历史,都知道春秋战国时,诸侯争战,你争我夺,也造成了语言异声,文字异形,直到
秦始皇统一六国后,才将文字统一为小篆。以前的甲骨文、金文呢,就称为大篆,传世的《
琅邪台刻石》《
泰山刻石》都是小篆的代表作。
小篆虽然规范,看起来也漂亮,但写起来并不容易,应用时不能令人满意。人们对文字这一传播思想记录语言的工具的希望,是越方便越好,于是在小篆的基础上又产生了新的字体——隶书。相传隶书的创始人是
程邈,因他得罪了秦始皇,下了监狱,在狱中用了十年的工夫,整理出一套应用简便的新字体,被后人称为隶书。秦始皇很高兴,不但赦免了他的罪,还封他为御史。
到了汉代,隶书逐渐成熟,占据了主要地位,这时由于人们
审美意识的提高,隶书已写得相当美观,留下了许多名碑,如《
张迁碑》《
石门颂》《
曹全碑》等风格各异的杰作,仍是学习隶书的最好范本。
隶书进一步演化而成为楷书,也就是我们所用的字体,它比隶书更丰富而完备。三国时期的
钟繇是在楷书加工整理上有巨大贡献的人。到了唐朝,文化高度发展,书法也发展到了顶峰,出现了一大批擅长写楷书的名家.像
欧阳询、
虞世南、
褚遂良、
颜真卿、
柳公权等。
下面说一说草书。草书并不是在楷书出现以后才有的。“草”是初步、草率的意思。无论哪种字体写得潦草,都算草书。作为一种专门的字体,是汉代才有的。到汉末,草书才大为风行,先为
章草,又为
今草,最后发展为
狂草,还有小草。草书种类繁多,初学者不宜学,所以在这儿也不多说了。
最后说一说行书,这是介乎楷、草书之间的一种字体,产生于东汉之末。真正繁荣时期是
东晋,被称为
书圣的
王羲之的代表作《兰亭序》就是行书。由于行书比较实用,书写比楷书更为便利,又不像草书那样难认,所以仍是最常用的字体。
汉字的演变,大体经历了
甲骨文——
大篆——
小篆——隶书——草书——楷书——行书等几个阶段。这是符合文字的发展由繁到简,由不规范到规范的规律的。甲骨文、大篆、小篆可以合称篆书。那么,篆、隶、楷、行、草书便构成了
中国书法的五种字体。楷书和行书还在应用着,而篆书、隶书、草书,特别是篆书已不在日常生活中应用,只作为一种
书法艺术存在了。
现代汉字是指楷化后的汉字
正楷字形,包括
繁体字和简体字。现代汉字即从
甲骨文、
金文、
大篆(籀文)、
小篆,至隶书、草书、楷书、行书等演变而来。汉字为汉民族先民发明创制并作改进,是维系汉族各
方言区不可或缺的纽带。现存最早的汉字是约公元前1300年殷商的甲骨文和稍后的金文 ,西周时演变成籀文,再到秦朝的小篆和隶书,至汉魏隶书盛行,到了汉末隶书楷化为正楷。楷书盛行于魏晋南北朝,一直通行。
汉字内容丰富,但有些应有的读音、特殊或新意思的汉字欠缺,尤其是创新意义的汉字应当不断完善、发明,这是一种进化,至少凡是拼音可拼出的都应当有对应的汉字:如图例:
汉字性质
从汉字跟汉语的个体单位的对应关系看,汉字是一种
语素文字(表意文字)。从汉字的内部构造来看,可以分成
形旁(根据意义构造的有理偏旁)、声旁(根据声音构造的有理偏旁)和配旁(没有根据的无理偏旁)3种偏旁部件。早期汉字很接近图画,只有1个偏旁的字叫做
独体字,多一个偏旁的叫做
合体字。合体字可以分成
指示字、
会意字和
形声字,主要是后面两种,特别是形声字占80%。
(1)形声字
形声字由表示意义的
形旁和表示读音的
声旁两部分组成。拿构造最简单的形声字来说,形旁和声旁都是由独体字充当的。作为形声字的组成部分,这些独体字都是有音有义的字。不过形旁只取其义,不取其音,例如“鸠”字的偏旁“鸟”;声旁则只取其音,不取其义,例如“鸠”字的偏旁“九”。 随着表达越来越丰富,形声字逐渐增多,汉字中
甲骨文中形声字比例为20%,到了《
说文解字》就占到了45%。由于字义和字音的演变,有些形声字的形旁或声旁已失去了表意或表音的功能。例如“球”本来是一种玉的名称,所以以“玉”为形旁。“球”字不再指玉,这个形旁就没有作用了。再如“海”字本来以“每”为声旁。由于字音的变化,“海”和“每”的读音相去甚远,声旁“每”也就不起作用了。有的时候,形旁和声旁都丧失了原来的功能,例如“给、等、短”。这
一类字已经不能再作为形声字看待了。
(2)会意字
古人说“止戈为武”,“人言为信”。对于“武”、“信”两个字来说,这种解释是错误的。不过汉字体系里确实有按照这种方式造的字,例如“不正为歪”,“不好为孬”。这一类字的特点是会合偏旁的字义来表现整个合体字的意义。这种字为数很少,只有个别的例子。
形声字和非形声字之间并没有明确的界限。造字之初,形声字和它的声旁的读音本来就不一定密合。发展到
现代汉字,出入就更大了。有人拿7500多个现代合体汉字进行统计。就普通话读音来说,合体字跟声旁完全同音(声母、韵母、声调全同)的不到5%。声母、韵母相同而声调不同的约占10%。只有韵母一项相同的约占20%。如果我们只把前两类看作形声字,那么形声字大概只占通行汉字的15%。如果把以上三类全看作形声字,形声字大概会占通行汉字35%的样子。要是把标准再放宽或者完全根据来历确定形声字,那么通行汉字中形声字的
百分比还要高得多。还有一些理据模糊的字,看起来是合体字。一种是由于变化,原来的声旁和形旁已经失去理据价值,例如“给、等、 短”等。一种是原来的
独体字被分解成不同部件,例如“章, 按照汉代
许慎《
说文解字》的分析,“章”字从“音”从“十”。可是一般人说“立早章”(以区别于“弓长张”)的时候,是把它分析成“立”和“早”两部分。其实从
古文字看,“章”本来是一个独体
象形字,跟“音、十、立、早”都没有关系。
在汉字形成的过程中,由于部件的笔画化甚至讹化,以及
古今异义等原因,很多字难解甚至错解,比如有个奇谈:用错互换的“射”字和“短”字。寸身不是很短吗?射字其实是短字。豆矢就是飞着的箭,短字其实是射字。实际上射在
金文中就是引弓射箭的形象。不过在篆书中,左边被讹化成了“身”,右边的“寸”,“寸”作为构字部件同“又”一样是手的形象,而不是今天人们常用的“
长度单位”义。短是个形声字,“豆”是声旁即便认为“豆”也可能是形旁,豆,食肉器也,造字部件中多为这个意思,而人们所熟知的“豆”义后起得多,是个假借用法。