陈嘉映:约定用法和"词"的定义

选择字号:   本文共阅读 8006 次 更新时间:2008-12-02 13:31

进入专题: 语言哲学    

陈嘉映 (进入专栏)  

“词”的定义一直是个难题。最常见的定义是“最小意义单位”和“最小造句单位”两种。在古汉语里,一音一义,叫作“字”,除极少数连绵词外,每个字都可以自由移动,都是造句单位,所以,“最小意义单位”和“最小造句单位”是一回事。上古以后,通过意义兼并、近义词结合、习惯用法等等,多音语词渐渐多了起来,“最小意义单位”和“最小造句单位”就不再相合。“英”是“最小意义单位”,但它不能直接用在句子里了,而是“英雄”、“群英会”这些语词的一个成分,所以不再是“造句单位”。另一方面,区分多音语词和词组也成了颇为复杂的任务——我们根据什么说“理想”是个词,“十九”是个词,“你讲”和“十八”则不是单词而是词组?这些都是语言学的难题——“我们怎样知道哪些是词?语言学家进行了长期探索,试图设计出可行的标准,但还没有一个完全成功的”(克里斯特尔,145页)。但这个难题不是专属语言学的,它也一直为哲学所关心。‘词’的定义涉及“意义”问题,而意义理论通常认作是语言哲学的核心,仅此一点就可说明为什么‘词’的定义问题是语言学和哲学的交汇点。

本文以王力先生对“词”及相关概念的定义为线索展开讨论,依据对“定义”和“约定”这两个概念的哲学思考,尝试为解答这个问题提供一二线索。

最小的意义单位

王力常把“词”定义为\"语言中的最小意义单位\"(王力,一,16页)。这是一个极常见的定义,但也一直有人反对用意义、观念来定义“词”,因为意义等等似乎都是内在的东西,没有提供形式特征,用来下定义有点若即若离。王力自己引Noreen的反对意见,举triangle和three sided rectilinear figure为例,称二者意义相同,但前者是一个词,后者是四个词。王力辩说:“但是咱们不妨说triangle只有一个意义,而three sided rectilinear figure却有四个意义。Triangle是个综合的概念,three sided rectilinear figure是四个分析的概念;它们虽然同指一物,而我们用此两种说法时,思维的方式显然不同”(王力,一,16页)。Noreen和王力双方的表述,都有不少疑点,但一一讨论难免蔓生枝节,我在这里只想指出,1,自从弗雷格区分了Sinn(含义)和Bedeutung(指称),一般只宜说triangle和three sided rectilinear figure所指相同,不宜说两者“意义相同”,把一个人叫作“圣神皇帝武则天”还是叫作“伪临朝武氏者”意思显然是不一样的。2,我们一般只能说“力的平行四边形法则”是一个概念,而不是四五个概念,同理,three sided rectilinear figure也是一个概念。3,可以用three sided rectilinear figure来解释triangle,rectilinear就是分析的概念而triangle就是综合的概念,那么,可以用in a straight line来解释rectilinear ,rectilinear岂不又成了综合的概念?

这里虽不能细致讨论这些疑点,却应已显明,在关于“词”这个概念的基础分析方面,情况实在是相当混乱的。

何况,\"最小的意义单位\"这个用语本身就很含混。钟表可以分解成一些零件,药剂可以分成一些剂量单位,但意义能分解为怎样的单位呢?奥斯丁曾指出\"意义的一部分\"是个没着没落的用语(Austin,31页),\"意义的单位\"这话则更难成立。人们也许认为,既然意义是可以分析的,例如我们常说“分析一篇文章的意义”,那么最终总会分析到最小的单位。然而,把一样东西分解成较小的部分,只是“分析”的一个范式,一个最简单的范式,我们还在其它很多意义上说到“分析”。Three,side, rectilinear,figure,哪一个都不是比triangle更小的单位,straight和line也不是小于rectilinear的单位。

简单的意义单位

\"最小意义单位\"这个定义的另一个麻烦在于,人们很容易把\"最小的意义单位\"混同于“简单的意义单位”。王力本人有时就把词定义为\"一个简单的意义单位\" (王力,二,171页)。\"最小\"和“简单”固然有相通之处,但“简单的意义单位”实比“最小的意义单位”更为费解。\"知识\"、\"法\"、\"衍射\"、 \"磁场\",这些都是单词,但何尝意义简单?

刘叔新把词定义为\"意义单纯的语言单位\"并举例说\"知识\"“表示一个单纯的概念”,与此相对,“知识分子”是个词组,其意义是“复杂”的(邢公畹,118页)。如何判定一个概念有多复杂,这是件颇为复杂的事情,但无论如何,\"知识\"是个很复杂的概念,至少和“知识分子”同样复杂。分子不但包含原子,而且还包含原子之间的关系,但恐怕没有人会说水分子比氢原子复杂。首先,这里涉及的是两个层次上的结构。但更为重要的是,“意义”是一种功能,谁会说水比氢的用法复杂,或钟比发条的用途复杂?

音义结合体:语素

\"最小的意义单位\"这个提法太含混,王力也承认“这不是完善的定义……怎么才算‘最小’?什么是‘意义单位’?”(王力,三,238-239页)我以为比较确当的提法应是\"语言中独立地具有意义的最小声音单位\"、“最小的音义结合体”或诸如此类 。这个定义不问词义是否还能分解为更小的单位,问的是一个语音是否还能分解为具有含义的语音单位。Beacon固然可以分解为bea和con两个音节,但这两个音节各自或者没有意义,或者其意义不能说明beacon的意义。“醉”是“承载意义的最小单位”,一方面,若把它分解为更小的单位,z和ui,那是些没有意义的声音 ;另一方面,“他喝醉了”固然承载意义,但它不是承载意义的最小单位,因为它是由‘他’、‘醉’等更小的音义结合体组成的。

“最小音义结合体”是一条值得追循的线索,但拿它来作“词”的定义则有疑问。其中一条是它仍然和意义相连,缺少外在判别式,例如作为词缀的“儿”和“子”,怎样判断它们独立具有意义,抑或只是附加的符号? 但这个定义的最直接的问题在于语言学里普遍把承载意义的最小单位称为“语素”(morpheme)。语素是比单词低一级的音义结合体,固然,多数语素本身就是单词,如he,top,但也有些语素不成其为单词,如co-,pro-,trans-、-ness、-ism,它们符合“音义结合体”这个定义,但不是词。语素概念也早被引入来分析汉语(高名凯、石安石,148页),按照这种分析,在现代汉语里,“英”、“烈”、“鞠”,有音有义,是音义结合体,是语素,但不是词。

基本造句单位:独立成句与自由形式

Trans-、-ism、“英”之所以不成其为单词,是因为这些语素不能摆脱某些固定搭配,不能作为一个独立的单位造句。看来,我们应当从造句功能方面来给词下定义。很多教科书把“词”定义为\"最基本的造句单位\"(高名凯、石安石,105页;张志公,126页)。

\"基本造句单位\"这话有两种解释,一种是理解为“能够单独成句的单位”(Bloomfield,178页),一种是“自由形式”。

王力反对用‘单独成句’来定义词,因为这样一来至少得把“吗”“之”这些单词都排除在单词之外(王力,一,17页)。其实,不仅很多虚词不能单独成句,多数副词都成问题,其它的词类中也有不少例子。‘都’、‘已经’、‘满地’、‘得到’、‘度数’,显然都是单词,却从不独立成句。英语里的the也是个难题。不仅有这些实例为证,而且,从道理上说,我们也没有什么根据把‘是一个词’和‘能够单独成句’联在一块儿。单词独立成句本身是个值得讨论的现象,但它与词的定义没有直接关系。

赵元任基本上同意“单独成句”这个定义,但他提出了不少附加标准(赵元任,二,79页、86页、101页)。陈光磊赞成这个定义,他认为这个定义不会把“吗”、“之”等等排除在单词之外,他的解决办法大致是说,一个句子里,把符合“能单独成句”这一定义的词拣走,剩下的单位虽然不能独立成句,却同样“具有词的身份”(陈光磊,9、10页)。‘他来了吗’这句话里,‘他’和‘来’能独立成句,把这两个词拣走,还剩‘了’和‘吗’,于是这两个单位也是词。这是个奇怪的标准,似乎主张无论能否独立成句,都是词。那么,“壁灯”里的“灯”可以独立成句,“壁”也就自然要算作单词了。

我觉得不应把\"基本造句单位\"理解为“能单独成句”,而是理解为‘自由成分’或‘自由形式’(free form),一个自由形式是不粘附于其它语言成分的单位,它不必须和某个其它成分连用而能和别的单位自由组合 。 “我”、“是”、“看见”可以出现在无数种前后文里,在合乎句法的条件下可以和任何语词搭配,是典型的自由形式。相反,“英”这个字只出现在“英雄”、“英俊”、“群英会”等特定的搭配之中,所以它不是自由形式。另有一些字,如‘取’和‘笑’,在‘取笑’这话里粘连在一起,不能自由移动,在‘取订单’、‘笑他弟弟’这些话里则是自由形式。至于“龌龊”,‘龌’只带着“龊”,“龊”永远跟着‘龌’,两个字分开来都没什么含义,自然更不是自由形式了。

“造句”和“单独成句”显然是两码事,用‘满地’造句,不是把“满地”当作一个句子。那么多教科书混淆两者,令人惊讶。有论者已经把\"基本造句单位\"明确界定为“在语句中能独立活动的基本语法单位”,接下来立刻又把这话解释成“能够单独成句”(陈光磊,9页)。

扩展法

我们讨论了\"基本造句单位\"和“语素(最小音义结合体)”,它们是两个不同标准。当然,大量语素同时也符合“造句单位”这个定义,在这个定义下成其为单词。这样的单词多称作“单纯词”,我觉得称作“元素词”似乎更好些,“我”就是一个元素词。但有些语素则不能用来造句,只能用来构词,作为某些单词的词素,例如现代汉语里的“英”、“始”。更多的情况下,同一语素有时是元素词,有时是一个词素,如‘取’和‘笑’。‘龌’和“龊”根本不是语素,所以既不是单词也不是词素 。

比起“音义结合体”,“基本造句单位”这个定义看来有一个优点,那就是可以由外在的标准来判别。最通用的判别方法是‘扩展法’或“插分法”:我们想知道hit the man 是一个单词还是三个单词,我们可以试着在hit和the之间以及the和man之间插入另一些语言成分,看看成不成话,例如把它扩展成为 hit and killed the young man,现在我们看到the的前后都插入另一些成分而仍然成话,于是就确定hit the man 是三个单音节的单词而不是一个三音节的单词。相反,在youngest中间,在young和-est之间,无法插入任何别的成分,由此可知youngest是个单独的词。同理,some thing是词组而something是单词,因为我们说some good thing,但只能说something good。由此也可知,虽然un-、-est、-ness等等可以加在很多词上产生新词,但它们本身只是词缀,不是单词。

很多研究汉语的学者也采纳扩展法来区别单词和词组(王力,一,46页;高名凯、石安石,106页),有些在运用时有所变通(参考:陈光磊,13-14页)。根据扩展法,可以判定‘老婆’是单词而‘老人’是词组,在‘老人’之间可以插入别的字,扩展为‘又老又丑的人’,但‘老婆’中间就插不进任何别的字了。“马车”可以扩展成“马拉的车”,所以是词组,不是单词。 \"说话\"和“取笑”都是动宾结构,但一个是词组,一个是单词,“说话”可以扩展为\"说大话\"\"说废话\",\"取笑\"中间则不能再插入任何语词(王力,一,46页)。

我们也可以反过来使用扩展法:在“英雄”、“英俊”、“群英会”等等搭配之中,“英”与另一个语素之间都插不进别的成分,由此可知在现代汉语里“英”是语素但不是单词。

我们用扩展法来判别\"自由形式\",而不是用它来判别“最小音义结合体”,由扩展法可知“英烈”不能分解为更小的自由形式,但这不等于说“英”和“烈”不是最小的音义结合体。然而,王力却同时采用这两种定义:“词是由句子中分出来的最小意义单位,这就是说,词是句子所由组成的各个可以独立运用的部分”(王力,三,238页)。我个人以为这样一来不是解决了而是掩盖了我们的困难。

扩展法的缺陷

扩展法的一个优点,是它能提供外部标准。但这个优点其实十分有限,我们说允许在一个语言成分之间插入其它成分,当然是说插入了其它成分而意思没有大变。我们凭什么说‘老婆’不能扩展成‘老年的婆婆’?因为“老婆”和“老年的婆婆”意思不一样。然而,把“马车”换成“马拉的车”,意思就当真没变吗?一辆车现在由骡子拉着,我们仍然叫它“马车”,用马来拉一辆小汽车,这辆小汽车并不因此叫作“马车”。这个质问虽然有点刁钻,但的确需要回答。总的说来,“意思不变”、“意思一样”是极难澄清的概念。但无论意思变了还是没变,总要对意思有个了解,而这种了解恰恰又回到了“内在”方面去了。

而且,我们根据什么规则允许把“马车”换成“马拉的车”,而不是仅仅换成“马的车”?“马车”可以扩展为“马拉的车”,那么‘火车’呢?‘卧车’、‘机车’、 \"大车\"、“铁路”呢?我们能否说火车是火力推动的车,铁路是铁轨铺成的路?如果提供不出一定的规则,说不定所有的复音词都能扩展,即如 \"取笑\",亦可扩展为“取其短处加以嘲笑”。

而且,在西语分析中采用扩展法就会碰到不少模棱两可的案例,应用于汉语分析,疑难的例子更多。王力承认有时会碰上分不清的例子,如\"干儿子\"、“帝国主义”等(王力,一,14页)。进一步的验试发现疑难实例远比\"有时\"更经常。“物理”(物之理)、“宇宙”(上下四方为宇,古往今来为宙)、“六边形”、“法律学”,算不算合乎扩展法?此外像‘人心’、‘打倒’等动补式组合通通可以插入“得”字“不”字,不知还该不该算作单词。再如‘鞠躬’这样的语言单位,人人都会认之为单词,却可以扩展为‘鞠了个躬’。另一方面,“含沙射影”,“天将降大任于斯人也”等成语、熟语在句子里总是连在一起用的,不能在中间插入别的成分,但因此可以说它们是单词吗?

扩展法看来有很多缺陷,所以王力说它是‘在没办法之中想办法’(王力,一,46页)。

仂语

即使\"马车\" 、‘说话’等等不是单词,但它们总比一般自由词组结合得紧密,我们的实感总觉得它们和“大车”、“取笑”更近些,和“一匹白马拉的破车”或“说了一上午的话”远些。王力采用‘仂语’这个概念,就是为了解决这个问题。貌似单词而经不起扩展法检验的复音语词,都是仂语。仂语是汉语里一个庞大的中间体,一边与复音词邻接,另一边和自由词组邻接。

一大批通常看作单词的,采用扩展法判定,失去了单词的身份,那么用‘仂语’或一个什么范畴把它们揽回来,似不失为补救之方。然而,我们应当怎样定义“仂语”呢? \"凡词群没有句子的作用者,都是仂语\"(王力,一,42页)。这个定义实在糟糕透了,按照这个定义,\"马车\"、\"马拉的车\"、\"这辆从来没有任何人动过的车\",都该归在仂语里。但显然,\"马车\"的结构、功能和具有意义的方式显然都和‘挡车’、\"大车\"这些标准的单词更为接近,和\"这辆从来没有任何人动过的车\"则不可同日而语,故有论者说:“我们把它(‘马车’)当作一个单词看待,也不能算错,而且在习惯上是很自然的”(文炼,226页)。我可以肯定,王力心目中的仂语,只有“马车”、“说话”一类,而没有\"这辆没人动过的车\"一类。正是在这个意义上他会说\"仂语在原则上等于一个单词的用途\"(王力,一,45页),否则\"这辆从来没有任何人动过的车\"怎么会\"等于一个单词的用途\"呢?定下了这一点,并没有使问题消失:“马车”之类,和完全自由的词组之间的界限该怎样划定?

外部标志:拼写与语音

从意义方面来下定义,在很多语言学家看来,全然没有外形上的标志,简直只有存乎一心的判别标准。“造句单位”可由扩展法判别,似乎有了从形式上加以判定的标准,可再追一步,扩展法仍然依赖我们对意义的了解,我们不能把‘老婆’换成‘老年的婆’,只因为“老婆”和“老年的婆”意思不一样。

科学偏爱具有形式标志的定义,在这一点上,语言学殊非例外。可是在哪里能找到较为确实的形式标志呢?在拼音文字里,似乎有个简捷的办法:看一看语词是怎样书写的。然而,谁能单凭这一点来确定roadblock是一个词而road machinery是两个词呢?“海滩”在英文里有时写成sea shore有时写成seashore,那么它是一个词还是两个词?至于中文这样的非拼音文字,书写特征就更不足为凭了。

其实,“语言学所谓形式就是音,并不是文字学所讲的‘形’”(赵元任,三,64-65页)。语言学专家总期望通过实测语音之间的间隔来确定词这个单位。可是这项工作得不出什么决定性的结论,因为“在实际说话时每个词之间不会有停顿”(克里斯特尔,145页)。虽然我们可以找到词这个单位的一定语音特征,但无法单凭语音特征来确定单词之间的界限。有教科书称“词的语音形式独立、完整而固定”(邢公畹,119页),然而却不曾提供任何证据资料,所以不足为凭。其实,单靠语音无法界定单词,这一点早有定论:“词是语言单位,而不是语音单位,仅仅对连续的话语进行语音分析不能告诉我们这段话是由多少个词组成的,也不能告诉我们词与词之间的界线。这是语言学家早就承认的、无可争议的事实”(叶斯柏森,108页)。近几十年的继续测试并未改变这一结论:\"如果全然不知道词的意义,简直不可能确定一个词在哪里停止而下一个词在哪里开始\" (Bolinger and Sears,42页)。

陆志韦很早就指出单根据声音来给词下定义是不可能的,而且这个办法在汉语尤其行不通,他举的一个例子是“代表”和“戴表”(陆志韦,14页)。王力的看法也是这样(王力,三,240页)。陆志伟自己采用的方法叫作同形替代法(陆志韦,15-26页),这个方法没有被后人普遍认同,他的工作可说是后继无人。赵元任曾对这个方法的主要缺点做了说明(赵元任,三,236页),不过他认为把某些语音特点和同形替代法综合起来考虑,“也许会产生出一个跟其它语言的word很相似的概念”(赵元任,三,239页), ‘这些因素(重音声调等)看来至少能给出部分答案’(赵元任,三,237页),但他同时也指出,汉语复合词固然有轻重音型这一特定的音型,但“在这一方面,词组跟复合词没有区别”(赵元任,二,79-80页、190页)。

基本单位,是词还是字

我们无法通过科学方法找出带有明确外形标志的定义。同时,“最小音义结合体”和“基本造句单位”至少对现代汉语而言都不是合适的定义。还有一种定义,简简单单只说“语言的基本单位”。“语言的基本单位”实在太笼统了,乃至有论者用它来定义“句子”。我颇喜读的一位论者,竟在同一本书里一时明称“词是语言的基本单位”,一时又称“(语言的)基本单位是句”(朱星,5页、62页)。

为“词”下定义的工作陷入困境,根本的原因也许在于‘word这一级单位…在汉语里没有确切的对应物’(赵元任,三,233页)。在西语里,语言的基本的单位是词,在汉语里,是字:“在中国人的观念中,‘字’是中心主题,‘词’则在许多不同的意义上都是辅助性的副题”(赵元任,三,248页)。

赵元任提倡在汉语研究中以“字”这个概念来代替“词”作为最基本的单位,并列举这一主张的的多种根据。‘字’这个概念的外延很清楚,字读出来是一个音节,写出来是一个方块。小学校里最初一个一个教的,任何语文工具书必须一个一个解释的,就是‘字’。

在一个基本的意义上,汉语的字和西语的word大致相当,在西语里,虽有个别的语素不成其为词,但绝大多数的语素本身就是单词(元素词),而在汉语里,除了连绵词那样的少数例外,所有语素都是字。在西语里,复合词是由元素词构成的,汉语里的复合词则是由字组成的。语言学的中心任务是研究语音和语义的联系,因此,确定最小音义结合体始终是语言学的一项中心任务。汉语里,音义结合体就摆在日常层面上——字,那我们还有什么道理不从字开始讨论汉语呢?

王力明确反对以字为基本单位,主要根据是“字在语法是没有地位的”(王力,三,237页),“葡萄”的“葡”,“刀子”的“子”,“铁路”的“铁”,都是一个字,但这里的“铁”是一个词,“子”是一个词缀,“葡”什么都不是,语法地位完全不同。王力坚持以词为基本单位,是从语法的普遍性着眼的,甚至包括对中文拼音化的预期。同样,陆志韦对“词”这个概念的研究,可以说根本就是由推崇白话和拼音化促动的(陆志韦,3页,12页)。的确,语言学作为一门科学似乎总应力求获取普适性。字是单属于汉语的东西,若最基本的概念就各自不同,似乎就很难建成一门科学了。“词”这个单位却是各种语言里都有的,以词为基础,似乎有利于把汉语研究和一般语言学研究统一起来。何况,现代汉语正在向复音的语言单位转变,无论在理论上还是在教学实践中,即使第一步确定了以字为基本单位,下一步仍要面临区分复音词和自由词组的问题。所以,赵元任虽然断定“在中文里,跟英文的word相当的社会学上的单位就是字”(赵元任,二,72页),但他还是下了好大的功夫来界说“词”(赵元任,二,第三章)。

两条主线的分合

汉语里没有word这一级单位,比较接近的对应物是字。那么,我们为什么不径用“字”来翻译word呢?为什么还要说word这一级单位在汉语里没有确切的对应物呢?如果讨论的是古汉语,我们大概是要用“字”来翻译word,但到了现代汉语,字和word出现了一个主要的差异:word是自由形式,而前面已经多次讲到,很多字在现代汉语里不是自由形式。所以,我们面临的问题始终是:音义结合体和造句单位哪一个是主导语词研究的线索。但我们既然更愿把word译作“词”而不是“字”,从这一点看,word或“词”的本质似乎更偏向于“造句单位”而不是偏于“音义结合体”。赵元任固然称“一个方块字就是一个词”(赵元任,二,93),但他主要是用“造句词”或“句法词”这个概念来对应word这个单位的,依循的仍然是造句单位这条线索,例如把造句词定义为“前后可停的字组”(赵元任,二,102)。

西语word这个层次是主要的层次,因为绝大多数语素同时也是单词,只有trans-、—ism等少数例外。所以,西语研究以自然概念“词”为基础层次,以理论概念“语素”为辅助,整个理解构架颇为自然。汉语的构造似乎不如西语幸运,最重要的自然概念“字”标识的是音义结合体 ,其中一半是自由形式(词),一半不是。“语素”这个概念,原是为研究西语发明的,若用“词”和“语素”这样的理论架构来套现代汉语,则我们日常最熟悉的层次——字——大半落进了生僻的“语素”范畴,从而使理论显得很不自然。在西语里,大量多音节词的各音节本身没有意义,汉语相反,构成多音节词的音节本来差不多都是有意义的,而多音节词的意义即使不能由其成分的意义充分说明,却有相当紧密的关系。“多嘴”是个单词,不像“小嘴”是个词组。\"多嘴\"的意思虽然不能完全从\"多\"和\"嘴\"的字面上得出,但显然基于这两个字原有的意思,不像beacon,其意义和bea和con了不相干。“英烈”和“英”与“烈”的关系就更紧密了。所以,用“语素”来讨论汉语不很自然。

用“语素”和“单词”对照的框架来分析汉语,和我们对语词的实感也相去甚远,例如“英”“烈”被认作词素,“稳”“定”则本身是词,“英烈”和“稳定”的构词就实感而言有多大差别?再则,拿汉语里的‘英’、‘扩’、‘始’来和英语里的trans- 、un-、-ness一类比照,不同之处大于相同之处。1,英语里的这些亚单词语素,主要是前缀、后缀,汉语里是否存在词缀,则有争议,即使存在,也很不发达。2,作为词缀的语素,含义极抽象,而‘英’、‘扩’等汉字,含义像其它单词一样具体。3,现在所谓语素,在古汉语里都是单词,而古汉语和现代汉语可以交叉使用,‘始于’、‘自某月某日始’这类表述现在仍很常见。最近北约开始考虑东扩,这里的‘扩’显然是个单词。

汉语里语素和自由形式既然不重合,似乎迫使我们作出选择。侧重音义结合体,似乎应接受赵元任的建议,以字为基础单位,若侧重造句单位,则应以词为现代汉语的基础单位。

侧重音义结合体还是侧重造句单位,这两种不同倾向也体现在对其它相关问题的分歧上。当不好认定某一复音语词是单词还是“仂语”的时候,王力建议宁可把它认作仂语而不认作单词,因为汉语毕竟是以单音词为主的(王力,一,47页)。相反,陈光磊则建议把这样的语词认作单词,这样会对句法分析更方便些(陈光磊,13页)。

当然,最好是把两条线索都保持住。前面说到,王力实际上是以双重标准来定义词的,一方面把词定义为最小意义单位,另一方面又采纳用来判别“基本造句单位”的扩展法。然而,若不从本质上或结构上抓住这两条线索的结合处,同时采用两种定义就成了折中主义,只是在两个平面上摇摆而已。

定义的用途和种类

我们从寻求“词”的定义开始,转了半圈,却开始怀疑 “词”在汉语里是不是个重要的概念,那么,我们的任务不是变得无足轻重了吗?这样的看法,基于对定义这项工作的误解。

我们为什么要给一个概念下定义?据说是为了“揭示概念内涵(本质属性的总和)”(辞海哲学分册,433页)。这个回答经不起推敲。我至今不会定义“书”字,但我显然懂得这个字,了解它的“本质属性”。其实,我们在定义之前,必须已经懂得这个概念,否则我们凭什么给它下定义,又根据什么来判断某个定义是对是错,是优是劣?不仅如此,定义通常也不带来更确切的理解,我很难设想对“书”的哪种定义会使我更确切地把握这个概念。

不过,若我们在定义之前就已经懂得一个概念,那我们就必须重新回答:定义是干什么用的?定义有多种多样的用途,这里列举最常见的几种。1,临时限制性的:自然概念只有通常的用法,没有固定的用法,因此你我在讨论的进程中常要临时给某个概念加上限制,例如我在讨论过程中说明我所说的“社会主义”不包括北欧式的社会主义。这一类“临时定义”与标准定义相去甚远。2,解释性的:解释和定义颇多交错,我们有时采用定义方法来进行解释,例如“水星就是离太阳最近的那颗行星”。3,词典式的:词典的本职工作是解释语词,词典定义是解释性定义的一种,不过,由于词典失去了进行解释的上下文,所以需要提供一个“标准的解释”,或“完备的”定义。4,理论定义,这我们下一节就要讲到。5,教科书定义。这项工作常常陷入困境:比起词典来,教科书具有专科学术的特点,然而比起研究来,教科书又近乎词典的功能。6,在对自然概念进行概念分析时提供的定义,或称为概念性定义。

自然概念和理论定义

论者都注意到,无论采用哪一种方法给汉语的‘词’下定义,结果都不能让人满意。其实,这绝不限于“词”这个概念,也不限于汉语研究。

“词”是日常用语,我们平时用‘词’所称的,原不一定具有某一或某些共同点。这一点自维特根斯坦提出“家族相似”以来,就成了学术工作的常识。自然概念的界限模糊、波动、层层叠叠,在逻辑主义者眼里,这些都是自然概念的缺陷;无论用哪些共同点来定义word、“词”或“字”,总有例外情况。“语素”这样的科学概念则边界分明,没有例外。为了获得科学的理解,我们要么抛开自然概念采用人工概念,要么重新界定自然概念,使之精确。

然而,这种看法完全错失了自然理解和科学的关系。自然概念没有鲜明的界限,是因为自然概念是立体的,科学理论中的概念则是诸多可以折换的平面。自然概念的科学理论定义即该概念在一个平面上的投影,这个投影(定义)原则上不能穷尽这个概念在自然理解中的各种联系。何况,就像一件物体在不同平面上的投影不同,一个自然概念在不同理论体系中的定义也不相同,出名的例子是人的生物学定义、社会学定义、宗教定义,这些定义当然不会完全重合。

作为一个自然概念,“词”连接很多向度,它既是基本的音义结合体,又是基本的造句单位,又是观念的表达,又是“概念的个别形象”(洪堡特语)。“词”不能还原为这些意义中的任何一种,不如说,“词”是所有这些意义的结合,只不过我们不可以为这些意义互相独立,一一出现,然后结合在一起。“词”是允许这些意义实现的概念空间或概念结构。

理论定义用单一线条在平面上界定一类事物或一个概念,因此不可能充分定义立体的自然概念。然而,理论定义的目的从来不是满足周延完备的要求(涵盖全部所定义者同时只涵盖所定义者),理论定义是为理论建构服务的,其目的是把所定义的事物纳入一个可由某种理论加以解说的体系。周延完备只是词典定义的一项要求。

理论概念的单义性与自然概念的多义性不能放在同一个平面上衡量。“语素”并非碰巧能被“最小的音义结合体”充分定义——我们本来没有‘语素’这个词儿,我们是用定义方法把它引进的,所以它与定义完全吻合,不可能有例外。与其说我们用“最小的音义结合体”来定义‘语素’,不如说“语素”是“最小的音义结合体”的缩写,就像“电解质”这样的词汇一样 。

理论有时借用自然概念,如“力”、“光”、“价值”、“市场”。实际上,没有一门科学,包括自然科学,能够完全避开自然概念。当一种理论采用某一自然概念并提出某种定义的时候,与通常的期待相反,它无意于更准确或更深刻地把握这个自然概念,而意在从这个自然概念的概念空间中摸索一条线索,以便建立一个局部的系统(理论),突入某个题域。“哲学家和科学家似乎专门喜欢用违反常情的方式来给词下定义。事实上他们并不是想给词下定义,而是试图设立精确的概念。他们只是想用紧凑而成形的词来做概念的标签”(赵元任,三,231-232页)。现代物理学把光定义为一种电磁波,没有谁会坚持这是对“光”这个自然概念的界定。实际上,这个定义离开“光”的自然概念已如此之远,乃至它可以导出“不可见光”这样的概念。力学理论里的‘力’、‘运动’等等,何尝是我们通常所说的‘力’和‘运动’?我们看到一样东西一动不动,牛顿却说它在作‘匀速直线运动’。近代物理学通过重新规定‘力’‘速度’‘运动’等等基本概念,建立起从一个侧面重新看待世界的新框架。

当然,语言学不可能达到物理学那样的抽象程度或说对象化程度。物理学可以抛开“光”对人的意义来定义“光”这种对象,语言学却无法脱离语词对人的意义来定义语词。同样,我们无法想象与人的存在无关的“宗教”、“自由”、“爱情”或“法律”,这些概念无法充分对象化,从而伦理学和法学也不可能成为一门纯粹的对象性科学。

关于定义的几种常见误解

以上的简短考察应有助于我们在很多场合看清对定义的误解。

其一,很多论者用科学定义来界说自然概念,例如,“‘水’的意义是‘一种由氢二氧一组成的无色无臭的透明液体’”(高名凯、石安石,105页)。这样谈论“意义”或“自然概念”是不妥当的,在近代人了解水的化学结构之前很久很久,人们对“水”的意义就了解得很清楚了。

其二,本文开篇就提到,从意义、观念、概念方面来定义词,人们疑虑重重,因为‘意义’等概念比‘词’更缺少形式标志。其实,解释性的定义,概念性的定义,原本都无需提供形式标志。我们实际上不可能通过纯形式手段来确定词这个单位,但即使能够,这种专门的定义也不能取代自然理解层次上的定义,因为它不是平常人所能运用的,对平常人怎样确定什么是一个词并无帮助。像“音义结合体”这样的定义,处在概念分析领域的边缘,并不负担标示形式特征的任务。“词”的概念性定义不回答“所有被称作‘词’的东西的共同特征是什么”,而是回答“‘词’这个概念为什么是它所是的那样”,探索词这个概念是根据什么道理形成的。

其三,教科书上的定义模仿字典定义的完备,缺乏理论营建的构想。“词是代表一定的意义、具有固定的语音形式、可以独立运用的最小结构单位”(胡裕树,232页),这样的定义完全采用词典定义的形式,看上去完整无缺,实际上却把意义的、语音的、造句的三个平面硬拼到一起,既不能加深我们对“词”的意义的理解,也无助于构建任何理论。语言理论给‘词’下定义,其目的从不是找到一条界限不多不少把日常称作“词”的东西圈在一处,不是要在各种各样的词里找出共同点来,而是要‘营建’一个关于词的科学概念,可借以有效地建构某种语言理论。

在对定义的种种误解中,有一种颇为普遍也颇为恼人。人们在社会科学讨论中动辄要求对方给出一个用语的定义,彷佛我们的用语——尤其是关键用语——只要没有经过定义,就表明不懂这个概念,用它们来进行讨论就不够严肃。尤其那些专家的口气,彷佛我们不会定义“文化”、“国家”、“宗教”,就不配参与文化问题和政治问题的讨论。然而,我们也同样不会定义“远”和“跳”,虽然从三岁起我们就没有因为这些词遇上过大麻烦。如果一上来“儒学”和“宗教”就有双方一致同意的定义,“儒学是不是一种宗教”就完全成了名目之争了。进一步的思考将表明,像“文化”、“国家”、“宗教”这样的概念,根本不可能有唯一权威的定义,在实际的学术讨论中,只在必需定义的地方,才可要求定义,而所谓必需,指向不同的目的,有时是为了澄清用法的限制性定义,有时则是为推进理论建构的定义。

另一种态度与此正相反对,认一切定义皆为削足适履,笼统加以反对。这种意见,一脉相通于现下流行的反本质主义。它所反对的是一种常见的主张:抓住一个或一类事物的特点,就是抓住了本质,而这个特点,是由定义表述出来的。把本质理解为共同点,这是一种过于浅陋的看法,可惜,人们在识破其浅陋之时,不是更深刻地去理解“本质”,而是一哄而上鼓噪反本质主义。“本质”不是由单一线条界定的共同点,而是自然概念的多种向度所构成的立体空间,其实,无论黑格尔还是海德格尔,一向都在类似的意义上理解Wesen,本质、本在、曾在,或现象(不是单纯的复制而是新的闪耀)由以出发之处。反传统的风潮,固然都有历史的因由,但在义理层面上设定的靶子,几乎从来都是反叛者自己扎成的稻草人。

定义和本质

所谓“词的本质”,无非指“词”拢集各个向度所构成的空间——一个具有弹性的空间。“词”这个概念从来不是从所有词的共同点归纳出来的共相。什么人会要求我们把天下的单词或至少一种语言里的单词都摆到眼前,以便抽绎出它们的共同之处,从而确定词的本质?所谓经验主义的归纳法实是完全无视经验的主张。如果“词”的本质只和这个词那个词有关(作为这些词的概括或归纳),那么我们就永远无法了解词的本质了。然而,“词”这个概念是在整体概念空间中成形的。“词”不是指向词,就像“马”不是指向马、“如果”不是指向如果一样。“词”指向意义、概念、句子、音步、造句单位、音义结合,等等,和它们共同构成一个概念域。“词”的本质不可能由某一定义穷尽,关于“词”的本质的表述必然是多种多样的,它们的优劣不是由哪种表述精准度最高来判定的,因为这里主要牵涉的不是度量,而在于何处最能连结我们对词的多种理解向度。无疑,这个“何处”没有一定之规,总处在一定的因缘之中。

各种向度若成为依之审视实际语言的固定尺度,我们会得到不同的“词”的单位。这个结果,赵元任从另一个角度说出来:汉语里没有哪个单位正好和word相当,但是有“许多种形式类似word的单位”(赵元任,二,73页),有时他把这些形式统称为“word-like units”(赵元任,二,104页)。这给翻译设了个小陷阱,把word-like units译作“似词单位”,还是用了“词”这个词来翻译word,转了一圈,“汉语里只有类似于word的单位”变成了“只有类似于词的单位”,这话就不通了,因为词这个单位不是类似于词而就是词。其实这里要绕的弯子,何止于“词”?研究政治学的人岂不要说,中国社会里并没有什么东西正好和law相当,但有不少law-like的规章和建制。赵元任的提法适合作一个讨论的起点,毕竟“词”不是个译名,而是我们日常说用的一个词;所谓word-like units,其实就是我们泛泛而言时所说的“词”,所以,与其说我们只有各种“似词单位”,不如说“词”是包括各种略有差异的语言单位的家族相似概念。

梳理这样一个概念的主要向度,描述这些向度的结构,这就是概念分析。这可以说是哲学工作的本职领域。同时这也是科学与哲学的交壤地带——科学正是从这些概念内容中发掘建构理论的线索,通过重新定义这一概念把它转化为理论的起点。这一类定义是概念性的定义。

词的本质:约定用法与自由表达

回顾历来对“词”的各种各样的定义,音义结合体也好,造句单位也好,以“字”代“词”也好,不难看到,都是要确定某种“基本单位”。那么,什么是不基本的单位呢?自由词组和句子也是语言里的单位,但它们既然由单词这个更小的单位组成,所以它们不是“基本的”单位。

然而,句子和单词却不是同一个意义上的单位,正是由于认不清这一点,引起了经久不息的争论和广泛的混乱。从一个角度着眼,人们主张词是基本单位,从别一个着眼,人们又会主张句子是基本的单位。前面曾提到,同一位论者在同一本小书里就会一时把词另一时把句子当作“语言的基本单位”。

词是构成句子的单位,句子又是什么的单位?是一篇讲话的单位?一篇文章的单位?这样的思路错失了关键之点:词的用法是约定的,而句子、段落、文章等等都不是约定的。人们常说语言是交流、交通。那么,词就是我们进行交通的设施,而句子则是交通本身。交通设施是建好的,交通则依各人每天的需要进行。单词是约好的表达手段,句子则是自由表达。

约定用法与自由表达,即叶斯柏森所称的formulas and free expressions,这一组范畴提示出了语言的本质,恰如叶斯帕森所说的那样,“约定用法和自由表达 的差异渗透到了语法的各个部分”(叶斯柏森,7页),“约定用法可以是一个完整的句子,也可以是一个词组,或是一个词,或一个词的一部分”(叶斯柏森,13页)13。所以,他在《语法哲学》里开篇就讲解这对范畴。最重要的对照不是语素和单词的对照,而是约定表达和自由表达的对照。\"喷饭\"不能说成\"喷哺\",\"吐哺\"不能说成\"吐饭\",这是典型的约定;“我明天来”是典型的自由表达。有了“心细”“心碎”的成说,心思细碎就只好说心思细碎或心思琐碎,不能再说“心细”“心碎”。

音义结合体、造句单位,以及固定语等等,它们都是约定的用法,它们之间的区别在于约定/自由的程度各个不同。就自由的相对程度而言,突出的标志是一个语素造新词的能力(Hockett,307—308页)。就此而言,音义结合体和自由形式并非两条线索,而是从两个方面来看同一条线索。就造句来说,一个语素若不是元素词就是不自由的,但就造词来说则可以有很高的自由度。trans-、-ism之类,可称为“半自由形式”,别一种语言与之对应的,很可能是一个自由形式;这些出入在各种语言中没有一致性,显见为“偶然”的。“英”、“始”这样的字的自由程度更高,它们虽不是完全的自由形式,但在多种语言游戏里可以单独使用,包括造词、玩笑、对联。在同一种语言里,也会有一些自由形式生成或消失,这一点在古汉语向现代汉语的过渡中最为突出。

语言在各个层次上都有着程度不同的约定,整个语言可看作是使用完全约定的符号编制约定性质较弱而自由程度较大的符号,直至于自由的表达。“基本造句单位”立基于普通语法学来下定义,而从语言的本质方面来看,造句单位乃是一个特定层次上的、特别突出的自由形式。

我们可以按照约定的方式和程度,把汉语语词大致分为四个阶梯。第一级的约定是语素,大致就是字,如‘走’、‘大’。这是没有什么道理可讲的纯粹约定。第二级的约定主要是派生词和复合词。\"地震\"是约定的说法,不能说成 \"地动\",但“地震”这个约定是以“地”“震”这两个字原有的含义为基础的,所以是二级的约定。二级约定依据一定的道理乃至某些规则,但这些道理和规则是不充分不完整的。第三级的约定包括“分桃”、“瓜田李下”、“爱你没商量”等等,它们的意思不仅有赖于其组成成分,而且也有赖于某种语义之外的约定。最后是不经约定的自由表达或自由词组。“大车”是个约定用法,“大马车”是个自由表达。

一级约定,语素、字、连绵词

最基本的或第一级的约定是最小音义结合体,或语素。汉语里最小的音义结合体大致就是字。‘大’这个字是一级约定,“大”分解成d和a,这两个音要就没意义,要么其意义和‘大’没有关系。‘走’有走的意思,‘大’有大的意思,\"雨\"不指雪,\"跑\"不指跳,这些完全是约定的,没有道理可讲,只有单独学过才懂得其意义。

第一级的约定还包括\"鸧鶊\" \"囫囵\" \"蝴蝶\"这样的连绵词。连绵词是双音的,它们不是字 ,但也是最小的音义结合体,因为它与复合词不同,其成分没有独立的意义。

各种连绵词的约定程度稍有不同。\"囫\"和\"囵\"都不能单独使用, \"蝴蝶\"中的\"蝶\"却是可以单独使用的,例如\"庄生梦蝶\"。在现代汉语里,\"蝶\"是个独立成分,构成\"粉蝶\"\"蛱蝶\"等词,有如\"鳇鱼\"\"鲸鱼\"里的\"鱼\"字。不过,\"蝶\"和\"鱼\"的构词功能虽相似,\"蝴蝶\"和\"鲸鱼\"的构成却不完全一样,因为\"蝴蝶\"里的\"蝴\"不能拆出来使用,而\"鲸鱼\"\"鳇鱼\"里的\"鲸\"和\"鳇\"本身却是语素。复音语词里只要有一个字不是语素,它就是连绵词。若其中的两个字都是语素,它就不是连绵词,所以,\"蝴蝶\"是连绵词而\"鲸鱼\"是复合词。

有些名称是第一级的约定,如“海子”。外语词的音译通常也是第一级的约定,如\"坦克\"、\"逻辑\"、“托拉斯”。有些译名混合了音译和意译,如\"拖拉机\"、“来福枪”、“乌托邦”,按照对连绵词的定义,这些仍该算作一级约定。

另有一些复音语词,如打尖、扒灰、叨唠、捭划,其含义与其组成部分没有联系,或其联系已不可考,可视为纯粹约定,也可视为二级约定,为方便起见,我把它们都当作二级约定。

二级约定,复音词

“人造”,不说成“人制”,虽然“人制”的意思也能明白。 \"蝴蝶花\"不叫\"五彩花\"。“牙”和“齿”意思相同,但“齿冷”不能说成‘牙冷’。\"地震山摇\"\"地动山摇\"都说得,七级地震却不可以说\"七级地动\"。“人造”、“地震”、“齿冷”,这些都是约定的说法。它们是次级的约定,因为它们以已有的语词为基础,是由其成分的意义启动的约定。“白事”可以分解为“白”和“事”,这两个成分各有意义,而且其意义与“白事”的含义有关系,但是,‘白事’仍然是一个必须单独习得的语言单位。

一般说来,汉语里最基本的约定至少已经是一个字,那么二级约定当然两个字或更多。“别”这个字,来自“不”和“要”这两个音义结合体,但已经过了变形,汉语里的b和ie,并不单独表示“不”和“要”的意思,所以,我们把“别”看作一级的约定,不算二级的约定。而且,这样的情况在汉语里是很稀少的。

打尖、知道、唠叨,这些词间于纯粹约定和二级约定之间,所以连给它们起个名称也不容易,赵元任的中译本里有时称作“不能分析的字组”或“不能分析的复合词”(赵元任,二,106),但若不能分析,怎么说是复合呢,那就干脆叫作“纯多音词”、“真正多音节词”(赵元任,三,242)。这个现象在汉语里格外突出,因为常常是文盲认它们为纯多音词,读书人认它们为复合词,“不可分析的多音节词跟可分析(或已分析)的复合词之间的界线就比其它语言都更加飘忽不定”(赵元任,三,243)。为方便起见,我暂时把它们称作“混一词”,都当作二级约定。

二级约定的约定程度有深有浅,相差甚多。约定程度最深的如混一词,与一级约定不尽能分清。像\"蛊惑\"这种从古代流传下来的成说,约定程度亦甚深,我们很可能只知道它的整体意思而不清楚其词素的意思,不清楚\"蛊\"的意思。“打听”的约定程度明显高于“听说”。另一端,“闭上”的约定程度很浅,但仍应看作是约定,我们不说\"闭下眼睛\",虽然实际上我们很难说眼睛是闭上的而不是闭下的。

二级约定主要包括通常所说的派生词和复合词,派生词分解后得到是一个语素加一个词缀,而复合词得到的两个或多个都是语素。

派生词

汉语的派生词由一个词根和一个词缀合成,例如\"桌子\"、 \"肘子\",\"老师\"、\"老虎\",大李老李和小李。

词缀本来是有意义的,“不想撞见张驴儿父子两个,…那老张问道…有张驴儿数次调戏你女孩儿”(《窦娥冤》),何乐士评论说,由此可见,“‘老’还有些形容词的作用”(何乐士,54页)。直到今天,“老”也没有完全失去意义,“老张”也许不太老,但也不会很年青。在 \"老师\"\"老兄\"\"老弟\"\"老茧\"这些词里多多少少能体味出某种“老”的含义。不过,词缀原有的含义,即使仍有所保留,通常也比较浅淡,有时则已完全消失。\"老弟\"之\"老\",和\"老\"的本义已相去甚远,要在\"老师\"\"老虎\"\"老鼠\"这些词里去挖掘共通的意义,近乎徒劳。所以我们在这里还是应当把\"老\"看作词缀而不看作一个独立具有意义的单位。

派生词的结构比较简单,借词缀构成的单词不多,词缀的数目也不大。有一些字,该不该算词缀,尚有争论,如作者、智者,药性、革命性,氧化、现代化,激进主义、自由主义,我们、人们。‘主义’是从西语的词缀ism翻译过来的,因此有人就说它是个词缀,但它在汉语里和一般单词的作用差不多,最多称作‘准词缀’(陈光磊,20页)。‘们’独立具有意义,是个语素,但‘们’的含义高度抽象,起到的是语法符号的作用,不合一般复合词的构造方式,所以我愿把‘们’列入词缀。

复合词

组成复合词的单位,本身是音义结合体,但它们如此结合而有如此的含义,却不能完全推论出来。

我们所说的复合词,不仅包括王力所说的复合词(\"复音词\"),而且也包括他划作仂语的“说话”、 \"扩大\"等,这些语词也有约定的成分,只不过约定程度较低而已。王力曾表示:\"仂语和词的界限虽然有时候分不清,在语法是不关重要的\"(王力,一,46—47页),而且他也考虑过取消\"仂语\"这一提法(王力,三,241页)。在我看,既然仂语是与自由词组对照提出的,那么自然无论就用途而言还是就语法而言,它们都属于复合词的范畴。王力先生深受叶斯柏森的影响,奇怪的是他不曾注意到,只有从是不是约定用法着眼,才能把“用如单词的仂语”和自由词组区别开来。

作为次级约定,复合词夹在一级约定和自由词组之间。我们已提到有些复音语词如“打尖”、“扒灰”、“马大哈”,与一级约定难以分清,不过,这样的语词不算很多,而且,若要进一步清理,需要对一个个语词作专门的词源考证。

另一方向上,有些复合词也难以与自由词组分划清楚。我们在“扩展法的不足”一节中已指出仅凭扩展法不足以判断这种区别,例如不宜从“鞠一个躬”这样的用法判定“鞠躬”是个自由词组。在谈到复合词与自由词组的区别之时,更常见的说法是,复合词的意义不是“它的几个构成成分(字面)的意义的简单总和”(高名凯、石安石,106页),例如,‘白事’是‘白’和‘事’这两个字的有机结合,产生出了新的意义,不是‘白’和‘事’的‘机械和’(陈光磊,10页)。“有机结合”和‘机械和’这些提法不算错,但近于换了一个名称,理论上的解释力很弱。怎样算含义的简单相加,怎样算有机结合?组成复合词的那些词在结合中真改变了含义吗?在\"鞠躬\"这个词里,看不出“鞠”和“躬”哪一个改变了含义。其实,我们在“词的本质”一节里已经提到,就是自由词组和句子的意义也不能说成是其各个构成语词的含义之和。复合词与自由词组的区别还须进一步澄清。

约定与规则

虽然复合词与自由词组的实际界限有时难以确定,但复合词和自由词组从原则上有别,这个原则就是我们一贯强调的约定性。凡能由逻辑推导出来的,凡能根据一定的规则类推得出的,就不能叫作“约定”。由此可以知道,自由表达之不同于约定用法,在于它完全按照一定的规则来表达一个意思,而约定用法则不然。但这不等于说凡约定就一定不守规则,或没有道理。

\"约定用法的构成可以是有规则的,也可以是无规则的\" (叶斯帕森,13页)。有了规则,就能够按照这种规则类推,所以,叶斯帕森视自由组合法等于类推法(叶斯帕森,11页)。不过须注意,这里的关键不在于是否有时能够类推,而在于有时不能够类推。让我们用一个例子来说明这一点。

“窗子”和 \"桌子\"、“椅子”的构成是有规则的,我知道窗和窗子是一个意思,第一次听到“桌子椅子”,可以类推它和“桌椅”是一个意思。“口译”遵循另一类规则,我知道“口信”中的“口”是“口头”的意思,相对于白纸黑字而言,听到“口译”,类推得知它是“口头翻译”的意思,与笔头的翻译相对。然而不知何时,类推终止了。我们说“桌子”、\"窗子\",却不说\"门子\" ,说\"新娘子\"却不说\"新郎子\",说\"狮子\"却不说\"熊子\"。二级约定是有些道理可循的约定,就是说,并非完全不守规则,但又不可能尽由规则推导出来——若能完全推导出来,那就不是“约定”了。这也等于说:没有一定的规则告诉我们类推到哪一点就失效了,为什么就失效了。我听到“口译”、“口信”,但我想说“口头提供的证据”时能说“口证”吗?我们常说\"一等\"\"头等\"\"一流\",可偏偏就不说\"头流\"。“有时候意义相加虽等于相加的意义,可是不知道加起来成不成这个语言所用的词”(赵元任,一,43页),赵元任喜欢举的一个例子是法语用“四个二十,十九”来表示“九十九”。

这里我们接触到语言学里常讲的听话人和说话人的区别。之所以有这种差别,是因为大量的约定用法有一定的规则可循,但规则却不完整。我了解了\"子\"作为词缀的规律,即使第一次听到\"新娘子\",也知道它和“新娘”是一个意思,但如果没有听到过别人这样说,我自己不会说“新娘子”,就像我不会说\"新郎子\"。反过来,我自己虽然不会造出“口证”这样的说法来表示口头说出的证据,但我第一次听到“口译”却立刻可以推知它的意思是“口头翻译”,就像听到一个自由词组一样。叶斯帕森说\"学习固定语全凭记忆或重复已经学过的内容\" (叶斯帕森,7页),那是着眼于说话人而不是听话人说的。即使更强的约定,如“图书馆”、“司令”、“参谋”,听话人毋须从新学习也能大抵猜出意思,即使不够确切。

数理科学寻求的是完备的规则,在那里,听话人和说话人的逻辑地位是一样的。历史科学所要对待的却是一系列完备程度不等的规则。我们不能靠构词法构造出新词来,就像我们不能靠某些历史规律制造历史。但这远不等于说历史是一大堆偶然性的堆积。在必然和偶然之间有着广阔的原野。

包含“大”这个语素的语词,“大方”、“大员”、“博大”,大多数保留“大”的通常含义,这个叫“大米”而那个叫“小米”,这个叫“大老爷们儿”而那个叫“小媳妇儿”,道理相当明显。但也有些几乎没有规则可循,“大粪”是人的粪便,\"大车\"却是牲口拉的车。“人排泄的”、\"牲口拉的\",不包含在\"大\"的通常含义之中,我们学会什么叫“大车”,但不知道为什么叫它\"大车\"。但即使在这里,我们也不能断定毫无道理可言,牲口躯体大力气大,人的粪便肥力大。“大”不是一个由三五种固定意义合起来的语词,而是一个提供了某些可能用法的概念空间。

三级约定,固定语

我们上面讨论的约定是由语义促动的约定。但还有一些语词,它们之成为约定用法,要由特殊的历史文化因素来说明。吐脯、瓜田李下、爱你没商量,这些用语的特点在于,它们在字面的意思之上,另加了一层意思或一层韵味。我们把这类语词称作三级约定。这些语词的意义增建在词义之上,就结构而言,它们无异于别的复合词或自由词组。“吐脯”“喷饭”,结构上就是普通的支配格复合词,两者字面上的意思也差不多,但“背后”的意思相去甚远。\"玩的就是心跳\"结构上是个普通句子,一旦成了某种特定时代心情的标题,就是约定用法了。大致可以说,二级约定是依赖于语义上的约定,而三级约定则是依赖于历史文化的约定。英语表示速度之快的词如quick,fast等,都和心情之欢畅没有什么联系,但一个学习汉语的英国人不必了解中国哪一个特别的故事,就能够理解“快”这个字同时含有速度之快和心情之畅快,但他不读古典或注解就不可能知道为什么“吐脯”意指求贤若渴,“高山流水”意味着知音难觅,我们也无法从任何或全或偏或显或隐的道理向他解释“断袖”的同性恋倾向。从瓜田李下和天上地下的相同结构我们也推导不出同类的含义结构。

三级约定和二级约定有多种互相交错的情形,区分两者的同异形成了一个独特的题域。本文之所以讲到三级约定,主要因为它涉及对固定语的界说。固定语也称为固定词组、现成说法、习(用)语等,我同意刘叔新的意见(刘叔新,19-20页),选用“固定语”这个名称。凡约定的用法都可以称作“固定语”,就此而言,一级约定,特别是二级约定,都可以叫“固定语”。但我们在狭义上使用“固定语”,用来统指成语、谚语、熟语、流行语等。成语一般指书面上的固定语,谚语则指民间的固定语,日常生活中新近涌现的固定语,七八年搞一次、你别无选择、过把瘾就死,我称之为“流行语”。

教科书对固定语主要有两点界说,一是结构的完整性,二是意义的完整性(高名凯、石安石,107、108页)。从结构上看,多数固定语并没有什么特点,\"我是你爸\",\"一个不回家的人\",原是再寻常不过的话。就连\"吃了吗?\"也应该视作固定语。叶斯柏森就提供出很有力的理由,把How do you do和Beg your pardon都叫作固定语(叶斯柏森,5页)。如果“结构的完整性”是说“瓜田李下”不能说成“瓜田桃下”,“爱你没商量”不能说成“爱你不磋商” ,那么这显然不是固定语的特点,而是所有约定说法的共性:“口译”不能说成“嘴译”,“闭上”不能说成“闭下”。至于固定语意义的完整性,仍定义为“不是它的各个结构成分的意义的简单总和”(高名凯、石安石,108页),这仍然与对单词意义的说明是一回事。

在区别单词和固定语的时候,有些教科书的说法更不着边际。例如,有人把固定语解释为\"极常用的\"词组。固定语不是由频率决定的,\"昨天下午\",\"看电视\",这些话出现的频率极高,却不是固定语,\"藕断丝连\"出现频率要低得多,却是固定语。另有些教科书说\"组成固定语的词的意义明显,…由词所组成的固定语的意义则显得复杂\"(邢公畹,118-119页) 。我们在“简单的意义单位”一节已经批评过这种说法, \"玩的就是心跳\",意义有什么不明显的?\"北京大学\"(且不说它是个名称)的意义比\"大学\"的意义显得复杂吗?而且,\"显得复杂\"这种的用语也不适于用来进行界说。

其实,与复合词一样,固定语之有别于自由词组,仍因为它是约定的说法,只不过固定语的约定有时较为宽松,而且经常属于第三级约定,有特定的历史文化来源。

自由词组

通过对约定与规则的讨论,我们找到了区别二级约定与自由词组的正当线索。与各式各样的约定相反,在自由表达中,各成分完全根据规则联系在一起。由此我们可以知道,“马耳朵”是一个完全自由的词组,因为凡“动物名称”加“耳朵”的说法通通成立,例如驴耳朵、牛耳朵、兔子耳朵。根据同样的道理,可知“马耳”是自由词组而“木耳”则是约定用法,因为“某耳”这一构造只在“动物”范围内通行。“执牛耳”、也是个约定用法,但这属于刚刚讨论过的三级约定。

按扩展法,\"口译\"可以扩展为\"口头的翻译\",因此是自由词组,但按我们的标准,它显然是个复合词,我们不说\"嘴译\",也不说“口证”。当然,我们从\"口\"和\"译\"很可以领会\"口译\"的意思,因为\"口头的\"正是\"口\"的主要构词规则,\"译\"也是\"翻译\"构词的规则。

因为一个复合词总有一点约定的因素,所以这个单词多多少少都需要从新学习。但把单词和单词连到一起,则是基本的说话能力,不需要每次说一个新句子时再学习什么。只要懂得“经济”也懂得“新闻”,就会说“经济新闻”。懂得“子”也懂得“夜”,却要从新学习“子夜”;懂得“子夜”,就会说“子夜之前”;词是现成造好的,供我们使用,句子还等我们去造,所以我们说‘遣词造句’ 。运用约定的方式实现自由表达,这里有语言的全部奥秘。

因此,我们只问约定用法的意思,不问自由词组和句子的意思。我会问“‘袍哥’是什么意思”,我不会问“‘他是个袍哥’是什么意思”,除非我在“袍哥”两个字下加了重音,或者我干脆是在问“你说他是袍哥,你这么说是什么意思”——这句话我明白,我不明白的是你,你为什么说这话。而“小袍哥”则是一个自由词组,我只要知道“小”和“袍哥”,就知道“小袍哥”是什么意思。我怎么知道的?这等于问,我从来没有把自然数系列写到过100056,我是怎么知道100055后面跟的是这个数呢? 知道100055后面是100056是\"知道自然数系列\"的应有之义,知道“小袍哥”、\"小耳朵\"、\"小公寓\" 是基本的说话能力。依此类推是学习的基本机制。我们用这种方法学会展开一个代数式,用这种方法学会交通规则。我会说小嘴巴,小椅子,小房子,小瓶子,我就会说“小公寓”。

一级约定、次级约定和自由词组构成一个连续统,一端是完全的约定,即没有什么道理和规则的纯粹约定,另一端是完全的自由表达。这三个阶梯虽层层有别,但不是界限分明的,我们很难断定“打尖”是一级约定(元素词)还是二级约定(复合词),像“大吵大闹”这样的说法,算它固定词组还是自由词组都行。

总结:“词”的定义

本文主要考虑约定在词这个概念中的作用,没有打算全面研究词的定义问题。但是在结束本文之前,我还是愿意借一些粗略的线条勾画出我对这个问题的看法。

“词”是一个家族相似概念,可能沿着不同的主导线索形式化,所得的结论也不同。主要的线索,我认为有三条:音节的多寡,音义结合的方式,造句的功能。人们日常说到“字”、“词”,我相信主要是以音节多寡来定的:单音节的是字,双音节的是词,三音节的或是词或是固定语,四音节或更多音节的是固定语。这样,“词”一方面和“字”有分别,另一方面和固定语有分别。词和字合在一起,称作“字词”,词和固定语合在一起,称作“语词” 。凡一个音节,我们就说它是一个字。我们倾向于说“‘飞’这个字”,而不是“‘飞’这个词”。双音节的约定用法,不管是什么结构,我们都管它们叫“词”, “狐狸”、“英烈”、“稳重”,都是一个词——“狐狸”这个词只包含一个语素;“英烈”这个词包含两个语素,但这两个语素都不是自由形式;“稳重”这个词包含的“稳”和“重”都是自由形式。正由于音步的关系,人们会说“‘马车’这个词”、“‘海水’这个词”,虽然它们是自由词组。凡四个音节的,我们就不愿再叫它“词”,“一心一意”和“专心”都是二级约定,“分桃”和“瓜田李下”都是三级约定,但我们通常把“专心” 和“分桃”叫作“词”,而把“一心一意”和“瓜田李下”叫作“成语”或“短语”。只从语义而不从韵律学上来考察是无法说明这些现象的(冯胜利,8-9页)。

依此,我认为研究和讲解现代汉语语词应以音节多寡为主要线索,辅以音义结合的方式(约定的等级)和造句的功能(自由形式)。

一个音节,称之为“字”。绝大多数字都是一级约定的音义结合体,只有一种例外,即连绵词(“葡萄”)里的字,最多再加上混一词(“唠叨”)里的字。从造句功能上说,有些字如“就”、“飞”、“稳”、“重”是自由形式,有些字如“始”、“扩”、“英”、“烈”不是自由形式。不过,这一点也许不像很多语法学家设想得那么重要,乃至通常的字典都不表明一个字是不是自由形式。

“自由形式”只有在讨论字的时候才有实际意义,两个字和多个字组成的语言单位,区别只在于是不是约定用法(次级约定)而无所谓是不是自由形式。“袖手”是词而“就走”不是,“图书馆”是词而“他不管”不是,这种区别需要由造句单位这样的概念来分析,而这里何为造句单位又必然涉及含义约定。“他去”“风冷”都不是词,这既不能从韵律上确定,也不能从构造上看出来。“他杀”和“风寒”都是单词,由于它们都是约定的用法。

由两个字组成的约定用法,通常称为“词”。除了连绵词和不可分析的双音词,所有的词都是次级约定,这包括二级约定和三级约定。一个词由自由形式构成(“强大”)与否(“英烈”)在我们看来是个颇为次要的区别。

由三个字组成的约定用法,名词性的如“图书馆”、“人造革”等,通常称为“词”,其它类型的如“只不过”、“面对面”、“敲竹杠”则为短语。四个字以上的通常都称作“短语”(成语、谚语、歇后语等)。有三个字的词和一般复合词不同,它们具有两个层次的构词,“照相机”先分析为“照相”和“机”的动名结构,其中“照相”还可再分析为“照”和“相”的动名结构,所以陈光磊称之为“综合式复合词” (陈光磊,36页),我觉得也可以简称为“综合词”。

在西方语言里,word是自然概念,morpheme是纯理论概念,普通语言学以前者为主线,以后者为辅助。而在现代汉语,“字”和“词”都是自然概念 ,而现代汉语的结构,也的确有“字”和(狭义的)“词”这两个主要层次,而在这两个层次中,字这个层次要更重要些。在这个题域里,我们不宜直接搬用西方语言学的框架,倒是沿字、词、短语的顺序循序渐进来理解汉语的结构,最为妥当。有了这个框架,我们就可以大致划出“词”的范围来:所有双音的约定用法,按重要程度依次是复合词、派生词、混一词和连绵词;三音节里名词性的约定用法(综合词);最后还包括单音节(字)里的自由形式(元素词)。

参考书目:

Austin, J.L.,Philosophical Papers,Oxford Press,1961。

Bloomfield,Leonard, Language, New York, 1933。

Bolinger and Sears,Aspects of Language,Harcourt Brace Jovanovich, Inc.1981。

陈光磊,《汉语词法论》,学林出版社,1994。

冯胜利,《汉语的韵律、词法与句法》,北京大学出版社,1997。

高名凯、石安石,《语言学概论》,中华书局,1963。

何乐士,“元杂剧语法特点研究”,载程湘清主编,《宋元明汉语研究》,山东教育出版社,1992。

Hockett, Charles, A Course in Modern Linguistics, New York, 1959。

胡裕树主编,《现代汉语》,上海教育出版社,1981。

克里斯特尔,《剑桥语言百科全书》,中国社会科学出版社,1995。

刘叔新,《汉语描写词汇学》,商务印书馆,1990。

陆志韦,《北京话单音词词汇》,载《陆志韦语言学著作集》(三),1990。

齐冲天,“汉语单音节词的构成问题”,载《词汇学论文汇编》,商务印书馆,1989。

Ryle, Gilbert, \"Ordinary Language\", 载V.C.Chappell 《Ordinary Language》, New York, 1981。

王力,一,《中国语法理论》,《王力文集》第一卷,山东教育出版社,1984。

王力,二,《汉语语法纲要》,《王力文集》第三卷,山东教育出版社,1985。

王力,三,“词和仂语的界限问题”,《王力文集》第十六卷,山东教育出版社,1990。

文炼,“关于研究仂语的两个基本问题”,载王松茂主编,《汉语语法研究参考资料》,中国社会科学出版社,1983。

乌尔曼,“语言学的最近发展”,载岑麒祥编译,《国外语言学论文选译》,语文出版社,1992。

邢公畹,《现代汉语教程》,南开大学出版社,1992。

叶斯柏森,《语法哲学》,语文出版社,1988。

张志公主编,《现代汉语》(试用本),人民教育出版社,1982。

赵元任,一,《语言问题》,商务印书馆,1980。

赵元任,二,《中国话的文法》,香港中文大学出版社,1984。

赵元任,三,《中国现代语言学的开拓与发展》,清华大学出版社,1992。

朱星,《汉语词义简析》,湖北人民出版社,1981。

《辞海,哲学分册》,上海辞书出版社,1980。

进入 陈嘉映 的专栏     进入专题: 语言哲学    

本文责编:jiangxiangling
发信站:爱思想(https://www.aisixiang.com)
栏目: 学术 > 哲学 > 哲学专栏
本文链接:https://www.aisixiang.com/data/22842.html
文章来源:本文转自自选集《思远道》,转载请注明原始出处,并遵守该处的版权规定。

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2024 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号-1 京公网安备11010602120014号.
工业和信息化部备案管理系统