我們為什么要劃分詞類?作為一種語法研究方法,詞類劃分體現了怎樣的哲學觀和認知觀?詞類所示意義與話語深層結構有怎樣的關系?如何才能擺脫漢語詞類劃分的困境?本文將從認知心理的視角尋求問題的答案。
一、漢語詞類劃分的困境
詞類劃分一般遵循以下幾類標準。
1.詞法形態標準。具有悠久的歐洲語法學傳統,對形態豐富的印歐系語言等適用。它發生于古典希臘語地區,傳承于拉丁語地區,又主要發展成熟于法語、德語地區,這些語言都是典型的綜合語,語法意義的表達主要依靠繁復的詞形變化,詞序等句法手段則相對次要,這種語言環境下建立的語法學體系,重詞法、輕句法的取向是順理成章的。只是,形態變化少的語言不適用詞法形態標準,須從詞的外部另尋標準。
2.句法功能標準。通常,名詞充當主、賓語;動詞充當謂語;形容詞充當定語;副詞充當狀語,分工明確、職責清晰。但對漢語仍然不適用,試看:你快樂嗎?怎樣才能擁有快樂?快樂是人生的真諦。我愿做一只快樂的小鳥,快樂地面對每一天,也愿你每天都過得快樂!"快樂"可以充任全部六種句子成分,這是詞的兼類?抑或詞性活用?無怪乎我們感嘆漢語詞類研究的困局:若詞有定類,則類無定職;若類有定職,則詞無定類。既然形式無法解決,就只能求助于意義了。
3.概括語義標準。通常名詞表示事物、動詞表示過程、形容詞表示性質和狀態、數詞表示數量,等等。概括語義符合人們思維意識中對詞項所表達意義的主觀感受,在跨語言對比中也有較高的接受度,這反映了詞性應該具有超越具體語言的普遍基礎,而形態變化等反倒可能僅是一種外在表象。據此標準,"學習"表過程,是動詞;"成功"表狀態,是形容詞,但它們也都有名詞性的用法,因為我們賦予了"過程"和"狀態"被指稱的能力,它們已然演變為一種"事物"了??梢?,概括語義也不能完全解決詞類問題。
4.分布標準。結構主義把詞類看成詞的分布,在詞的組合和聚合中確定詞的地位和價值。實質上這是一種綜合標準:聚合關系體現的是同類個體的共性,類似于同類詞具有相同的詞法形態變化;組合關系則反映了詞的搭配成句的能力,實現的正是詞的句法功能;而詞的概括語義則隱含在這兩類關系之中。分布在漢語界的影響力是巨大的,若干重要的語法學著作無不以此作為詞類劃分的主要依據;然其效果卻褒貶不一,原因在于分布綜合了太多的標準,依此分出的詞類數量往往很大,即便如此,在一個小類的內部,仍然無法保證所有成員的分布特征完全一致;但是,依據分布劃出的詞類具有描寫精確、覆蓋全面的特點,這在計算機自然語言處理領域,顯示出一定的優勢。
針對漢語詞類劃分的困難,學界也不乏創見,現舉影響較廣的兩例:郭銳(2002)認為,詞從本質上說是詞的語法意義的類型,即詞的表述功能,如陳述、指稱、修飾等大的類型以及實體、位置、計量單位、數量、指示等小的類型。語法意義有不同的層次:性、數、格、時、體等表達的是較低層次的語法意義,是對概念意義的抽象;表述功能是較高層次的語法意義,它與語言的使用者關系密切,是在使用中表現出來的功能意義。郭銳進而又將表述功能劃分為內在和外在兩個層次,內在表述功能是詞語固有的表述功能,是歷時使用意義經約定俗成后固化的語法意義;外在表述功能是詞語在某個語法位置上所實現的表述功能,具有一定的靈活性。例如"小王黃頭發","小王"從哪個層面看都是指稱;"黃頭發"卻不一致,它的內在表述功能是指稱,外在表述功能則是陳述。
沈家煊(2009)提出了一種與眾不同的漢語詞類劃分方案:名詞、動詞、形容詞在印歐語中是分立關系,僅有少量的交叉;在漢語中則是包含關系,名詞包含著動詞,動詞包含著形容詞。這就很好地解釋了漢語中動詞可以充任主、賓語,形容詞可以充任幾乎所有句法成分的現象,但是包含關系卻不是分類的常規模式,名詞內部剔除動詞、形容詞之外的部分也應有相應的類屬,否則就無法構成一個平衡的分類體系。
漢語詞類劃分的困難依然無法解決,這促使我們反思,詞的定類與劃分作為一種語法學的研究方法,其科學性如何體現?它是否真能反映語言(特別是漢語)的普遍規律?是否是我們唯一的選擇?歸結為一個更為本質的問題:我們為什么要劃分詞類?
二、詞類劃分是符號主義語言認知觀的產物
回答這個問題,要從一種長期主導語言研究(乃至科學研究)的認知心理范式--符號主義(Symbolism)說起,該范式認為人腦的思維活動牽涉三類成員:一是源符號;二是規則系統;三是目標符號。思維過程可抽象為:一是源符號依次進入系統;二是規則對輸入符號進行加工;三是生成并依次輸出目標符號。符號主義著重于模擬人腦的功能,運用規則和符號的串行處理,就可以實現判斷、選擇、邏輯推導等思維運算。
上世紀30年代,Turing將符號主義機制抽象為一種架構簡單卻功能強大的數學模型--圖靈機,圖靈機的初衷是模擬人們利用紙筆進行計算的行為:一是在紙的某個位置寫上或刪除一個符號;二是把注意力轉移到另一個位置;三是一套模擬人腦判斷能力的處理規則;四是一個模擬人腦記憶能力的狀態寄存器(佚名,1977)。圖靈機架構具有強大的包容性,現實生活的許多問題都可以改寫為圖靈機可接受的形式,交由其處理。
之后,Kleene在圖靈機的基礎上定義了有限狀態自動機(Finite-StateAutomaton),并證明其等價于圖靈機。正則表達式(RegularExpression)是FSA的另一種實現,它由一套表達匹配規則的元字符組成,元字符的組合可以描述一系列特定模式的目標字符串。自此,圖靈機作為處理語言現象的標準工具得到廣泛應用。
現以RE為例,簡述其工作原理:w[a-z]*er[\\s]可以表示任何以"w"開頭,以"er"結尾的單詞。其中,w表示以w起始,[a-z]表示任意一個小寫字母,*表示[]中的內容可以重復0或任意多次,后面是字母er,er后的[\\s]意為空字符,表示單詞結束。這就限定了一個符合特定要求的字符串,同樣,只要稍加改動,我們不難利用RE生成一個符合"SVO"或"NP+VP"的句子來。
作為符號主義機器,圖靈機、FSA和RE的基本架構是一致的,歸結為有限客體在有限規則控制下經歷的有限狀態的轉移,包括五個要素:一是有限的輸入符號;二是有限的系統狀態;三是狀態轉移函數(有限的規則);四是系統初始狀態;五是系統終極狀態(正常終止狀態、錯誤狀態等)。
這就是符號主義范式認知世界和模擬人腦思維的基本單元。雖然它略顯簡陋,但多個單元組合成系統后,就具有了強大的處理能力,足以解決生產生活中的大部分問題。我們編寫的計算機程序,無論多么復雜,最終都無一例外地分解為單一的圖靈機架構,這表明圖靈機具有強大的描述和概括能力,Turing因此被尊為"現代計算機科學之父".
需要特別注意的是,圖靈機架構中有三處提到了"有限",即:有限的輸入符號、有限的狀態、有限的轉移規則。"有限"在符號主義范式中是十分重要的概念,其作用是把處理對象和處理過程限定在可控的范圍內。如果輸入符號是無限的,處理對象就不可控;如果狀態是無限的,則處理過程不可控;如果轉移規則是無限的,則系統將變得過于復雜而失去實用意義。
語言系統中存在若干集合,它們中大都是有限集合,例如音位集合、音節集合、聲調集合、詞法規則集合、句法規則集合、文字集合等,它們不經任何處理就能夠滿足圖靈機的輸入條件,成為圖靈機的處理對象。但是,詞匯語義卻有些特殊,它是無限的、開放的集合(指實詞),為了滿足符號主義處理機的要求,必須事先經過有限化改寫。于是,在符號主義幾乎一統天下的語法學界,尋求有效的語義有限化方法自然成了一項重要的基礎工作,各類方法也應運而生,其中具代表性的包括:語義場理論及義素分析法、邏輯語義分析、詞的定類及劃分、語義格分析等,它們都是符號主義語言認知觀下的最基礎的語義有限化方法。
遺憾的是,各種語義有限化的嘗試都不算成功[1],歸根結底,這都源于語義的開放性天生地與符號主義機器互不相容:完整的語義系統必須是一個無限元素的集合,而符號主義機器能接受的卻只是有限集合。這個矛盾使得任何語義有限化的嘗試都顯得捉襟見肘,左右為難,以犧牲語義細節為代價的有限化方法也許從根基上就是有缺陷的,我們需要尋找一種可行的替代方案。