復(fù)旦大學(xué)金力教授研究團(tuán)隊對漢藏語言中同源詞匯進(jìn)行分析,認(rèn)為漢語與藏緬語族在 5900 年前左右出現(xiàn)分化,為漢藏語系的“北方起源假說”提供了有力支持。
撰文 戚譯引
語言不僅是日常交流的工具,更是文化傳承最悠遠(yuǎn)的載體。語言的分裂和融合背后往往伴隨著群體的遷移與交匯,所以近十幾年來,科研人員開始將演化研究方法應(yīng)用于語言學(xué),探索不同語言之間的演化關(guān)系。
復(fù)旦大學(xué)金力團(tuán)隊運用系統(tǒng)發(fā)生學(xué)方法探討了漢藏語系的起源。研究對 109 種漢藏語系語言詞匯中詞語的字根意義進(jìn)行分析,認(rèn)為漢語與藏緬語族在 5900 年前左右出現(xiàn)分化,大約相當(dāng)于仰韶文化晚期、馬家窯文化早期,這對漢藏語系起源爭議補(bǔ)充了重要的論據(jù)。
著名的人面魚紋彩陶盆,它是仰韶文化的重要文物證據(jù)。圖片來源:維基百科
這篇論文今天發(fā)表于《自然》(Nature)期刊(論文鏈接),這是中國語言學(xué)研究成果第一次登上《自然》主刊。復(fù)旦大學(xué)遺傳工程國家重點實驗室、生命科學(xué)學(xué)院人類遺傳學(xué)與人類學(xué)系教授、中國科學(xué)院院士金力為通訊作者,復(fù)旦大學(xué)人文社會科學(xué)數(shù)據(jù)研究所東亞語言數(shù)據(jù)中心負(fù)責(zé)人潘悟云教授參與此項研究。復(fù)旦大學(xué)現(xiàn)代語言學(xué)研究院青年研究員張夢翰為該篇論文的第一作者,復(fù)旦大學(xué)人類表型組研究院助理研究員嚴(yán)實為共同第一作者。
所有具有同一起源的語言構(gòu)成一個語系。漢藏語系包含逾 400 種語言和方言,如漢語、緬甸語和藏語等,總使用人數(shù)達(dá) 15 億左右,是僅次于印歐語系的第二大語系。語系下一級的分類單位是語族,漢藏語系又分為漢語語族和藏緬語族。
世界主要語系分布圖,其中淺綠色為印歐語系,紅色為漢藏語系。圖片來源:Wikipedia
金力團(tuán)隊研究結(jié)果顯示,漢語與藏緬語族分開的時間大約在 5900 年以前,這個時間基本上對應(yīng)中國北方的仰韶文化晚期到馬家窯文化早期之間,為漢藏語系的“北方起源假說”提供了有力支持。
漢藏語系的起源在學(xué)界仍有爭議,“北方起源假說”認(rèn)為它起源于大約 4000 到 6000 年前中國北方的黃河流域,而“西南起源假說”則認(rèn)為它起源于至少 9000 年前的東亞西南部某地(即今天的中國西南部到印度東北部一帶)。本次研究的主要結(jié)論與“北方起源假說”相符,一般認(rèn)為隨著一組人向西遷入西藏,向南遷入緬甸,而另一組人向東和向南遷移而最終成為漢人,這些語言也繼而分成了兩個語族。
本次研究還確定,漢語是最早從漢藏語系中分離的語言。研究作者之一、復(fù)旦大學(xué)博士嚴(yán)實介紹,此前學(xué)界對漢語和藏緬語族的區(qū)分主要是基于語法、形態(tài)等特征;但是漢語和藏緬語族是否存在共同祖先、漢語是不是最早從漢藏語系中分離出去的語言,這些問題仍有爭議。這次研究回答了相關(guān)問題。
本次研究對 109 種漢藏語系語言詞匯中詞語的字根意義進(jìn)行了貝葉斯系統(tǒng)發(fā)生學(xué)分析(Bayesian phylogenetic analysis)。系統(tǒng)發(fā)生學(xué)早已被廣泛應(yīng)用于研究生物之間的演化關(guān)系,近幾年學(xué)界開始將它應(yīng)用于語言學(xué)研究。
在演化研究中,系統(tǒng)發(fā)生學(xué)根據(jù)化石、形態(tài)學(xué)、基因方面的證據(jù)對物種進(jìn)行分類,并確定物種之間在演化上的關(guān)聯(lián)。如果兩個物種具備相似的特征,例如相似的 DNA 片段,那么它們在演化上的關(guān)系就比較接近。通過對多個物種進(jìn)行交叉對比,就可以構(gòu)建出系統(tǒng)發(fā)生樹,它就像族譜一樣,顯示出一個個物種在哪一時刻從共同祖先中分化出來,以及它們的共同祖先之間又有怎樣的關(guān)聯(lián)。
論文第一作者、復(fù)旦大學(xué)現(xiàn)代語言學(xué)研究院青年研究員張夢翰介紹:“系統(tǒng)發(fā)生學(xué)方法的兩個前提符合我們對語言演化的認(rèn)識:允許不同語言在歷史演化過程中擁有各自不同的演化速度;允許不同詞匯擁有屬于各自不同的演化速度。”這些性質(zhì)允許模型具備更高的靈活性,并且它也更符合我們對語言的認(rèn)識。
在語言學(xué)研究中,潘悟云教授介紹:“同源語素就相當(dāng)于語言中的基因。”同源語素的認(rèn)定是鑒定語言關(guān)系的關(guān)鍵,例如,表示太陽的“日”在漢語、古漢語和藏語中有相似的發(fā)音,那么它就是一個同源語素,是體現(xiàn)這些語言之間關(guān)聯(lián)的一個證據(jù)。類似這樣的詞匯還有太陽月亮、身體部位、親屬關(guān)系等。同源語素的認(rèn)定是對語言應(yīng)用系統(tǒng)發(fā)生學(xué)分析的前提,本次研究使用的數(shù)據(jù)就來自于先前語言學(xué)界的相關(guān)研究工作。
將生物學(xué)方法用于語言演化研究是近些年興起的一個熱門研究方向,在德國的馬克斯-普朗克研究所、新西蘭奧克蘭大學(xué)都有相關(guān)研究。但先前研究主要針對印歐語系進(jìn)行,對漢藏語系的研究歷史更短,因此復(fù)旦大學(xué)的這項研究工作在這個方向上具有開創(chuàng)性的意義。
潘悟云評論:“本課題用貝葉斯系統(tǒng)發(fā)生學(xué)方法取代傳統(tǒng)的語言年代學(xué)方法,才使得語言年代的確定從猜想走向?qū)嵶C,以此明確提出,漢語的歷史為 5900 年。這是現(xiàn)代科學(xué)技術(shù)對語言學(xué)的貢獻(xiàn)?!?span>
這次研究獨立驗證了先前的考古學(xué)、遺傳學(xué)研究工作,研究結(jié)論符合語言隨農(nóng)業(yè)擴(kuò)散的觀點,而且擴(kuò)散的時間點與考古證據(jù)相符,例如此前的考古證據(jù)顯示,一些特定的建筑形式和陶器類型有向南擴(kuò)散的特征。
語言的變遷和人群的活動之間具有密切的聯(lián)系。研究第一作者張夢翰說:“群體的一些活動,比如分化和混合,可以造成語言的分化和混合;而語言的分化和混合又可以反映不同語言群體各自文化的一些變化。所以對我們來說,語言是架起群體演化和文化演化的一個非常好的橋梁。”
漢語中包含的 14 種方言。圖片來源:https://www.ethnologue.com/subgroups/sino-tibetan
不過,潘悟云強(qiáng)調(diào),本課題僅針對漢語和藏緬語族之間的關(guān)系,對藏緬語族下屬各個語支之間關(guān)系的描述還有很多不完善的地方,這是由于材料的缺乏和同源詞認(rèn)定的不當(dāng)?;蛟S隨著未來相關(guān)研究的發(fā)展,在有了確鑿的證據(jù)后,這些問題將得到更好的解答。
此外,語言的分化和人群的分化不一定是完全同步的。張夢翰說:“基于我們所知的,我們認(rèn)為語言分化和群體遷移或者分化之間應(yīng)該是存在一定的時間差。嚴(yán)格來講,誰在前,誰在后要基于特定的語言情況來定;一般來說群體遷移和分化在語言分化之前,但是我們不能排除例外?!?/span>
“整個東亞地區(qū)語言非常復(fù)雜,這個研究僅僅是一個開始,”張夢翰說。
論文信息
【標(biāo)題】Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic
【作者】Menghan Zhang, Shi Yan, Wuyun Pan & Li Jin
【期刊】Nature
【時間】24 April 2019
【DOI】10.1038/s41586-019-1153-z
【鏈接】
https://www.nature.com/articles/s41586-019-1153-z#Bib1
【摘要】The study of language origin and divergence is important for understanding the history of human populations and their cultures. The Sino-Tibetan language family is the second largest in the world after Indo-European, and there is a long-running debate about its phylogeny and the time depth of its original divergence1. Here we perform a Bayesian phylogenetic analysis to examine two competing hypotheses of the origin of the Sino-Tibetan language family: the ‘northern-origin hypothesis’ and the ‘southwestern-origin hypothesis’. The northern-origin hypothesis states that the initial expansion of Sino-Tibetan languages occurred approximately 4,000–6,000 years before present (BP; taken as AD 1950) in the Yellow River basin of northern China2,3,4, and that this expansion is associated with the development of the Yangshao and/or Majiayao Neolithic cultures. The southwestern-origin hypothesis states that an early expansion of Sino-Tibetan languages occurred before 9,000 years BP from a region in southwest Sichuan province in China5 or in northeast India6, where a high diversity of Tibeto-Burman languages exists today. Consistent with the northern-origin hypothesis, our Bayesian phylogenetic analysis of 109 languages with 949 lexical root-meanings produced an estimated time depth for the divergence of Sino-Tibetan languages of approximately 4,200–7,800 years BP, with an average value of approximately 5,900 years BP. In addition, the phylogeny supported a dichotomy between Sinitic and Tibeto-Burman languages. Our results are compatible with the archaeological records, and with the farming and language dispersal hypothesis7 of agricultural expansion in China. Our findings provide a linguistic foothold for further interdisciplinary studies of prehistoric human activity in East Asia.
參考資料