用大数据分析了各地方言,发现了...

浏览: 1733

来源:第一财经·新一线城市研究所(微信公众号:TheRisingLab)

方言是每座中国城市典型的文化符号,听一个人说话,很多时候就能大致判断出他从哪里来。但与城市有清晰的行政边界不同,方言的边界可能很模糊,而且未必与现在的行政区划相一致。

相比于我们通常理解的方言分区——四川人说四川话,河南人说河南话,而在江苏因为南北中的方言差异巨大,不存在“江苏话”,语言学家们对方言有更系统的归类方法。在这套体系的定义下,且不论省份之间方言各异,相邻的两个城市、区县,乃至乡镇之间的方言区都可能有自己的独立归属。

新一酱这次打算在语言学归类的研究基础上,加入数据量化的研究手段,更有理有据地衡量中国城市间的方言差异,以及这些差异对城市间沟通带来的影响。

首先我们来熟悉下语言学家们基于田野调查和科学研究得出的方言研究结论。尽管不同的研究流派分类方法不一,一般认为汉语有十大方言:官话、吴语、粤语、闽语、晋语、赣语、湘语、客家话、徽语、平话。

image.png

你可能也见过类似上图这样的方言地图。

从地理位置上看,十个方言大区中除了官话和晋语,其他八种方言都在南方。复旦大学生命科学学院研究分子人类学的博士严实告诉新一酱,语言的演化并不完全是自然演化。南方的各种方言中混有相当多南方少数名族语言的底层词汇和语音,是当地人学习汉语后用自己的发音习惯习得后的结果。

不过从覆盖面积上看,官话的势力范围是最大的。现如今的普通话则是以官话,尤其是北方官话作为标准方言制定的。由于官话的内部差异也不小,于是语言学家又将其分成8个方言区,它们依次是:东北官话、北京官话、中原官话、冀鲁官话、兰银官话、胶辽官话、江淮官话和西南官话。

image.png

在官话的分支中,北京官话,虽名称中有“北京”二字,但其分布范围可不仅限于北京。新疆也是北京官话的重要使用区域,其中北疆地区的北京官话主要是1950年代开始的生产建设兵团人口迁移形成的。

其他9种方言由于分布范围相对较小,所以没有更细致的方言区的细分,暂且把方言大区的名称顺延到方言区——这种层级的划分并不存在地位上的差别,只是语言学家根据各地方言语音、词汇等方面的特征做的归类而已。

在方言区下,又可以细分成若干个方言片,有些方言片还可以分成多个方言小片,比方说我们通常意义上所说的上海话属“吴语-太湖片-苏沪嘉小片”,四川成都话属“官话-西南官话-成渝片”,广州话属“粤语-广府片”等等。

官话区贯通南北,分布范围较广,其他方言则“群雄割据”,在分布上地域性较强。那么,它们的使用人群数量是否也与分布范围有相关性呢?

新一酱于是启用了数据手段,根据各大方言的分布范围,结合2015年NASA的世界人口格网数据库计算了它们各自所覆盖的人口占中国总人口的比例。

image.png

在新一酱的统计中,官话覆盖了全国63.72%的人口,占了一半以上,而在官话中,讲西南官话的又最多,占全国总人口的19.12%,其次是中原官话,占16.3%。平话是通行于广西一带的方言,在十大方言中属于规模较小的一个类别,覆盖人口比例不足0.1%。

在计算方言的使用人口之初,新一酱是想用各省市的人口统计数据的,但很快就放弃了——方言区的边界与省级行政区的边界并不重合,甚至可以说差异巨大。

这个现象是值得深挖的。毕竟语言是文化的载体,同一方言区会在文化上更加接近。而如果文化和行政上的归属是错位的,就可能产生“化学反应”。新一酱想起了知乎上的一个提问——中国有哪些“文化上属于A省,行政却归属B省的城市”。

这种城市所属的文化区与行政区不一致的情况,有的是行政力量有意为之,有的是人口迁移自然演变的。我们先来看一个行政力量有意为之的例子。

image.png

中原官话覆盖了陕西省86.39%的人口,是该省当之无愧的主流方言。然而,陕北的榆林市却以晋语为主要方言的,与邻近的山西省更接近。陕南的汉中市和安康市尽管也受到中原官话的影响,但仍有不少县市的方言为西南官话,文化上与川渝走得更近。

秦岭山脉隔断了陕南和关中,从地形上看,汉中、安康与四川盆地交流更为便利。但由于“天下未乱,蜀先乱”的前车之鉴,后来的统治者为了避免四川形成地方割据政权,便把汉中和安康从蜀地剥离开来,划归陕西管辖。于是便出现陕南“在文化上属于四川省,行政上却归属陕西省”的情况。

这种城市的文化归属与行政归属相异的情况不止发生在陕西,连“东北一家亲”的黑吉辽也非铁板一块。

image.png

东北地区通行东北官话,也就是我们通常所说的东北话,而大连话常被其他东北人说成有股“海蛎子味儿”。这股“海蛎子味儿”的“东北话”就是胶辽官话,也是山东省青岛、烟台、威海等城市的主要方言。历史上,山东人口大量迁入东北,而辽东半岛的移民主要来自于今胶东半岛,由此两地出现文化上的相似也是理所当然的。

同样受人口迁移影响的还有广东省的客家话地区。

image.png

说起广东的方言,人们的第一反应都是粤语,但根据新一酱的计算,粤语只覆盖了广东省62.50%的人口,还有近四成的广东人并不说粤语。比如在梅州、惠州、河源三市,客家话是当地的主流方言。

 

客家先民随着历史上几次动荡时期的移民潮,从中原迁移到南方,与此同时也带来了自己的语言,在与当地人长期互动交往的过程中逐渐形成了现在客家话。不像其他方言存在至少一个占据主导的地位的省份,客家话正如它的名字一般,是个名副其实的异乡者。

另外,广东省东南部的潮汕地区的所说的潮汕话被划归为闽语潮汕片,也与粤语有着很大的区别,文化上也自成一派。

除了地级市,很多区县也会出现其主流文化与所属城市的主流文化不一致的情况。例如,江西省上饶市的大部分地区受吴语和赣语的影响较大,而其下属的婺源县原为古徽州府辖地,是徽语的势力范围。而杭州市的建德市和淳安县也有很多地方保留有古徽州的风貌。

image.png

事实上,城市的方言不同于所属省份主流方言的情况并不少见。新一酱打算用定量分析的方式来完整统计下这样的情况。

首先计算各省和各城市不同方言区覆盖的人口数量,当首位方言与第二位方言的人口数量之比大于2时,我们便认为这一行政区内存在“主流方言”,由此便可以找出与省份的“主流方言”不一致的城市。

0 (1).gif

上图中,江苏省对应了两种“主流方言”,因为江淮官话和吴语在省内的影响力实在难分伯仲。此时,说中原官话的徐州市和宿迁市反倒显得有些“非主流”了。但与徐州相比,宿迁走得没那么远,除了城区,宿迁郊县的方言仍以江淮官话为主。

安徽省的情况与江苏省类似,只是主角之一的吴语换成了中原官话。

为了量化省份之间,乃至城市之间的文化差异,新一酱参考了刘毓芸等发表的论文《劳动力跨方言流动的倒U型模式》中方言距离的计算方式——基于行政区各区县之间的方言差异,综合人口数据加权计算可以得到行政区之间的文化距离。另外,新一酱还定义一个行政区与自身的文化距离为该行政区的文化多样性指数。

image.png

在省份的文化多样性排名中,湖南、江西、广东、广西、江苏位列前五,而上海、北京、重庆、天津、吉林等省市内的文化差异则相对较小。

文化多样性指数并非按方言的个数来简单排序,新一酱在计算的过程中考虑了人口因素,所以在包含相同方言单位个数的情况下,说不同方言的人口比例分布得越均衡,其文化多样性指数越高。因此,尽管湖南省包含的方言单位数量不及江西省,但由于江西省内赣语一家独大的现象更显著,所以湖南省的文化多样性指数更高。

image.png

到城市颗粒度上,文化多样性指数较高的城市多半位于不同方言区的交界处。在这些城市中,可能很难找到它们对应的“主流方言”,同时,由于处在多种方言的交汇处,所以方言之前互相影响互相渗透的情况也更常见。

算到这里新一酱想,既然我们已经可以计算城市之间的文化距离,那么是否可以由此来分析城市之间基于文化的协同合作关系呢?

我们知道,城市群是城市之间交流合作的一种模式。城市群的划分尽管存在很多难以量化的政策因素,但更多的是来自社会常规因素的考量。在接下来的分析中,新一酱将探讨文化因素对不同城市能否进入同一个城市群的影响,为了排除其他因素的干扰,我们也会控制来自经济、政治、空间等方面的影响。

在数据的选择上,新一酱找了四个方向的数据来定义城市之间的联系度:

方言距离来衡量城市之间的文化联系

城市之间创业公司行业相似度可作为经济或商业联系的代理变量

不同城市在行政上是否属于一个同省份用来评判政治联系的紧密度

联通城市之间的高速公路里程被定义为空间距离

先来看看各个城市群在不同维度上的联系。

image.png

长江中游城市群的规划范围内有西南官话、江淮官话、湘语、赣语、吴语等多种方言,城市之间的文化平均距离自然也比其他城市群更大,文化相似度较弱。另外由于长江中游城市群覆盖范围较大,横跨多个省份,所以城市的空间平均距离也较大,政治联系度也较低。与之相似的还有海峡西岸城市群

滇中城市群宁夏沿黄城市群规模较小,汉语方言构成比较单一,分别以西南官话和兰银官话为主,其文化平均距离在各城市群中最小。由于这些小规模的城市群都在同一个省份内部,所以其政治联系度都为1。

根据各城市之间的关系数据,新一酱构造了5个对称矩阵。分别是城市群关系矩阵(在同一个城市群为1,否则为0)、文化距离矩阵、经济或商业联系矩阵、政治联系矩阵,以及空间距离矩阵。为了探寻这些变量之间的因果关系,新一酱使用社会网络分析中常用的QAP多元回归分析法——这是一种确定社会网络数据之间相互依赖关系的一种统计分析方法——来一探究竟。

在分析结果中,四个自变量都通过了显著性检验,而文化距离系数显著为负。也就是说在控制了经济、政治、空间等因素的情况下,城市之间文化距离越小,文化相似度越高,越有可能进入同一个城市群。

新一酱虽然可以确定城市文化对于其是否在同一城市群存在影响,但这种影响的机制具体如何,则还需要进一步地探讨。

新一酱猜想,城市之间文化的相似性可能是它们在历史上长期的相互交往所致,所以能进入同一个城市群也算一种历史的惯性使然。有经济学家基于方言的视角,论证了“乡音”可以降低一个公司的代理成本,那么在城市群的协同合作中,城市之间的文化相似性也许也能助一臂之力。 

在上述分析中,新一酱用方言距离来量化城市之间的文化差异。不过,对很多人来说,城市之间的文化相似性根本不需要具体的数据来论证。当你熟稔自己所在城市过去的历史,感性地去认识它时,你自然知道谁跟它更像一点。

推荐 0
本文由 datakong 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册