2024 十篇语言学论文
感觉这个形式还挺有意思的,我也整一个。主要是phonetics的论文,除了最后一篇年度奇文外,其他的都是我觉得写得很好的文章。
1. Lawson, E., Stuart-Smith, J., & Scobbie, J. M. (2018). The role of gesture delay in coda/r/weakening: An articulatory, auditory and acoustic study. The Journal of the Acoustical Society of America, 143(3), 1646-1657.
24年读过的最好的一篇论文,也是我觉得整个r音研究领域中最好的论文。英语的元音后r脱落是一个非常经典的社会变异现象。那么r音脱落的机制是什么?一般来说,我们会想象这背后有一个舌头从卷到不卷的过程(实际的音姿变化其实会更复杂)。但是作者认为r音脱落的机制还有另一种可能:说话人开始卷舌的时间越来越晚,甚至延迟到了韵母结束后,导致卷舌没办法被听者察觉到,最终诱发了ohala式的听者启动音变(作者认为实际情况更复杂,因为还牵扯了词频)。换言之,r音脱落不是音姿本身的变化,而是音姿启动时间的变化。下面这张语图为这个说法提供了证据:

这是一名格拉斯哥英语母语者读firm[fɚm]时的语图。尽管在韵母段我们没有看到F3和F2的变化,但是这名说话人读完后呼了一口气,产生了一段送气乱纹。在这段乱纹中,我们可以隐约地看到F3在下降,同时F2在靠近F3。这些都是卷舌的声学表征,因此可以推测这名说话人不是没有卷舌,而是他卷舌启动的时间太晚了,延迟到了韵母结束后才开始卷。
为了进一步证明这个猜想,Lawson等人用超声手段观察了格拉斯哥人读卷舌元音时,r音最大收紧点相较韵母的延迟时间,结果发现延迟时间和对卷舌听感的打分有显著的相关性。延迟时间越长,r音听感就越弱。而且不同的阶级卷舌动作延迟的时间也是不同的,工人阶级比中产阶级延迟得更多,这和以往认为格拉斯哥中产阶级的卷舌程度高于工人阶级的观点相符。总之实验结果支持了最开始的猜想。
我觉得这篇文章是很理想的实验研究:提出一个和一般人直觉不同,但是又具有合理性的假设,而且新的假设和原有说法谁更合理没办法靠直觉下判断,只能通过实验来证明。当然严格来说,本文的实验只是证明了延迟的说法有合理性,没有完全否定音姿本身也在变化。
2. Sóskuthy, M., & Stuart-Smith, J. (2020). Voice quality and coda/r/in Glasgow English in the early 20th century. Language Variation and Change, 32(2), 133-157.
也是一篇研究格拉斯哥英语r音脱落的文章。第二作者也是Stuart-Smith。作者团队用在4个不同时间段完成的录音尝试证明在20世纪初期格拉斯哥英语开始了元音后r脱落的演变。声学语音学认为,r音会导致F3降低(也不绝对)。作者最开始认为,如果看到F3随着说话人年龄段的降低逐渐升高,那么就能说明存在一个r音脱落的演变过程。加性模型的结果的确显示说话人的年龄段越低,F3越高。但是作者一听他们的样本,发现诶不对啊,这r音的程度根本没咋变啊?咋回事儿啊?
之后作者发现,在20世纪的格拉斯哥还存在另一项音变:格拉斯哥人的嗓音音质(Voice Quality)正在变化,而这种变化同样会导致F3的升高。如果考虑到嗓音音质的变化,那么在统计上是得不到r音脱落的结论的。这项研究告诫我们讨论语言变异时要注意一个声学参数可能会对应多个语言变项,因此讨论一个语言变项时不能光盯着它本身,还应该考虑其他变项。
3. Shen, Z. (1990). Lexical diffusion: a population perspective and a mathematical model. Journal of Chinese Linguistics, 18(1), 159-201.
沈钟伟先生的名作,用上海话两个低元音合并的例子证明了词汇扩散确实存在。本文是我看过的所有语言学论文中,数学建模水平最高的一篇。
4. 陈保亚(1988)《语言演变的结构基础》,北京大学硕士学位论文,见《缀玉集》第一集,北京大学出版社,1990,441-478页。
很多人应该都听说过音系结构有向整齐演变的趋势,并不自觉地用它来解释音变。但是什么叫整齐,怎么定义整齐,大多时候只有一个模糊的感觉。陈老师的硕士论文尝试给予整齐(协合度)一个量化的定义,并用多个例子证明了音系整体结构趋向协合会促发音变的观点。其中讨论什么是有序变异,什么是无序变异的内容也很有趣。这篇文章修改后变成了《20世纪中国语言学方法论研究》的第10章。
5. Harrington, J., Kleber, F., Reubold, U., Schiel, F., & Stevens, M. (2019). The phonetic basis of the origin and spread of sound change. In The Routledge handbook of phonetics (pp. 401-426). Routledge
对用语音学手段研究社会变异的优质综述。
6.Haspelmath. M 《论在无预设范畴下的语言描写和类型学研究》,见《语言类型学的基本方法与研究框架》
所有谈论语言的人都或多或少地问过如下问题:一个语言现象是属于A范畴还是属于B范畴?比如普通话的特征词(property word)是形容词还是动词?英语的-like是一个词干还是一个后缀?他加禄语的ang-短语是个主语,还是话题?
然而,Haspelmath认为以上关于范畴指派的问题都是not even wrong的问题,因为如果一个人能这么问,他一定预设了一些范畴,而且预设了人类语言中只能有这些范畴,这没什么道理。比如,为什么英语的-like不可以是词缀和词干以外的第三种类别?Haspelmath认为对于英语的-like,我们可以问的是,它更像是英语的词干,还是更像英语的后缀,但是没有什么理由一定要把它指派到一个已知的范畴里。
我个人十分同意这篇文章的观点。说真的,我觉得语言学里各种各样的分布测试比各类范畴要重要得多,有了测试就有了比较标准和描写框架,既可以找同也可以找异,只有范畴那不就只剩下把新的语言现象往已有范畴里硬塞吗?语言学的精髓应该是提取范畴而不是指派范畴才对。
7. Port, R. F., & Leary, A. P. (2005). Against formal phonology. Language, 81(4), 927-964.
从名字就能看出是火药味儿很重的一篇文章。我只读过前半部分。两位作者反对的点大概主要有两个:1.不存在一个跨语言的,普遍的区别特征集,因此生成音系学提取每个语言中的区别特征并直接进行跨语言比较的做法是错误的。2.生成音系学把语音系统当成了一种只有离散时间、没有连续时间的东西。比如在生成系统中,每一次规则运用只能按“1次”“2次”这样计数,你说不清每一次规则应用具体耗费了多少秒。作者认为这是完全错误的看法,至少8、90年代的调音音系学已经指出这样做根本无法解释协同发音现象。两位作者甚至觉得因为这种观点的存在,其他领域的科学家经常无法理解语言学到底在干什么。
虽然我觉得作者最后大概给不出一种新的音系学,或者可能就直接回到语音学了,但是本文的很多观点都值得读读。比如开头说的,国际音标只是一种对听感的粗略描写,不能把它当成某种跨语言的普遍的符号,两个语言的[a]完全可能是不同的东西,因此直接拿国际音标来做跨语言对比是不可靠的,再比如有些音段的感知依赖这个音段与其他音段的时长比值而不是该音段自身的某些特征,如英语音节尾塞音的清浊,其声学线索其实是塞音和前面元音的时长比。
8. Voeten, C. C., Heeringa, W., & Van de Velde, H. (2022). Normalization of nonlinearly time-dynamic vowels. The Journal of the Acoustical Society of America, 152(5), 2692-2710.
语音研究中,归一化是一个很重要的步骤。每个说话人的生理条件都是不一样的,这会导致他们在产生同一个音时,会有不一样的声学产出。而这些生理差异的语言学意义很弱,我们实际上也不会把女性和男性所读的[a]当成不同的[a]。归一化的目的就是去除这些生理差异。在漫长的学术史中出现了各种各样的元音归一化方法,那么哪一种最好?Adank et al.(2004)是讨论这个问题的经典名作。这篇文章可以看作是Adank et al.(2004)的续集。Adank et al.(2004)的数据是静态共振峰的数据,也就是每个元音的每个共振峰只取一个点或整个共振峰的均值。这自然没法应对复合元音的情况,很多研究还证明单元音内部的共振峰变动也具有语言学上的意义。本文对比的就是,在归一化动态共振峰数据时各个归一化方法的优劣。
此外,近年来线性混合模型被引入了语音学研究,它也具有归一化的效果。那么它的归一化效果和传统归一化方法的效果是否可以叠加?这篇论文也讨论了这个问题,并认为两者的效果是独立可叠加的。
9. Fowler, C. A., & Thompson, J. M. (2010). Listeners’ perception of compensatory shortening. Attention, Perception, & Psychophysics, 72(2), 481-491.
英语语音学中存在这么一个现象:如果一个重读音节后跟着一个非重读音节,那么这个重读音节的时长会被缩短,如barber的第一个音节比bar要短。但是Fowler在80年代即指出这是一个测量错误。什么意思?时长缩短这个结论是通过对声学信号的测量得到的,然而从生理调音上来看,在第二个音节开始时,第一个音节的调音有可能还未结束,因此在第二个音节的声波中,第一个音节实际上还在继续。本文通过感知实验证明在母语者的感知中,barber的第一个音节和bar其实是等长的。文章指出的声学测量不等于生理更不等于感知的问题值得每个搞语音学的人铭记。
10. Liu, Z., Xu, Y., & Hsieh, F. F. (2022). Coarticulation as synchronised CV co-onset–Parallel evidence from articulation and acoustics. Journal of Phonetics, 90, 101116.
本文论证在生理上,CV音节中辅音和元音的调音动作是同时开始的。具体的研究过程非常复杂。个人觉得,包括作者也这么觉得,这篇文章最大的价值在于重申了上世纪协同发音研究得到的一个教训:一个音段在生理上的启动时间要通过最小对立对提取。
11. Alan, C. L. (2007). Understanding near mergers: The case of morphological tone in Cantonese. Phonology, 24(1), 187-214.
对,你没看错,还有第11篇。这个位置献给这篇年度奇文,我第一次看语言学看出了科幻的感觉,《降临》什么的跟这个比弱爆了。
它想讲个什么事儿呢?粤语(这里用的是香港粤语)中有一个类似于小称变调的东西,如:

这个变调的记音是35,和香港粤语的阴上是一样的。然后作者问,这两个调在声学上真的一样吗?这个问题本身没什么科幻的,它接续的是社会语言学对near merge的研究传统和音系学对incomplete neutralization的研究传统,即两个感知上合并的音位,在产出上仍可能有稳定的差异。科幻的是作者的解释。
作者首先做实验证明了这两个35确实是存在差异的。

可以看到变调产生的35更高。当然这篇文章的实验设计是有问题。作者给两种35设计的语境不同,这导致没办法排除声调协同发音的影响,换言之这种差异可能是前接音节的声调影响的结果。但是这个比起作者对这个现象的解释都不重要了!对,作者要解释为什么会有这么微弱的差异出现。他动用了当时很时髦,现在一样很时髦的样例理论。样例理论认为,人头脑中的范畴不是抽象的,而是由无数个样例组成的样例云。[u]在不同语境中的样例云如下图所示

当说话人接触到新的样例后,这个样例就会被添加进原有的云中。新的样例会对样例云整体产生影响,由于新的样例会不断地添加进来,语音范畴实际上是动态的。
祭出样例理论后作者就开始解释。首先,作者认为这个变调35啊,在历史上有两个来源,一个是“儿”,这个“儿”在当时的粤语中是55调,一个是“子”,在当时是35调。那么从样例理论的角度来讲,这个变调35形成的过程,可以认为是“儿”的样例云和“子”的样例云重叠形成的。诶,这个事儿就解释清楚了。因为变调35是55和35融合而来,那它自然比单个儿的35高啦,这解释很顺滑吧。
作者到这儿还不满足,还在共时层面上找了个证据。粤语中的“得”(55)和“咗”(35)在随意语境下,其音段成分可能会删除,但是声调会附着在前面的音节上形成35。于是我们能在粤语的共时平面上找到4种35,来自“得”的,来自“咗”的,变调和阴上。作者测了这四种35的基频,得到了如下结果:

高度关系上是RS1(来自55)>变调>RS2(来自35)=阴上。诶,大家有没有看到,历史上来自55和35的变调35是不是正好在来自55的RS1和来自35的RS2之间?这就是样例云融合的明证啊hahahahaha


于是乎这个事儿就这么诡异又带有一丝合理性地被解释了......
PS:有个广州人跟我说这篇论文的一些实验结果是没办法重复的。
认真的说,本文最后关于如何使用样例理论修正Ohala听者启动模型的论述写得很棒,值得一读。