起名字 历史 晋江小说的人物姓氏

大时代歌姬

来自: 大时代歌姬(又酷又温柔) 2016-11-07 15:40:34

  • 大时代歌姬

    大时代歌姬 (又酷又温柔) 2016-11-07 15:40:56

    版权归作者所有,任何形式转载请联系作者。
    作者:独孤力命(来自豆瓣)
    来源:https://www.douban.com/note/590741250/

    人名实在是很有意思的东西。以前翻阅《史记》《汉书》,只觉汉朝人流行“安国”、“延年”之类的名字,
    及至见到余英时先生在《东汉生死观》中的论述,才恍然明白其中深味。不久前读了一篇介绍陀斯陀耶夫斯基小说中“人名的诗学”的文章(https://www.douban.com/note/589188004/),颇获教益,乃知名字可以是精心撰构的隐喻,可以作为理解作者深意的津梁。长久以来还有另一个印象,中国现当代文艺作品中,知识分子的名字常含有文言虚词。叶圣陶写过《倪焕之》,话剧《陈毅市长》中有个科学家叫齐仰之,电影《创业》里那个地质师叫章易之,等等。说起来似乎也可以解释,“之乎者也”入人名,传达出文绉绉却又酸腐无用的印象,正与此类作品中知识分子的定位相合。这只是随手举例,说服力不够过硬,但可能也不算妄断。

    上面提到的那篇讲老陀的妙文中有一段说,“在中国文学中,为人物姓名赋予文学性的往往是名、字或绰号,因为姓只能在给定范围中选择,而起名则有自由发挥的空间。而在一神教传统影响下的俄罗斯,情况恰恰相反:名和父称往往只能从为数不多的几打基督教教名中选取,姓却不受太多限制,可随意杜撰。”话虽如此,但陀氏还是利用名字传递了不少讯息,反过来在中文里,姓氏虽然只有几百个选择,但却也有不少可发掘的模式,在流行文化中更是明显。拜网络所赐,这个模糊的印象,可以用数据来验证了。

    中文的自由度实在太大,用有特点的数据,可能更容易找出有意义的结论,这样看来,晋江文学城网站上的小说实在是非常好的数据来源。此念一兴,委实手痒不已。以我低下的编程水平,连滚带爬,勉强搞个网络抓取和html处理,也能弄到一些信息,作个初步分析。十年以来,中国(主要是女性)人民在晋江上写了近90万部小说,每本书的页面上都标记有作者、书名、主角、配角、分类、性向和文案,实际上用这套数据能做的事情,远远超出我的水平,只能以待来者了。

    这里分析的,仅仅是晋江上最近发表的10万部原创小说(不包括同人小说)。只计算已完结的,再除去一些读取错误的,共计13980部,从这些页面里找出主角名字23604个,其中符合中文姓名习惯的有18164个。这一步因为网页数据不尽整齐 ,涉及一点中文分词(tokenize)的问题。我也没那个能耐用语料库,所做的只是简单的用一个姓氏列表来查找,外加排除掉一些明显的不符合标准的情况(如名字只有一个字或超过五个字)。用我的低级山寨算法,“路西法”和“米迦勒”会被算成一个姓路的和一个姓米的,不过这个比例并不太高。就用这么九牛一毛的数据,得到的结果也很有意思。

    在“近来的晋江主角”这个人群中,频率最高的50个姓如下图:

    这些姓氏占所有有效统计姓氏的78.7%(绝对计数用红字标明)。其中频率最高的10个姓是林、苏、顾、沈、白、李、叶、陆、秦、陈,这些姓氏总计占32.8%。无论是前50大姓还是前10大姓,都与现实世界中的统计数据(来源:维基“中国姓氏排名”词条)非常不同:

    两相比较,前50大姓只有25个重合,前10大姓更是只有李、陈两姓重合。

    这种不同很容易从姓氏的实际分布和字面含义的角度作出解释。首先,在“晋江人群”中,真实人群中的“大俗姓”明显偏少,而江南、广东的常见姓氏占了不小比例。王姓是目前中国第一大姓,但在“晋江人群”中只占1%,排名22(“隔壁老王”想来不是晋江文的主人公)。集中分布在江苏省的顾姓、沈姓在全国人口中的比例虽然分别只有0.2%和0.41%,却是“晋江大姓”前五。“昔晋氏平吴,利在二陆”,陆姓不是如今的典型江南姓,也是历史上的江南姓。林姓和苏姓多分布在广东,在现实人群中也是相对常见的姓,但比例只有1.13%和0.46%,在“晋江人群”中提高了数倍。萧姓及其俗写肖姓,因为是南朝齐梁皇室姓氏,间接与“江南”意象有关,双双进入前五十。其次,“晋江大姓”从字面上很多含有“草木江河,四时风物”的意象(如夏林柳叶,江洛白云),有动物意象的则几乎没有(言情主角,甚少姓马牛羊,甚至也不怎么姓朱)。这或许也能解释相对“俗”的李姓,在晋江大姓中何以排名靠前。再其次者,“晋江大姓”都或多或少能激发某些文化联想。如唐宋之为时代,秦楚之为地域,独孤澹台,南宫慕容之于特定人物,都提升了该姓氏的使用频率。

    晋江小说的这种姓氏诗学,倒也源远流长。楚辞离骚,每有兰桂杜蘅,香草美人之譬;诗三百篇中,多草木鸟兽之名,也涉溱涉洧,溯洄溯流。江南水乡,如何不是才子佳人戏的舞台?至于霸道总裁,姓唐姓龙,姓冷姓厉,总比张王李赵刘老根要带感。林字的本意既好,更兼有林琴南、林徽因,还有林月如。粤闽地区近代以降对中国的巨大影响,也能由此微中见著。如此想来,《琅琊榜》的主人公,如何能不先姓林,再姓梅,偶尔还姓一回苏?

    符号意义如此显白,当然俗套。俗套又如何?三百年前的通俗作家,做的是一样的事。如临川四梦之中,紫钗、南柯、邯郸在今天都要算唐传奇的同人,唯有牡丹从人物上,算是明代的原创。男主柳梦梅,是柳宗元苗裔;女主杜丽娘,是杜少陵之后。别的不说,光是这两人名字里草木缤纷的程度,就已经晋江得不能再晋江了。

你的回应

回应请先 , 或 注册

1 人聚集在这个小组

最新话题  ( 更多 )

↑回顶部