对科幻小说叙事形式的识别与分析

作者:刘洋 ; 转自:公众号 DH数字人文

文本分析

刘洋 / 南方科技大学人文科学中心

———————————-

摘要:构建一种基于词典和句子成分分析的算法,可以区分叙事文本中的“展示”与“告知”两种形式。通过算法得到叙事条纹图后,借助离散傅里叶变换,可以得到作品的叙事节奏谱,并从中提取到两种表征文本叙事节奏的特征量:最大峰值频率与展示度。对当代中国四部代表性长篇科幻小说的叙事节奏分析表明,何夕的《天年》具有最小的峰值频率,意味着其叙事节奏较慢,而韩松的《地铁》则是其中叙事节奏最快的。此外,对科幻小说与主流文学进行文类比较,结果显示科幻小说往往具有较慢的叙事节奏,其原因是文中普遍具有通过对话进行设定呈现的板块。

关键词:叙事分析 叙事条纹 叙事节奏谱 科幻小说

————————————

引 言

在小说的叙事过程中,有两种主要的叙述形式。一种可称为展示(showing),另一种为告知(telling),两种形式往往在文本中交替出现,共同推进小说的故事向前发展。所谓展示,就是用场景、动作、对话等描写文字向读者呈现出具有画面感的细节,而告知则是作者用自己的语言直接向读者概述某个事件、结论或特征。例如“他饿坏了”是告知,而“他看着桌上热腾腾的饭菜,不停吞咽着口水”则属于展示。

在小说写作的教学中常常出现“Show, don’t tell”的建议,不少作家或研究者认为在写作的过程中该更多地采用“展示,而非告知”的方式。美国作家珍妮特·伯罗薇等人对这种观点的理解是,小说“应该通过文字和思想让读者去感受和体验……从而使叙述更生动、更感人、更能引起共鸣”[1]。加拿大科幻作家罗伯特·索耶曾总结道,展示比告知更胜一筹的原因有两个,一是“展示能激发读者在头脑中生成画面”,二是“展示具有互动性和参与性,它会把读者带到故事里去”[2]。英国叙事学家戴维·洛奇也认为,告知的叙事方式“抹杀了人物和行为的个性特征”,一部完全用告知形式写成的作品“是令人难以卒读的”。但他同时也认为告知“自有其独特的用途。比如,它可以加快叙述的速度,让读者匆匆跳过不感兴趣或不太感兴趣的细节”[3]

事实上,告知和展示在小说中都是必不可少的,其交替使用的过程,其实也引领着小说节奏的变化,从而形成某种特定的叙事效果,体现出不同作家在写作风格上的差异。罗森对简·奥斯汀小说《爱玛》中的展示和告知的叙事策略进行了分析,论述了其在人物塑造等方面所起到的作用,并认为其在对话和细节上进行详实陈述的叙事策略是受到了塞缪尔·理查森和亨利·菲尔丁的影响[4]。潘守文等对康拉德的著名小说《黑暗深处》进行了分析,发现其在表征主人公的野蛮、凶残等方面,兼用了展示与告知两种叙事方式,而在表征其伟大、文明等方面,却故意使用了单一的告知方式,从而起到了消解和解构帝国神话的效果,体现了作者高超的叙事技巧[5]

与现实主义文学相比,科幻小说在叙事形式的选择上具有不同的需求。由于常常涉及到远超普通文学作品的叙事时间跨度与空间跨度,科幻小说需要采取不同寻常的叙事节奏,例如通过急剧加快叙事节奏所形成的“密集叙事”以及在叙事中突然中断并进入遥远未来的“时间跳跃”[6]。这些叙事方式必然会影响作家对叙事形式的选择。此外,为了交代故事的时空背景与科技设定,科幻小说中常常会出现大段“知识硬块”,在1980年代以前以科普为目的的创作导向下,中国科幻小说中的知识硬块现象尤为常见[7]。但近30年来,中国科幻小说的内容和形式都发生了很大变化,这些变化如何体现在作品叙事形式的组合上,也是一个值得注意的问题。

对文本的叙事模式与节奏的实证型研究目前仍然是一个处于初步探索阶段的研究方向。特蕾莎借助于一个结构分析程序分析了一些文本的叙事结构,但其需要依赖于人工插入文本中的标签[8]。赫斯等对修昔底德作品中的叙事模式进行了分析,基于叙述者和人物角色在语言上的区别,但这种方式并不具有普适性[9]。战玉冰近来做了一系列对文学作品的数字化分析,但在故事模式的提取上主要借助于谷臻故事工场所研发的既有系统,且多停留在词频统计和归纳的阶段,缺少更深入和更具主动性的模式挖掘方案[10]。原《收获》杂志编辑走走开发的“故事眼”等文本分析程序,可以对小说叙事过程中的情绪走向进行分析,得到情绪涨落曲线,但缺乏对曲线数据的更进一步的分析和模式发现过程[11]。此外,还有一些借助重复性结构对散文及歌词的节拍进行提取与分析的尝试[12]

本文通过构建短时性动词词典并结合句子成分分析的策略,提出了一种可以区分识别“展示”与“告知”两种叙事形式的方案。基于这个方案,我们对四个当代科幻作家的代表性长篇科幻小说进行了叙事形式的分析,得到了对应的叙事条纹图。此外,通过离散傅里叶变换可以从叙事条纹中得到叙事节奏谱,并从中提取出一些表征叙事节奏的特征量。借助这些特征量,本文对中国当代科幻小说与主流文学在叙事节奏上的差异进行了比较和分析。

我们所构建的叙事形式识别与节奏分析的方法具有较强的普适性,不仅可以用于科幻小说与主流文学作品,也同样适用于其他类型的文学作品。特别是对于具有超长篇幅的网络小说,常规的文本细读方法往往费时耗力,借助该算法便可以有效实现对叙事节奏等特征的快速提取。在对各类型文学作品进行叙事分析和比较的基础上,我们可以明确各文类本身所具有的特质,在一个更具有整体性的角度对各种文学作品的叙事风格进行考察和评价。

一、对叙事形式的识别

(一)对“展示”的定义

为了通过算法进行叙事形式的识别,首先需要对展示和告知给出一个操作性较强的定义。在此,我们仅通过一些限制性条件对“展示”给出一个定义。所有不属于“展示”的文本内容,均认定归属于“告知”的范畴。

对“展示”的识别是以句子作为单元进行的,其操作性定义主要基于如下两个限制性条件:

条件1.短时性该句所呈现的场景,其持续的时间是较短的。例如,“我拿起一支笔,写下几行字”属于展示,而“我在暑假抽出时间做了几份兼职”则属于告知。

条件2.画面感。句子应该给读者一个清晰的画面,而不是给出一个概括性的描述。例如,“他一边说着粗话,一边朝着地上吐口水”属于展示,而“他为人粗俗”则属于告知。

基于以上定义,我们对大量短篇小说进行了人工标注,用作算法识别的测试集。

(二)识别算法

对叙事形式的识别算法主要基于以下规则:

规则1.所有人物对话均属于“展示”的叙事形式。因为对话显然符合短时性的特征,同时也兼具画面感。对话的判定以连续出现的若干组双引号为特征,且通过引号内的文本长度排除掉对词汇起强调作用的非对话内容。

规则2.在“展示”类叙事的句子中需要包括一个短时性的动词Vs。这类动词一般属于动作类动词,但不是所有动作类动词都属于此类,例如常见的“学习”“徘徊”就不是短时性动作。

图1 对短时性动词词条的收录过程

在对大量小说中的动词进行了人为标记的基础上,我们建立了一个短时性动词的词典,用于算法的检索。为了尽量增大词典的覆盖范围,我们将100万字的小说文本进行了标注,其中包括50万字的科幻小说与50万字的现实主义题材的小说。标注完成后,将两种文类中各篇目的文字按照段落拆分开,随机组合在一起,再按照一万字的字数限制拆分成各50个文本块,以便尽量减小各文本块之间因作家作品风格不同所造成的差异。我们首先从科幻小说的文本块开始,逐一收录其中所包含的短时性动词,如图1所示,当收录29个文本块后,词条数量已经趋于收敛。因此,接下来我们将搜寻文本换为现实主义题材,可以看到词条数量重新转为近线性增长,表明两种文类间的惯用动词具有一定的特异性。在搜寻文字超过60万字后,词条数量已经基本收敛,显示词典已经收录了绝大部分短时性动词。最终,词典中包含的词条数量为907例。

规则3.在包含短时性动词的句子里,只有符合一定词性排列模式的句子,才认定属于“展示”类叙事形式。如“动词+着”“动词+介词”等。因为在一些句子中,即使包含了某个短时性动词,该句的叙事形式也不一定属于展示。表1给出了一些短时性动词及词性排列模式的例子。

表1 短时性动词及词性排列模式示例

(三)算法检测

基于上述规则,我们建立了对应的算法,并对10篇已人工标注了各句叙事形式的短篇小说(科幻小说5篇,现实主义小说5篇)进行了识别测试。这些小说并未在短时性动词词典的建立过程中被使用,因此可以较为客观地反映算法对陌生文本的识别效果。

我们采用了精确率和召回率两个指标来衡量算法对“展示”的叙事形式能否有效识别。结果如表2所示。

表2 对10篇小说“展示”叙事的识别测试

可以看到,算法的精确率最低为82.1%,召回率也基本在80%以上。只有对莫言的《月光斩》,召回率在76.6%的低值。这是因为在该篇小说的对话中,全都没有双引号的插入,造成部分对话内容没有被采纳入“展示”叙事之中。对比前后五篇小说的识别结果,可以发现算法对科幻小说的识别效果略微好于现实主义文学作品。

二、叙事条纹与叙事节奏谱

(一)小说的叙事条纹

我们利用构建的识别算法,对四个长篇科幻小说的叙事形式进行了识别。四部作品分别是王晋康的《十字》、刘慈欣的《三体1》、韩松的《地铁》以及何夕的《天年》。这四位作家被普遍认为是中国当代科幻作家的领军人物[13],且风格各异,具有较强的代表性。

识别结果如图2所示。可以看到,黑色标记的告知性文本与白色标记的展示性文本,随叙事进程交替出现,形成条纹状的图案。在小说的不同区域,叙事的主体形式也不太相同。如果我们着眼观察黑色的告知型叙事条纹,可以发现其呈现出三类典型的分布方式。

图2 四部长篇科幻小说的叙事条纹图

注:(a)为《地铁》,(b)为《三体1》,(c)为《十字》,(d)为《天年》。图中横轴为文本序列,以一句为一个单位。黑色标记的部分为告知性叙事文本,白色的则为展示性叙事文本。

其一,近连续分布。例如在《三体1》中3,500句至3,600句之间,黑色条纹形成了近乎连续的分布,意味着这是一个以告知型叙事为主体的部分。事实上,该段文本交代的是叶文洁对红岸基地所受的“日凌”干扰问题的思考,其中包含大量知识型叙述。在科幻小说中常常可以见到这样的段落,但它不能简单等同于所谓的“知识硬块”,因为在小说里对这些知识的叙述过程是和主角的思考联系在一起的,是融入在故事进程之中的,因此阅读的时候并没有突兀之感。

其二,密集型分布。在这种区域中,告知型叙事频繁出现,通过简要而概括地叙述,将小说的故事迅速向前推进,形成一种白描式的跳跃性的叙事节奏。在以上四部小说里,韩松的《地铁》将这种叙事节奏体现得最为突出。

其三,稀疏型分布。告知型叙事很少出现,通过大量展示型叙述,对特定场景进行细致的描写,或者呈现一个较为完整的对话过程。例如,在《十字》的700句至900句之间,就是一个明显的以白色为主的区域。通过文本细读我们可以发现,这里实际上集中了多组对话,包括萨帕林与谢苗诺维奇对单晶硅剑的讨论,以及在警察局召开的一场案情分析会。

(二)叙事节奏谱

通过叙事条纹,我们可以对作品的叙事节奏有一个直观的认识,但很难进行定量的分析与比较。如果我们把“展示”与“告知”的交替过程,视为一种周期性节拍,就可以借助离散傅里叶变换的方法,从中提取出不同节拍频率的分布图。其变换式为:

其中n为以句子为单位的文本序列的编号,N为文本中包含的句子总数。当该句为展示型叙事时,x(n)=1,告知型叙事对应的x(n)=0.X(ejω)为变换后的频谱,ω为对应的频率。

我们可以从图3中直观看到不同的叙事条纹经过傅里叶变换后所得到的叙事谱的区别。图中每一行的左侧为固定节奏下的叙事条纹,右侧为变换后的谱线。由于条纹呈严格的周期性分布,其谱线为离散的尖峰,其频率最低的峰值位置为基频ω0,在基频整数倍的位置还有更高频的尖峰。比较各行的图像可知,第2行的叙事节奏比第1行更慢,在谱线中体现为其在更低频的位置出现了峰值。而第3行与第2行的叙事交替节奏是相同的,但白色条纹更宽。因此,谱线图上可以看到二者的峰值位置是相同的,但谱线分布更集中在了基频ω0处。也就是说,在叙事过程中每次“展示”部分的长度越长——比如作品中惯用较长的篇幅描摹场景和细节,或者进行连篇累牍的对话——就会使频谱更集中的分布到低频部分。

图3 傅里叶变换后的叙事节奏谱示例

在实际的叙事形式分布中,当然不会有图3所示的严格周期性,因此,其谱线通常不是离散的尖峰,而是一个连续谱。我们通过随机函数构造了两个更贴近实际的叙事条纹,如图4所示。每个条纹均是在黑色背景中加入众多白色条带簇所构成,上面一行是以10句为基准周期加入的条带簇,但分布的具体位置经过了随机的调整,每个条带簇由2—3个白条纹组成。下面一行的基准周期则为30句,但每个条带簇由4—7个连续或密集出现的白条纹组成。从条纹整体看来,似乎没有显著区别,但从右侧的谱线图可以看到,第二行的节奏谱在低频区具有更多的分布,正和我们的预期一致。这表明叙事节奏谱确实可以揭示出叙事条纹中的节奏信息,即使一些看上去极为相似的叙事条纹,其隐藏的节拍也可能具有显著的区别。

图4 复杂叙事分布下的连续谱示例

我们对图2所示的四部科幻小说的叙事条带进行了离散傅里叶变换,得到了它们的叙事节奏谱,如图5所示。从完整的谱线来看,它们的形状都很接近:在极低频处出现峰值之后,都呈现出从低频到高频的类幂指数下降曲线。我们用幂函数f=a·x-b对其进行拟合,拟合出的函数参数如表3所示。

表3 对叙事节奏谱的幂函数拟合结果

我们更关注的是在低频处的谱线,因为它反映了叙事条纹在整体上的节奏,而且不容易像高频处的谱线那样受到无序信号的干扰。我们把四个谱线的角频率小于0.15的部分放到一起进行比较,如图5(e)所示。虽然在连续谱中无法分辨基频频率的位置,但在频谱图中具有最高数值的尖峰所对应的频率ωP仍然具有类似基频ω0的指标性意义。也就是说,叙事形式转换得越快,ωP越大。从图中可以看到,在四部小说里,《天年》的ωP最小,且峰值最大,说明其叙事节奏是这些小说里最慢的。《三体1》与《十字》的低频峰在位置和高度上都很接近,表明两部小说具有相似的叙事节奏。而《地铁》的低频峰较为特别,其在0.02—0.075的角频率范围内呈现一个平台状特征,且峰值较小,这说明其叙事形式的转换较快,且没有大篇幅的展示性内容。

图5 四部长篇科幻小说的叙事节奏谱

注:(a)(b)(c)(d)对应的小说同图2。图(e)是对低频范围谱线的放大比较。

文类比较

以现实主义为代表的中国当代的主流文学作品与中国的科幻小说,在叙事方式上是否有显著的区别,是一个有趣的问题。从个案分析的角度来阐释,挂一漏万,很难全面地对两种文类进行比较。为了系统地考察这个问题,我们从鲁迅文学奖的获奖作品中选取了全部的35则短篇小说,从中国科幻银河奖的获奖作品中选取了50篇作品(均为短篇小说),作为两个文类的代表。具体的作品名录见表4。之所以选取短篇小说,是因为在1980年以来,中国科幻作品主要的刊发平台为科幻杂志,因此,绝大部分作品均为短篇小说。

表4 分析作品列表

在得到所有作品的叙事节奏谱后,我们从中提取了两个特征量,进行比较。其一是最大峰值频率ωP,它反映了在叙事过程中展示和告知转换的快慢。ωP越大,叙事节奏越快。其二是在频谱图中低频部分(0—0.1)的积分在整个频谱图全积分数值中的占比,即:

如前所述,当叙事中的“展示”部分越长,频谱就会越集中地分布到低频区,因此r就越大。我们不妨将r称为展示度,r越大,叙事节奏越慢。

我们以ωP为横轴,展示度r为纵轴,绘制出所有作品的散点分布,如图6所示。可以看到,大部分散点的坐标都分布在(0,0.04)—(0,0.08)—(0.2,0.04)这个三角区域内,不管是科幻小说还是主流文学,说明两种文类在叙事节奏上具有相通之处。

图6 选定作品的分布图

注:嵌入的小图为两类小说的ωP和r的平均值在不同时期的变化情况。

但区别仍然存在:在最大峰值频率为[0.2,0.9]、展示度为[0.02,0.04]的区域内,主流文学作品的数量明显多于科幻小说;而在最大峰值频率小于0.1、展示度高于0.08的区域内,则几乎都是科幻小说。如图6中的两个椭圆所示。这两个独特的分布特征是协调统一的,因为不管是主流文学较高的ωP,还是科幻小说较高的展示度r,都意味着主流文学作品具有较快的叙事节奏。我们根据表4划分的4个时间分区,计算不同时期两类作品的ωP和r的平均值,结果如图6的嵌入图所示。可以看到,不管在哪个时期,主流文学的平均最大峰值都大于科幻小说,而后者的平均展示度也都高于前者。

为了分析这种差异背后隐藏的机理,我们选取了四个小说样本进行数据分析与文本细读。在图6中,这四个小说及其分别对应的坐标为:(1)《赵一曼女士》,坐标(0.8482,0.0259);(2)《高塔下的小镇》,坐标(0.0074,0.0927);(3)《茨菰》,坐标(0.7053,0.0229);(4)《画骨》,坐标(0.0066,0.0958)。在图中已用箭头对四个样本进行了标记。可以看到,样本1、3位于图6右下角,为鲁迅文学奖获奖作品,样本2、4则位于图6左上角,为银河奖获奖作品。

我们绘制出这四个样本的叙事条纹及其节奏谱线,如图7所示。可以看到,在样本1、3中,展示和告知两种叙事形式总是频繁地交替出现,让故事得以迅速推进,使得节奏谱线的峰值出现得较晚;而在样本2、4中,则出现了100到200句的大篇幅的展示性内容,拖慢了叙事的节奏,让最大峰值出现在了极低频区间,并造成频谱大量集中分布在低频范围内。

图7 四部小说的叙事条纹及节奏谱

通过文本细读,我们可以发现,样本2中的100句至200句之间,以及样本4中的400句至800句之间的展示性内容,都属于对话描写。如此长篇幅的对话,在主流小说中是不多见的。科幻小说作者为何需要在小说中铺陈如此漫长的对话呢?其原因根植于科幻小说的一个重要特点,那就是世界设定。

在科幻作品的世界背景中,总是有某些在现实世界不存在的要素。它可以是某个虚构的星球,可以是某种幻想的生物,可以是一种设想中的科技成果,也可以是某种奇特的社会结构。这些虚构的要素我们将其称为“设定”。完全没有设定的科幻小说是不存在的,即使在一些偏向现实主义的作品中,也多多少少会出现某些偏离现实状况的点,这正是科幻小说与主流文学作品的重要区别之一。而为了在作品中将设定交代给读者,同时避免“知识硬块”,科幻作家们所采取的一个重要方法就是将其融于对话之中。

例如,在小说《高塔下的小镇》(样本2)的100句至200句,是如下内容:

刚进果树林子,我就听见了望月的声音,真令人讨厌。就是这个人偷走了我的水晶。他还在撒谎:“……我们浪费了多少时间和机会了?三百多年前,大战刚刚结束之时,这颗星球上星散着成千上万的文明残余势力,可现在它们大部分都消失了。……”

可以看到,作者借角色之口,说了一段很长的话,实际上是为了对故事的背景设定进行阐释。而在小说《画骨》(样本4)里,对设定的交代则通过多人之间的对话来进行。这种通过对话来交代设定的方式,比起直接在文中进行叙述,更为自然,因此在科幻作品中被大量采用。这正是众多科幻作品具有长篇幅的展示板块,而与主流文学在叙事节奏上产生差异的主要原因。

结 论

基于短时性动词词典和句子成分分析,本文构建了一种可以区分小说“展示”和“告知”两种叙事形式的算法。在获取到叙事形式的分布条纹图之后,我们借助离散傅里叶变换,从中提取到两个表征叙事节奏的特征量,即最大峰值频率ωP和展示度r,它们分别反映了叙事形式的转换频率以及叙事中的展示板块的长度。

通过这个算法,我们重点对中国当代科幻小说的叙事形式进行了识别和分析。对王晋康的《十字》、刘慈欣的《三体1》、何夕的《天年》和韩松的《地铁》这四部长篇科幻小说进行的分析表明,《天年》的最大峰值频率最小,意味着其叙事节奏是最慢的。《三体1》与《十字》的叙事节奏很接近,而《地铁》的叙事节奏是其中最快的。此外,我们对当代中国科幻小说与主流文学进行了叙事节奏的比较,结果显示主流文学普遍具有较快的叙事节奏,其原因是在科幻小说中通常具有通过对话进行设定呈现的板块。

本文所构建的叙事节奏分析方法具有较强的普适性,后续还可以应用于推理、言情、武侠等其他小说类型的分析,特别是对于具有超长篇幅的网络小说,是一种快速有效的叙事特征提取的手段。在各文类的比较中不仅可以凸显各自所具有的叙事特质,发现更多文类特有的叙事范式,我们也可以借此构建一个跨文类的智能化的叙事分析系统,对特定小说进行具有针对性的叙事评价,也为传统的叙事分析方法提供一个全新的参考视角。

—————————————————————————————————————————————————————————————

The Recognition and Analysis of the Narrative Form of Science Fiction

Liu Yang

Abstract: This paper proposes an algorithm based on dictionary and sentence component analysis, which can distinguish “showing” and “telling” in narrative text. With the help of discrete Fourier transformer, we can get the narrative rhythm spectrum, and extract two characteristics of the narrative rhythm: the maximum peak frequency and the display degree. The analysis of the narrative rhythm of four representative long sci-fi novels in contemporary China shows that He Xi’s Doomsyear has the lowest peak frequency, suggesting a slow narrative rhythm, and Han Song’s Subway has the fastest rhythm. In addition, the comparison between science fiction and mainstream literature shows that science fiction tends to have a slow narrative rhythm, due to the general content to explain the settings through dialogue.

Keywords: Narrative Analysis; Narrative Stripe; Narrative Rhythm Spectrum; Science Fiction

—————————————————————————————————————————————————————————————

*本文为“中央财政支持地方高校发展专项资金项目”阶段性成果。

编 辑  | 严程

注释:

[1]珍妮特·伯罗薇、伊丽莎白·斯塔基-弗伦奇、内德·斯塔基-弗伦奇:《小说写作:叙事技巧指南》(第九版),北京:中国人民大学出版社,2017年,第29页。

[2]罗伯特·索耶:《展示,而非告知》,飞氘译,《科幻世界》2006年第8期。

[3]戴维·洛奇:《小说的艺术》,王峻岩等译,北京:作家出版社,1998年,第135页。

[4]C. Rawson“, Showing, Telling, and Money in Emma,”Essays in Criticism, vol. 61, no. 4, 2011, pp. 338-364.

[5]潘守文、李文富:《〈黑暗深处〉的“展示”与“告诉”》,《吉林师范大学学报》(人文社会科学版)2009年第4期。

[6]吴岩、方晓庆:《刘慈欣与新古典主义科幻小说》,《湖南科技学院学报》2006年第2期。

[7]叶至善:《失踪的哥哥》,《世界科幻博览》2005年第7期。

[8]Teresa S. ,“A Method for the Analysis of the Structure of Narrative Texts,”Literary and Linguistic Computing, vol. 5, no. 3, 1990, pp. 221-225.

[9]Hess L. , Bary C. “, Narrator Language and Character Language in Thucydides: A Quantitative Study of Narrative Perspective,”Digital Scholarship in the Humanities, 2019, p. 026.

[10]战玉冰:《〈收获〉刊载小说的数据性考察(1979—2018)》,《中国现代文学研究丛刊》2019年第2期;战玉冰:《数据分析视角下的茅盾文学奖研究》,《中国比较文学》2020年第2期;战玉冰:《网络小说的数据法与类型论——以2018年的749部中国网络小说为考察对象》,《扬子江评论》2019年第5期。

[11]走走:《探索未来,一半靠人,一半靠AI》,《南方文坛》2019年第6期。

[12]Alan R. ,“Rhythm in Prose and the Serial Correlation of Sentence Lengths: A Joyce Cary Case Study,” Literary and Linguistic Computing, vol. 11, no. 1, 1996, pp. 33-39; 郑亚斌、刘知远、孙茂松:《中文歌词的统计特征及其检索应用》,《中文信息学报》2007年第21期。

[13]董仁威、高彪泷:《中国科幻作家群体断代初探》,《科普研究》2017年第2期。

原刊《数字人文》2020年第4期,转载请联系授权。