朝向“数字人文”的文学批评实践：进路与反思 – 中国数字人文 | 数字人文门户网站 | DHCN

作者：但汉松；转自：公众号 DH数字人文

———————————————

摘要：在“数字人文”的研究浪潮进入欧美人文学科之后，如何将文学批评与数字人文进行有益结合，是一个亟待思考的议题。本文回顾了在近几十年来自然语言处理和基于语料库和话语/叙事分析的文学文体学的发展，指出面向文学研究的数字人文应该继承但有别于这些领域已经做出的跨学科尝试。在大数据时代，数字化的文学批评可以充分借助人工智能中机器学习的方法，并在一种弗朗西斯·培根式“新工具”的思维下，开展对于海量文本内部与外部模式的勘察。这样的文学批评最后并非是彻底走向“远读”，或者将阐释的任务交给“自动化”的学习算法来完成，而是让机器阅读成为对传统阅读的一种激发与挑战。构建一种具有独特的数字化思维，但又根植于传统文学批评观念和认知模式的新型文学批评，是本文无法给予回答但却迫切希望能展开讨论的议题。

关键词：数字人文文学批评算法文体学

———————————————

一

上世纪60年代初，一个南非青年游荡在昔日帝国的首都伦敦。虽然他憧憬成为艺术家，但凭着不赖的智商还是在IBM谋到了编程的差事。他操作的是当时很稀罕的Atlas计算机。工作之余，他琢磨着用计算机统计聂鲁达（Pablo Neruda）诗歌中的高频词，然后将这些词打散重组，最后连缀成“诗”。他想，或许有天这个笨拙的机器能凭借“非此即彼”（either-or）的计算逻辑，写出伟大作品打败莎士比亚。^[1]此人后来去德克萨斯大学奥斯丁分校留学，并在那里完成了关于贝克特（Samuel Beckett）小说文体分析的博士论文。后来，他成为了职业作家，拿到了诺贝尔文学奖，并把这段往事写入自传体小说《青春》（Youth）里。他，就是库切（J. M. Coetzee）。

如果将库切与Atlas计算机的这段遭遇，定义为“数字人文”（Digital Humanities）前史中计算与文学相遇的某个象征事件^[2]，或许并不为过，因为它体现了数字人文两条主要的隐线：自然语言处理（NLP）和文学文体学（Literary Stylistics）。前者发轫于1950年图灵（Alan Turing）所提出的“图灵测试”（Turing Test），他将机器智能的判定标准定义为人与机器交流的无差别性，即机器是否能获得与人类一样的NLP能力。然而，在NLP研究的前三十年，计算机专家和语言学家的合作走了很大弯路。当时人们普遍认为，可以借助传统语言学研究，将自然语言的语法规则一网打尽，并在此基础上将人类语言的全部知识以符号代码的方式教给计算机，从而实现用电脑模拟人脑来处理自然语言。但事实上，基于乔姆斯基形式语言的编译器技术很快遇到了瓶颈。首先，自然语言真实词句的形态极其庞杂，仅依靠知识工程的方式来穷尽文法规则是不现实的；其次，即使这样的规则集合可以写出来，那么它们必然是与语境相关的语法（context-dependent grammar），而程序语言使用的是与上下文无关的语法（context-independent grammar）。如果考虑自然语言的上下文，那么“计算复杂度基本上是语句长度的六次方”，甚至当时IBM大型计算机都无法完成这样的计算量。^[3]

七十年代统计语言学的出现改变了自然语言处理的窘境，也为数字人文的出现奠定了方法论基础。这种从规则到统计的变化，让计算机科学家不再执迷于对自然语言进行深层研究，而是利用统计模型在语料中寻找自然语言的浅层规律。其中一个核心模型就是隐含马尔可夫模型，它被证明能有效计算出句子内相邻词同时出现的概率。^[4] 于是，计算机需要做的不是根据人工规则挖掘语义，而是按照训练数据所得出的统计经验，预测出哪种词与词的连缀组合方式具有最大可能性。随着计算机运算能力的飞跃，以及互联网技术下自动抓取的自然语言数据量的激增，这种基于统计的NLP技术已成为了当下的主流。现在，人工智能驱动的NLP为数字人文中的文本挖掘提供了巨大便利，让我们能够研究词语共现（concurrence）的规律，甚至对海量文本做情感分析（sentiment analysis）。

但是，这一条隐线是以计算机科学为主导的，同时辅之以统计学方法，并未向文学批评伸出橄榄枝。换言之，转向统计思维的NLP技术无意去探索文学这种更复杂的自然语言形式，它针对的是特定的日常生活情境（如语音识别、输入法、垃圾邮件分类、网络舆情监控等等），仅满足于在普通的语言质料中寻找人类语言使用的近似规律与模式。真正矢志于将计算与文学相结合的，其实是另一条更重要的隐线，那就是以应用语言学家为主导的文体学研究。1958年在印第安那大学召开的“文体学研讨会”被视为是语言学与文学之间的交叉学科在英美诞生的标志。所谓的文体学，按照辛普森（Paul Simpson）的定义，是“一种将语言置于主要位置的文本阐释方法”^[5]。库切在60年代初对贝克特小说的文体分析，就是这个新兴学科的产物。而更早期的“新批评”先驱瑞恰兹（I.A. Richards）等人在提出Basic English的时候，其实也是在对英语文学的文体特征做一种定量的统计计算。

作为一种将文学和语言学相结合的跨学科研究，文学文体学在近五十年有了迅猛的发展，而英美是西方文体研究事实上的中心。甚至可以说：早在近年来“数字人文”热之前，应用语言学的学者们早已跨越文学和语言学的鸿沟，在文学的人文计算领域耕耘了半个多世纪。然而，和NLP一样，文学文体学的发展经历了曲折。当六七十年代“新批评”在美国走向式微时，文学文体学曾短暂接过了其衣钵，因为两者都关注文学语言的形式。但在解构主义、后结构主义的冲击下，这种依赖传统语言学对文学做定量分析的方法受到质疑，被认为是保守的、孤立的、机械的。美国重要的文体学杂志要么停刊，要么转而刊登叙事学论文。^[6] 面对瓶颈，文体学几乎与NLP同时在八九十年代出现了重大转向，不过后者得益于统计与概率，而前者则是因为韩礼德（M.A.K. Halliday）带来的系统功能语法。

文体学的这种功能转向，对理解数字人文与文体学的异同颇为关键。韩礼德最大的理论贡献，是不再像索绪尔、乔姆斯基那样将语言视为一个符号系统，而是将语言作为社会的、文化的现象，转而关注语言具体情境下的使用。韩礼德将意义理解为一个在语境中生成的复杂系统，进而区分了三种意义：概念意义（ideational），人际意义（interpersonal）和语篇意义（textual）。^[7] 值得注意的是，韩礼德以戈尔丁（William Golding）的短篇小说《继承者》（The Inheritors）为个案，阐述了这种功能文体学的具体实践。通过对小说中尼安德特人和智人语言的及物性过程（transitivity）做定量统计与分析，韩礼德以图表的方式展现了小说语言是如何形塑世界和世界观的。^[8] 随着功能文体学的蓬勃发展，文体学家从分析语气、情态、语调、人称、自由间接引语、及物性、表达情感色彩与态度的形容词和副词入手，探讨文学文本中反映的作者/叙述者与人物、读者之间的关系以及由此产生的文本意义。

然而，韩礼德及其追随者的功能文体学分析较为精细，更适合分析诗歌和中短篇小说。将文体学进一步推向“人文计算”的，则是八十年代兴起的语料库语言学（corpus linguistics），其中代表人物是辛克莱尔（John Sinclair）。辛克莱尔代表了英国“伯明翰学派”的话语分析（discourse analysis）之路。他以文学文本为语料库来驱动自然语言中的话语研究，这对未来的数字人文发展具有重要的方法论启示。辛克莱尔早期研究以文学文体学为主，分析过拉金、华兹华斯和莎士比亚等人的诗歌，后期则倾向于将文学作为数据库，因为他相信“只有通过亲近文学，才能找到一种系统化工具来描述语言”^[9]。不难想象，辛克莱尔从语料库语言学发展出一种适合文学的语料库文体学（corpus stylistics），它比一般的文学文体学研究更像“大数据”，毕竟前者可以对长篇小说进行分析，甚至包括相关性高的多部小说的聚类分析（cluster analysis）。

必须特别指出的是，语料库文体学不等于文体测量学（stylemetics）和文体统计学（statistical stylistics）。后面两种研究虽然听上去更强调计算，也像是严格意义上的纯实证研究，但它们往往并不关注文本阐释，而是“通常以词频为研究变量来判断语篇的统一性，作者的身份和语篇产生的年代。”^[10] 它们的经典应用，是对所谓“莎士比亚伪作”做文体测量并确定争议作品的归属，但很难说这种以文本“指纹”推断作者身份的研究是文学阐释，毕竟在面向文学的语料库文体学中，阐释应为研究的题中之义。研究者对语料库的使用，比如“在对语料进行加工标注的基础上，通过词频统计、主题词检索、索引、词类分布以及特殊结构的人工标注与检索统计等手段”，目的应是为了阐释“文学作品的主题、人物形象的塑造、叙事的发展以及作家风格等”。^[11] 辛克莱尔的名言是，“当你同时看大量的语言时，它就会显得不一样。”^[12] 这句话也适用于语料库驱动的文学话语分析。正是因为对很多作品同时进行分析，批评家才能发现那些传统阐释法无法找到的意义模式。一个经典的例子，就是辛克莱尔在语料库词汇搭配研究中特别关注的“语义韵”（semantic prosody）^[13]。

将韩礼德和辛克莱尔结合得最好的，或许当属英国文体学家图兰（Michael Toolan）。一方面，他像韩礼德那样拓宽了文体学研究的对象，将“文体”和“话语”视为文学的一体两面，从而将文体学与叙事学糅为一体，使之成为了“叙事文体学”（narrative stylistics）。在研究“文体”时，他聚焦于语言成分，包括“词语选择、小句模式、[文字]节奏[如韵律、词语或句子的长短]、语调、对话含义、句间衔接方式、语气、眼光、小句的及物性等等”；而在探讨“话语”时，图兰关心的是“讲故事的人选定创造事件的特定顺序，选定用多少时间和空间来表达这些事件，选定话语中（变换的）节奏和速度[究竟是快速简要概述还是慢慢地详细描述]。此外，还需要选择用什么细节、什么顺序来表现不同人物的个性”等等。^[14] 另一方面，图兰又续接了辛克莱尔的语料库文体学，尤其是近年来，开始将研究方向转向基于语料库的文体研究，探究短篇小说的叙事进程和叙事性。图兰的语料库涵盖了20世纪短篇小说的代表作，使用了一些经典的统计语言学分析工具（如Word-Smith Tools，Wmatrix）以及特别的软件程序，追踪文本中高频词和新词汇的分布规律，以此来揭示短篇小说文本叙事进程的各种规律。^[15]

二

此时，我们可能已对所谓“数字人文”框架下的文学批评产生了疑问：“数字人文”作为新术语进入欧美人文学科不过是近十年的事情，但文学研究是否已经在文学文体学中被“数字人文化”几十年了？韩礼德、辛克莱尔和图兰这些学者对文学的研究，不就是一种定性的、计算的研究吗？这种命名的滞后，很像图书馆学、地理信息学、计量史学圈子很多学者的抱怨：早在DH被作为一个学术概念炒热之前很久，他们其实早已开始走数字人文之路了。果真如此的话，那么当前数字人文的文学研究进路，是否仅仅需要在现有的文体学研究框架下，用“文学文体学+语料库+更多的计算、统计方法”这样的配方就足够了？

然而，问题绝没有那么简单。笔者认为，“数字人文”旗帜下的文学研究并非简单地在研究文学的过程中运用计算机软件、统计工具或数据库/语料库，也不是应用语言学框架内文学文体学某种“顺水推舟”的发展。作为学科融合的概念，“数字人文”产生于这个以互联网、大数据、人工智能/机器学习为特点的信息时代，它作为一个“伞状概念”（umbrella concept）被不同学科、不同机构用来指代不同的方法与理念。^[16] 但本文更认同安斯沃斯（John Unsworth）在那篇颇具争议的《什么是人文计算？（什么不是？）》中谈及的观点：“人文计算是一种再现的实践，是一种建模或模仿形式。它是一种论证方式，是一套本体论的许诺（ontological commitments），它的再现实践一方面由其所需要的有效计算决定，一方面则取决于人的交流。”^[17]换句话说，安斯沃斯认为“人文计算”最本质的要素不是使用了什么工具，而是人作为研究问题的提出者，在处理问题过程中和这个工具处于一种怎样的关系中。为了正本清源，他指出了那些被称之为“江湖骗术”的人文计算，它们的共有特征就是将原本复杂、庞大的再现实践变成“拙劣而浅显的模仿”，仅仅是为了追求计算的浅层效果。^[18]那么，检验人文计算含金量的指标到底是什么呢？安斯沃斯认为，判断依据就是制定研究问题的用户与人文计算之间的“相互作用性”。^[19] 如果完全没有相互作用发生，只是借人文计算的皮相，那就是“江湖骗术”；如果运用到了关键词搜索、组合检索等，这属于较为初级的；如果在计算过程中有可以改变的变量和参数，并引入了新的算法，那么这就是相当好的人文计算。

这里，笔者想借用海尔斯（N. Catherine Hayles）的观点对“相互作用性”做进一步引申。在数字化文学批评中，应该存在着两种意识载体在活动：一个是批评家的人脑，它是具有认知能力的意识主体；另一个则是来自机器与算法，它被海尔斯称为“认知的非意识”（cognitive nonconscious）。^[20] 海尔斯创造这个概念的本意，其实是想说明数字人文中电脑虽然不具备意识能力，但却可以进行认知活动；同时人类不必为拥有机器无法效仿的意识能力沾沾自喜，因为这种意识在认知活动中会带来无法克服的偏见与负面代价。^[21]我认为，理想的数字化文学批评，应该是这两种批评认知力量的“战争”（agon），两者保持一种紧张对峙状态，并不仅仅用于相互印证或否定，而是相互启发和批判。同时，人类读者作为这场“战争”的主角（protagonist）存在，而机器读者是敌人（antagonist），两者关系既不可等同，也不可互换。这并非简单的折衷主义，而更像是一种元批评，即不对结论做先入为主的预设，而是对批评方法、模型本身保持暂定性，一旦数据计算中揭示出的“意外”状况，人类读者就可以开启反思式、生产性的解读。

霍伊特·朗（Hoyt Long）和苏真（Richard Jean So）的研究为机器与人的这种竞争式阅读做出了绝好的示范。他们试图以日本俳句在美国现代主义中的接受和改编为个案，用朴素贝叶斯算法构建的分类器让机器学习识别英文俳句。有趣的是，这个研究并不是为了证明机器可以“鉴诗”，而是要让文本细读、机器学习和历史主义批评这三种阅读阐释“模型”产生一种安斯沃斯所说的“相互作用性”。进一步的说，两位作者认为三种读法都内化了某种关于文本的本体论认识（或用安斯沃斯的术语，“本体论的许诺”），他们的做法“并非要偏重某一种模型而贬低另一模型，而是要主张通过这类人力阅读和机器阅读的交互作用，凸现出一种关于俳句这种文学事物的新的批评视角。通过讲这些文学分析模型理解为按其自身视域具有理据、而在更广阔的模式识别阐释学中可相互对照，一种关于俳句——以及广义地关于现代主义文本——的新的本体观出现在人们视野中。”^[22]

另一个范例是莫莱蒂（Franco Moretti）用“网络理论”（Network Theory）重读《哈姆雷特》的尝试。和霍伊特·朗与苏真不同的是，莫莱蒂的研究并未凸显大数据和人工智能的技术维度，他甚至坦言这是基于关系网络的粗浅研究，剧中人物关系拓扑图是人工绘制的，全然没有当下社交网络分析工具Ucinet和Gephi的“复杂气质”。但即使在这样看似“低端”的数字人文实践中，我们依然感到莫莱蒂强烈的问题意识。他始终强调，自己是在操练一种“再现的实践”，并对其模型运用了一种批判性解读。具体地说，《哈姆雷特》的人物关系链有三个关键人物，即哈姆雷特、好友霍拉旭（Horatio）和继任国王克劳狄斯（Claudius），经由他们三个人全剧所有人物获得了联结。莫莱蒂惊奇地发现，如果将克劳狄斯拿掉，剧中人物的网络结构不受太大影响；但如果将原本在剧中分量轻微的边缘人物霍拉旭拿掉，剧本的关系网络就会坍塌。^[23]

莫莱蒂以一种思辨性的解读，首先追问了这种将剧中人物关系做可视化建模到底有何意义。他的答案是：这种阅读模型可以将时间性的情节变为一种“过去”与“现在”并置的抽象关系，这是传统的阅读所不能给予我们的观察角度。^[24] 由此，莫莱蒂发现了霍拉旭对关系网络的奇特意义——他虽然看似无足轻重，但帮助哈姆雷特联结了宫廷之外那些游走于戏剧中心的“小人物”。^[25] 该研究最大的方法论意义，实际上是莫莱蒂试图打通风格与情节的野心。他认为，自己的研究可以指向更具普遍性的数字人文文学研究方法：“风格嵌入情节，变成情节的功能。这可能会是一个突破，不仅仅针对文学分析——（文学分析）目前还无法创造出一种将情节与风格统一的理论——而且适用于更广泛意义上的文化分析…情节-风格这个连续体所能提供的，是基于我们的行动和我们如何思考这种行动之间的一种关系模型。”^[26]虽然莫莱蒂的这个研究尚在初级阶段，但他对于不同阅读模型的元批评意识，无疑是和霍伊特·朗、苏真等人的研究殊途同归的，也彰显了安斯沃斯所心仪的那种“人文计算”。

那么，目前文学文体学是否已经完成了朝向数字人文的范式转换呢？我觉得答案是否定的。一方面，虽然文学文体学比语言文体学更关注文学，但文体学总体上依然是以语言、语言学为导向，其价值归宿是如何借助文学来更好地完善语言（包括话语与风格）分析模型。如果仅仅将经典文学作品作为风格化的语言质料加以统计处理，那么这样的数字化文学批评很容易沦为验证某种语言学理论（如系统功能语法）或特定语言分析方法（如认知心理学）的“酸碱试纸”。然而，文学批评作为一种主观的、直觉的阐释活动，它针对的是文本意义及其背后的深层含义。艾布拉姆斯（M. H. Abrams的）在《镜与灯》中认为，批评理论考察的是四个要素，即作品，作者，世界和读者。^[27]无论是将文本作为客体，还是强调作者主观意图，亦或是关注读者反应，文学批评都是在文学的复杂系统中探究不同要素之间的关联和意义的生成，其价值取向是基于艺术审美的，关注的是信仰、伦理、天赋等“非功利主义的、非经济的、非物质的、内在的领域，而且在本质上，它是不变的、超验的”。^[28]显然，这与语言学的功能主义、工具主义、物质主义的取向有着深刻差异。

M. H. Abrams
*The Mirror and the Lamp: Romantic Theory and the Critical Tradition*

另一方面，文学文体学的一些最新领域（如女性主义文体学、认知文体学、叙事文体学）虽然在做“去语言学化”的尝试，但与人文计算的大数据、自动化、智能化方向却渐行渐远。如前所述，NLP涉足文学的最大阻碍，在于后者是高语境的。韩礼德对于文体学的改造，正是向语境的一次进军，人际意义和语篇意义都是在上下文中生成的。辛克莱尔反对主流的语料库文体学中对于人工标注（tagging）的过度使用，并认为“计算机能够被训练用来识别标签，而且标记式语言可以帮助文本在机器之间输出…文本中的语言和内容等会有越来越多的方面可以被（计算机）标注出来。”^[29] 然而，依然有众多语料库文体学家坚持认为，“一些复杂的话语现象，比如话语陈述，它们并非基于词汇，是无法被计算机程序系统地、定量地检索，也无法在上下文中被阐释。”^[30] 图兰对于人文计算的自动化过程也持保留态度，譬如他就反对将文学文本做数字化处理后的特征结果与参考语料库（reference corpora）直接进行比较的做法，因为对文本叙事元素的究查应摆脱语言的束缚，更多地转向心理学、社会史和文化。^[31]或者说，图兰认为意义的生成不是在一个标准语料库中观察比较得到的，而是应该考虑读者个体化的认知过程，这其中涉及到一时一地的读者主体带入阅读过程中的推理、图式（schema）、文类期待和自身的文化背景。^[32]这样的研究是基于叙事认知的细微过程，同样也是高度语境化的，很难被目前的计算机建模或模拟出来。

简言之，文学文体学在其自身发展中就存在“重语言”还是“重语境”、“重文化”的分歧，它的发展转化面临着来自学科内部自身的危机，既与文学批评传统中的“细读”模式存在抵牾，同时也依然对是否应该进入数字人文的算法批评心存疑虑。诚如拉姆齐（Stephen Ramsay）所言，尽管“数字化的文学研究”在自然语言处理、统计语言学、语料库文体学等领域已经早已展开了几十年，但真正的“算法批评”（algorithmic criticism）其实还未出现（或者说，仅有一些雏形），它远未渗入文学批评的核心区域。^[33]

三

到底什么是“算法批评”呢？按照拉姆齐的定义，它是“一种源自对文本进行算法处理的批评”^[34]。这种数字化的文学研究绝不只是单纯在文学分析中使用统计模型、计算机软件等，而是让算法以人工智能的方式嵌入文本阐释的过程中，使之成为海尔斯所指的“认知的非意识”，并与传统批评范式或意识产生互动。拉姆齐格外强调，算法批评在其发展之肇始，就应该考虑到“科学的方法如何在人文计算自身中被使用和滥用”^[35]。这种对于人工智能技术在文学批评活动中的批判性接受，也恰恰是安斯沃斯对人文计算的那种理想性规划。借助机器学习来识别英文俳句的个案，或许只是贝叶斯算法在文学批评中的一次初级应用，但却或许称得上拉姆齐意义上的“算法批评”的雏形。

Stephen Ramsay
*Reading Machines: Toward an Algorithmic Criticism*

那么，我们该如何进一步走向这种“算法批评”呢？或者更具体地说，我们如何能利用人工智能领域的飞速发展，将机器学习（甚至深度学习）^[36]引入到文学批评的实践中，让这种批评帮助我们进一步解析文学作品，同时还借助计算机的超强运算能力和学习算法的自我完善能力，去观察更庞大的文学数据中人类无法觉察的模式与规律？

要迈出的第一步，或许是文学批评家对于机器学习的破冰之旅。时下，机器学习的发展令人应接不暇，已经深入到日常生活的方方面面，依靠深度学习称霸棋坛的AlphaGo不过是其中一例。机器学习已细分为五种流派：符号学派、联结学派、进化学派、贝叶斯学派和类推学派。不同专业背景的文学研究者应该深入到机器学习的操作层面，学习用具体的模型、规律、算法等去解读文学文本。科技公司巨头有强大的盈利驱动力和技术资源，它们固然会积极推动人工智能的进步，但文学研究者恐怕不能指望它们慨然为人文计算提供现成的算法工具或软件。^[37]毕竟，以商业为导向的NLP技术并不关注精微的文本意义，它们更愿意去实现的，是如何从电商网站的客户评价中自动提取情感反馈，如何实验自动翻译并让准确率达到日常交际的基本需求，如何从社交媒体的信息流发现选民立场和舆情变化等等。而另一方面，在现实的人文计算中，我们的研究问题往往是个性化的，对文本语料库的特征标注和分类需求千奇百怪，无法以某几种通用工具来对接全部的计算需求。未来的数字人文研究者必须学会跨出自己的专业，亲力亲为地学习基础的编程方法和统计学。

另一方面，我们也必须承认，除了极少数像控制论之父维纳（Norbert Wiener）那样的全才，大部分文科学者都很难深入到机器学习的技术内核和细节层面。在“浅水区”，我们可能了解一下NLP、知识库、数据挖掘、深度学习、分词、贝叶斯定律等概念就够了；可如果想进入“深水区”，我们需要面对的将是正则表达式、感知器、马尔可夫链、BP网络、K最近邻算法等令文科生眼花缭乱的术语以及背后复杂的数学原理。如果未接受过起码的统计学、离散数学训练，就贸然宣称要在文学研究中植入人文计算的方法，那么即使不是故意“装神弄鬼”，恐怕也只能是一次堂吉诃德式的冲锋。当然，采取跨学科合作的方式也是当前数字人文研究的重要策略，但在与统计学家、人工智能专家的分工中，如何让文学批评保持自身独立性，却仍是非常棘手的问题。毕竟，文学研究的知识生产在本质上有别于科学，甚至与物理这类硬科学南辕北辙，因为前者的特点是“任务的高度不确定性”，同时习惯于单兵作战、以单一作者署名的文学研究者又“具有极低的相互依赖性”。^[38] 所以，未来的人文学者选择拥抱人工智能、却又无法真正深入并成为技术层面的主导者，这恐怕是知识爆炸时代加剧的学科壁垒和专业分工带给人文学者的一种宿命，也是我们作为人的必然局限。

要迈出的第二步，是对学习算法、文本挖掘、概率统计、可视化结果等科学方法的“祛魅”。当然，它不是对科学内部细节的敬而远之，而恰恰是要求人文学者在认识人文计算的原理方法之后，获得一种祛魅化的智识立场，即对科学本身的局限性、暂定性保持学理上的警惕和反思，不以“科学主义”取代文学研究传统中那种基于含混、悖论、反讽等要素的诗学价值观。事实上，科学中存在着各种各样的陷阱，譬如著名的“辛普森悖论”（Simpson’s Paradox）就提醒我们：在分组比较中出现的变量趋势，在合并组的统计计算中可能会获得相反的结果。^[39] 如果不了解统计数据在分组与合并中可能带来的截然相反的结果，我们可能就会掉入陷阱而不自知。同样，机器学习中会出现“过拟合”（over-fitting）的问题，这往往意味着算法在数据中找到了现实世界里并不存在的虚假模型，它不过是数据带给我们的幻觉。^[40] 甚至有人说，数据挖掘意味着“折磨数据，直到数据妥协”；在学习算法中又特别容易出现“过拟合”问题，“因为它们拥有从数据中发现模型、近乎无限制的能力”。^[41] 如果在数字人文范式下的文学研究中进一步引入读者心理认知的维度，我们还需要提防在心理学研究中早已为人诟病的“重复性危机”（reproducibility crisis），^[42] 不要过分相信在中小规模的受试读者中以调查问卷方式获得的统计分布规律。

如果上述“祛魅”是在科学方法范畴中进行的，那么还有另一种需要警惕的认识论迷信，它某种程度上源于我们在图像时代对于可视化图形的“返魅”（Re-enchantment）。中世纪的宗教绘画中隐藏着人类对于神圣力量的圣像崇拜，而在文艺复兴之后，当“圣像破坏运动”（iconoclasm）已经成为强大的世俗共识之后很多年，信息时代的我们却被重新带入另一种对于图像的崇拜。此刻，我们顶礼膜拜却不自知的，不再是教堂壁画中的圣母或耶稣，而是计算机通过程序生成并呈现的各种图表——曲线图、柱状图、圆饼图、点状分布图、网络关系图等等。它们不仅是图像化的数据，而且在人类潜意识中构成了机器的一种“绘画”，它似乎表征着某种真理的显形。然而，格金姆（Anna Marazuela Kim）尖锐指出，这些图像尽管看似无所不能，但其实不过是“对那个由人、物体和人际关系所构成的无比复杂的物质世界的一种苍白反映”^[43]。因此，习惯以文字进行学术生产的人文学者应该警惕人们对于“图表”的敬畏感。对于莫莱蒂所倡议的文学史制图方法，我们既要保持开放的学习态度，但同时也要小心这些图表背后数据的可检验性（retrievability）、制图方式的任意性，以及对于文学复杂系统进行制图所造成的简化主义弊端。

这样的“祛魅”不仅不是反科学的卢德主义（Ludditism），反而是真正科学的理性态度。培根（Francis Bacon）曾在《新工具》（Novum Organum, 1620）中对科学的方法论提出了一个变革性描述：科学应该从演绎走向归纳。这并不是说用归纳法取代演绎法，而是实现两者的有机结合，即“从感官和特殊的东西引出一些原理，经由逐步而无间断地上升，直至最后才达到最普遍的原理。”^[44] 不难看出，培根心仪的归纳法反对由特殊材料一劳永逸地飞抵“最普遍的原理”，而是以“三步走”的方式循环渐进：首先要求观察者获得尽量多的经验数据，然后对数据“观其大较”并做客观地整列、类编与分析，在此基础上“捕获原理，然后再由业经确立的原理进至新的实验”^[45]，并如此往复。有当代学者认为，培根的描述不仅构成了西方现代科学实验的方法基石，而且已经颇具远见地将“科学发现从本质上视为一个算法的过程”^[46]。在这种图景下，新的观察结果不断充实数据库，而称为“科学”的一般性假设随时等待被证伪，并被新的一般性假设来取代。

在科学哲学中，波普尔对科学“可证伪性”的讨论，以及库恩提出的“范式转换”概念，已让人们明白科学并不意味着亘古不变的真理，科学方法、科学知识都具有暂时性与相对性。既然如此，我们恐怕更没有理由将人文计算不加甄别地视为文学研究中的“进步”。至少在库恩那里，“范式转换”的后果往往喜忧参半，甚至还有倒退的可能。^[47] 我们不必认为人文计算是所有文学研究中必须引入的批评工具^[48]，或将人工智能、机器学习视为玄奥之物。事实上，人文计算随时可能犯错，它有着自身的边界。但强于人脑之处在于，它具备持久的高速计算能力，可以在不断重复中自我学习和优化。批评家期待它们会“撞大运”般在文本挖掘中找到有趣的“原理”，从而帮助我们抵达文学阐释的某个奇点；但同时我们也更应该做好心理准备，那就是它会在不断运算中一无所获。

我之所以不特别强调人文计算和算法对文学研究的必然意义，是因为正如伽达默尔所言，“阐释在本质上并不是一个方法的问题”^[49]。阐释，不是一种可以像其它经验客体那样拿来进行科学调查并达到理解目的的方法。尽管它有别于科学的方法论，但阐释仍然关乎知识和真理，只是这种知识和真理有别于科学家追求的对象。阐释关乎的是直觉和信仰，这两种东西是我们和人工智能最大的区别所在。同时，基于大数据的机器学习目前主要是寻找相关性，并在此基础上作出预测。然而，除非只是单纯对文学文本进行风格测量，否则对真正的文学研究而言，我们需要实现的是阐释，而非预测。事实上，文学批评家之所以需要自动算法，并不是指望它用多高的准确率区分一首诗到底是不是俳句，或一部戏是悲剧还是喜剧；算法批评的意义恰恰是利用人工智能，促使批评家发现之前使用别的方法未曾觉察的问题，帮助批评家阐释文本并解析出新的意义。或许，唯有这样的数字化文学研究，才会真正吸引我们扬帆驶向数字人文的“比特海”。

（原载于《文化研究》2018年第2期）

————————————————————————————————————————————————————————————––

Digital Humanities-Oriented Literary Criticism: The Past, Present and Future

DAN, Hansong

Abstract: After the so-called Digital Humanities (DH) burstsonto the scene of the Western humanities, it remains a burning question as to how to integrate DH into literary studies. This essay reviews the ebb and flow of NLP and corpus-based literary stylistics that features discourse/narrative analysis over the last five decades, arguing that digital literary studies shall neither blindly follow nor disinherit itself from such an interdisciplinary tradition. In the age of Big Data, digital literary criticism can fully take advantage of machine learning boosted by AI, and with the Baconian methods, embark on an internal and external inquiry into massive texts. Such a literary critical approach is not to break away from “Distant Reading”, but to entrust “automated” learning algorithm with the task of interpretation, making machine reading a stimulating rival of traditional reading. This essay calls for a new type of literary criticism which is not only characterized with special digital thinking but based on traditional literary ideas and episteme. Of course, regarding such a futuristic mode of literary studies my discussion is not meant to settle, but to evoke more debates.

Keywords: Digital Humanities, Literary Criticism, Algorithm, Stylistics

—————————————————————————————————————————————————————————————

注释：

[1] 库切：《青春》，王家湘译，浙江文艺出版社2004年版，第178-179页。

[2] 数字人文更广为人知的起点，是1949年布萨（Roberto Busa）神父和IBM合作的“阿奎那项目”，内容是使用穿孔卡和磁带存储的计算机对阿奎那的神学著作进行词语索引、作者身份界定等文本计算工作。

[3] 吴军：《数学之美》，人民邮电出版社2014年版，第22页。关于自然语言处理发展历史的详细介绍，可参考第2章“自然语言处理——从规则到统计”，第15-26页。

[4] 吴军：《数学之美》，人民邮电出版社2014年版，第27-39页。

[5] Paul Simpson, Stylistics: A Resource Book for Students, London: Routledge, 2004, p. 2.

[6] 英国的情况不太一样，文体学受到的冲击较小。申丹认为，主要是因为英国比美国保守，而且叙事学在英国始终未成气候，减少了对文体学的另一种冲击。——参见申丹：《关于西方文体学新发展的思考》，《外国语》2005年第3期。

[7] Nina Nørgaard, Rocío Montoro and Beatrix Busse, Key Terms in Stylistics, London: Continuum, 2010, p. 184.

[8] M.A.K. Halliday, “Linguistic Function and Literary Style: An Enquiry into the Language of William Golding’s ‘The Inheritors’”, in Seymor Chatman, ed. Literary Style: A Symposium, New York: Oxford University Press, 1971.

[9] John Sinclair, Trust the Text: Language, Corpus and Discourse, London: Routledge, 2004, p. 51.

[10] 卢卫中，夏云：《语料库文体学：文学文体学研究的新途径》，《外国语》2010年第1期。

[11] 同上。

[12] John Sinclair, Corpus, Concordance, Collocation, Oxford: Oxford UP, 1991, p. xvii.

[13] 辛克莱尔被称为“语义韵之父”，他发现“许多词倾向于出现在某一特定的语义环境下”，并将语义韵定义为“这是一种联接意义和目的的功能性选择，选择的所有词项都构成某种韵律”。参见John Sinclair, Corpus, Concordance, Collocation, Oxford: Oxford UP, 1991.

[14] 申丹：《关于西方文体学新发展的思考》，《外国语》2005年第3期。值得注意的是，申丹反对图兰将文体和话语混为一谈的做法。

[15] 参见Michael Toolan, Narrative Progression in the Short Story: A Corpus Stylistic Approach, Amsterdam and Philadelphia: John Benjamins, 2009.

[16] Matthew Kirschenbaum认为“数字人文”这个词已经成为了一个“自由漂浮的能指”。关于“数字人文”概念的定义、演变、争鸣等，参见Matthew Kirschenbaum, “What is Digital Humanities and What’s It Doing in English Departments?”, in Matthew K. Gold, ed., Debates in the Digital Humanities, Minneapolis and London: University of Minnesota Press, 2012. pp. 3-10.

[17] John Unsworth, “What Is Humanities Computing and What Is Not?”, Illinois Informatics Institute, University of Illinois, November 8, 2002, https://www.ideals.illinois.edu/bitstream/handle/2142/157/whatis.html.

[18] Ibid.

[19] Ibid.

[20] N. Katherine Hayles, “Cognition Everywhere: The Rise of the Cognitive Nonconscious and the Costs of Consciousness” , New Literary History, Vol.45, No.2, Spring 2014, p.199.

[21] N. Katherine Hayles, “Cognition Everywhere: The Rise of the Cognitive Nonconscious and the Costs of Consciousness” , New Literary History, Vol.45, No.2, Spring 2014,p. 204.

[22] 霍伊特·朗、苏真：《文学模式识别：文本细读与机器学习之间的现代主义》，林懿译，《山东社会科学》2016年第11期；另参见Hoyt Long and Richard Jean So, “Literary Pattern Recognition: Modernism between Close Reading and Machine Learning”, Critical Inquiry, 42.2 (Winter 2016), pp. 235-267.

[23] Franco Moretti, “Network Theory, Plot Analysis”, New Left Review, 68 (Mar. Apr. 2010), pp. 87-88.

[24] Franco Moretti, “Network Theory, Plot Analysis”, New Left Review, 68 (Mar. Apr. 2010), p.84.

[25] 莫莱蒂将这种建模方式推及小说阅读，在《红楼梦》中发现了一个与霍拉旭具有同样关系功能的配角—“周瑞家的（媳妇）”。——See Franco Moretti, “Network Theory, Plot Analysis”, New Left Review, 68 (Mar. Apr. 2010), p.99.

[26] Franco Moretti, “Network Theory, Plot Analysis”, New Left Review, 68 (Mar. Apr. 2010), p.94.

[27] See M. H. Abrams, The Mirror and the Lamp: Romantic Theory and the Critical Tradition, New York: Oxford UP, 1973, p.6.

[28] Barbara Herrnstein Smith, “Value”, in Michael Kelly ed., The Encyclopedia of Aesthetics, 2nd ed., Oxford: Oxford University Press, 2014.

[29] John Sinclair, Trust the Text: Language, Corpus and Discourse, London and New York: Routledge, 2004, pp. 190-191.

[30] Nina Nørgaard, Rocío Montoro and Beatrix Busse, Key Terms in Stylistics, p.204.

[31] 这个意义上，女性主义文体学等批判文体学更加看重的是话语背后的意识形态操纵，这是更加远离数字人文中机器阅读所擅长的“浅层阅读”（surface reading）和“远读”（distant reading）。

[32] Michael Toolan, Narrative Progression in the Short Story: A Corpus Stylistic Approach, pp.25-28.

[33] Stephen Ramsay, Reading Machines: Toward an Algorithmic Criticism, Urbana, Chicago and Springfield: University of Illinois Press, p.2.

[34] Stephen Ramsay, Reading Machines: Toward an Algorithmic Criticism, Urbana, Chicago and Springfield: University of Illinois Press, p.2.

[35] Stephen Ramsay, Reading Machines: Toward an Algorithmic Criticism, Urbana, Chicago and Springfield: University of Illinois Press, p.x.

[36] 机器学习（machine learning）是当下人工智能领域的一个热门分支，而深度学习（deep learning）是借助神经网络（neural network）的一种机器学习方式。

[37] 一个例外，可能是“谷歌图书”中的Ngram Viewer，它能向用户免费提供1500年到2008年图书语料库中的任意关键词的词频变化曲线的检索服务。

[38] Wolfgang Kaltenbrunner, “Scholarly Labour and Digital Colloboration in Literary Studies”, Social Epistemology, 29.2 (2015), p. 209. Kaltenbrunner的研究个案是欧洲科学基金会资助的数字人文项目“Women Writers in History”，该研究旨在建立文学研究者、统计学家和计算机科学家的合作平台，通过大规模数据库来调查1700年至1900年间欧洲所有边缘女作家的接受史。然而，作者以亲身经历指出，这类合作研究有文理科之间难以协调的学术生产范式的差异，譬如文学研究者和信息技术人员无法就“文类”和如何定义“接受”这样的关键问题达成一致。

[39] 关于“辛普森悖论”的一个经典例子是：某法学院的女生录取比例高于男生，某商学院的女生录取比例也高于男生，看似不存在性别歧视的问题，但实际上将两个学院录取人数合并起来，会发现女生录取率实际上是低于男生录取率。出现这种有悖“常理”的统计结果的原因，是因为每个分组的基数可能存在较大差异，两个向量分别的斜率差异和合并后的情形不一定相同。

[40] 譬如，最近上海交通大学做的“基于面部图像的自动犯罪概率分析”就极具争议，被认为是缺乏科学伦理的一种变相的“颅相学”。Richard Tynan认为，该研究之所以会有这么荒谬的“准确”预测，是因为在“小数据集上，算法、人工智能和机器学习可能会建立起专断荒唐的相关性。这不是机器的错，把复杂系统运用在不合适的地方是很危险的”。http://news.sjtu.edu.cn/info/1005/1230344.htm

[41] 佩德罗·多明戈斯：《终极算法：机器学习和人工智能如何重塑世界》，黄芳萍译，中信出版集团2017年版，第91-92页。

[42] 2015年《科学》杂志刊登的一个调查显示，对2008年顶级心理学期刊发表的100项研究进行重复，仅有36%的实验结果得到了重现，而且83%的重复试验的效应量都小于原研究。——See Open Science Collaboration, “Estimating the Reproducibility of Psychological Science”, Science, 349.625 (Aug 2015), p.943. 另一个极端的例子，是荷兰心理学家Diederik Stapelz在五十多篇论文中编造数据的特大丑闻，详细讨论见英国《卫报》的长篇报道《针对科学造假的高科技战争》（The High-Tech War on Science Fraud），February 1, 2017，https://www.theguardian.com/science/2017/feb/01/high-tech-war-on-science。

[43] Anna Marazuela Kim, “Re-enchantment and Iconoclasm in an Age of Images”, The Hedgehog Review, Fall 2015, p.53.

[44]培根：《新工具》，许宝骙译，商务印书馆1986年版，第12页。

[45]培根：《新工具》，许宝骙译，商务印书馆1986年版，第60页。

[46] Ahmed Alkhateeb, “Science has outgrown the human mind and its limited capacities”, Aeon, 24 April, 2017. https://aeon.co/ideas/science-has-outgrown-the-human-mind-and-its-limited-capacities。

[47] Barbara Herrnstein Smith, “Scientizing the Humanities: Shifts, Collisions, Negotions”, Common Knowledge, 22.3 (September 2016), p. 355.

[48] 数字人文圈子里有一种“不追随我就得死”（follow-us-or-die）的偏激论调，参见Jon Saklofske, Estelle Clements, and Richard Cunningham, “They Have Come, Why Won’t We Build It?: On the Digital Future of the Humanities,” in Brett D. Hirsch et al ed. Digital Humanities Pedagogy: Practices, Principles and Politics, Cambridge, UK: Open Book Publishers, 2012.

[49] Hans-Georg Gadamer, Truth and Method, trans. Joel Weinsheimer and Donald G. Marshall, London: Bloomsbury, 1975. p.xx.