基于多维度信息抽取的中国文学海外读者接受研究——以《三体》日译本为例

作者:鲍卉 高泽宇;转自:公众号 DH数字人文

未来学者

鲍卉 / 西北大学文学院

高泽宇 / 西安交通大学计算机科学与技术学院

———————————————–

摘要:电子图书平台的出现为文学作品的海外读者接受研究提供海量的数据支持。文章基于日本图书平台采集的《三体》日译本读者评论数据,运用信息抽取技术从多个维度进行量化分析:读者评论的基础属性(时间、星级、热度)及高阶属性(情感倾向、关注维度、共现状态)。利用词频统计、情感分析等方法构建评论情感分布和词云图。通过热点词汇共现矩阵,完成词汇维度聚类。同时结合优质评论文本的质化分析,获得《三体》日本之旅的传播启示:中国文学“走出去”应聚焦于作品的民族审美维度、译介策略、目的国文化语境和世界文化定位。

关键词:信息抽取 海外读者接受 中国文学 《三体》 传播启示

———————————————–

引 言

当今全球信息化建设和大数据分析技术日益成熟,逐渐弥漫至人类社会生活的各个层面,机器学习与人工智能为各个学科的深度研究亦提供了新方法。基于跨学科背景衍生出的“数字人文”概念成为文学研究的后起之秀,“作为一个跨学科的研究领域,数字人文研究吸引了来自语言学、文学、历史、地理、计算机、图书情报学等多个学科的专家学者。比起‘学科’,数字人文更接近于一个‘学科共同体’,构成这一共同体的多个学科,为数字人文的研究问题贡献各自的理论、方法与工具,共同决定数字人文研究的发展方向”。[1]如今,我国文学作品的海外接受研究方兴未艾,与传统接受研究依赖于人工计算所提取分析的少量数据相比,数字人文拥有更为庞大的数据支持及多维化的呈现方式,搭建出文本信息的宏观概况。然而人类社会经历数百万年的进化发展,高度发达的人脑系统和思维方式以及复杂多样的人文社会结构和现象并非人工智能抑或大数据技术所能够完全替代的,过于偏重大数据技术只会使人文研究陷入过于抽象和人文关怀缺失的僵局,[2]故文本的质化分析亦不可或缺。数字人文理论中有“远读”与“细读”两种概念,“远读”是获得更多数据支持,从宏观层面分析文本概况,突出重点特征,呈现可视化表述;而“细读”则为深入阅读文本内容,分析文本涵义,理解文本要义。二者并非相互独立排斥,而应相辅相成,通过远读的方式宏观展现文本概况,把握文本整体方向,进而选择重要部分进行文本细读。[3]与此相应,笔者以为数据量化分析即为“远读”,而数据文本的质化分析则是“细读”,故本文以《三体》在日本的接受研究为例,基于海量日本读者评论数据,利用信息抽取技术对读者评论的各维度特征进行分析,以作量化研究,将之呈现为可视化表述,并根据量化研究考察日本读者对于作品的关注维度和阐释层面,以期从《三体》日本之旅的传播中获得关于中国文学海外传播的译介策略和语境、作品审美和世界文化定位等方面的启示。

《三体》由《三体》《三体Ⅱ·黑暗森林》《三体Ⅲ·死神永生》组成,是刘慈欣创作的长篇系列科幻小说。2015年8月,刘慈欣凭借第一部作品——《三体》(The Three-Body Problem)英文版,摘得堪称科幻艺术界的诺贝尔奖——雨果奖的桂冠,成为首次问鼎该奖项的亚洲作家。此后,刘慈欣及其作品的知名度在国内外骤然上升,翻译出版亦络绎不绝。《三体》日译版由著名科幻文学出版社“早川书房”出版,一经发售即告售罄。日本文艺评论家福嶋亮太(Ryota Fukushima)评价《三体》时说道:“中国科幻文学从一百年前开始一直蜿蜒前行,而《三体》则将其作为真正的文艺流派重新启动。”[4]对《三体》在日本的读者接受研究可展示日本不同读者层对作品的关注和阐释,从而给中国文学“走出去”及“走进去”以启发和借鉴。

一、数据采集与处理

在谷歌日文版搜索引擎中,以“三体書評”为检索词进行搜索和查阅相关评论,确定以:“亚马逊”(アマゾン)[5]“阅读计量表”(読書メーター/bookmeter)[6]和“乐天图书”(楽天ブックス)[7]三个图书信息平台中关于“《三体》日译本”的读者评论数据作为研究对象。利用python爬虫技术对三个图书信息平台的所有相关评论数据进行采集,目前“《三体》日译本”有两种形式,分别为标准图书和Kindle电子书。从亚马逊日本网站上采集到290条评论数据,从其他两个网站上采集到1,900条评论数据,共计2,190条数据,约68万个字符。其中每条数据保留四个与评论有关的字段:读者姓名、评论内容、评论时间、评论获赞数量。“《三体》日译本”的发售时间为2019年7月4日,故设定采集时间范围为2019年7月4日至2020年12月1日。

首先对收集的数据进行初步过滤。利用python正则表达式,过滤掉非日语文字评论、重复评论、纯数字评论、纯表情符号评论等,保留较高质量评论数据2,051条。进而基于自然语言处理技术,在此笔者使用python中的spacy库加载日语语料模型,对评论内容文本进行处理,包括文本分词、去停用词、词性标注等。笔者通过观察文本分词的结果,对分词模型中的自定义词典、停用词词典进行多轮的添加和修改,最终得到对于“《三体》日译本”评论的高质量词汇表。例如,“三体”一词在日文语料模型中并不存在,通过添加的自定义词典,可以将“三体”一词识别为一个完整的词语。

基于上述的分词、词性标注以及情感分析结果,对文本词频和情感置信度进行统计排序,使用WordArt工具绘制不同词性的词云图,使用matplotlib库对评论的情感分布和词频分布进行可视化,利用python和VOSviewer对评论中出现的热点词汇进行共现分析,语义关系可视化和聚类。同时通过对评论获赞数量以及评论文本长度进行联合分析排序,挑选出优质评论100条,以此作为后文质化分析和研究的材料。

二、读者评论量化分析

(一)读者星级评价及评论热度

在上述进行数据采集的三个图书平台中,其中两个平台对“读者的星级评价”作出展示。截止至2020年12月1日,“乐天图书”平台共有301位读者参评,平均星级评分为4.12星;“亚马逊”提供的数据更为清晰细致,总计854份评价,位于“中国文学”类评价数第一,均值为4.3星。其中,1—5星的百分比分别为4%、3%、10%、22%、61%,位居“亚马逊”平台的“中国文学”类畅销榜榜首。对此,笔者横向对比了日本文坛知名作家作品,如东野圭吾《嫌疑人X的献身》参评数860份,评分4.3星;村上春树《海边的卡夫卡》参评数454份,评分4星。可见,从星级评价情况来看日本读者对于《三体》的评价整体较高,深受日本读者的喜爱。

图1 读者月度评论量趋势图

在读者评论热度层面,基于所采集数据的评论时间字段将读者评论数据分布进行可视化,如图1所示。《三体》日译本初期发售,备受推崇,连续两个月月度评论量高达200份以上,而这已接近于中国其他现当代作家作品日译本发售以来的评论总量。如在“亚马逊”平台上,余华的《第七天》(2014版)自发售以来评论总量为41份、莫言的《红高粱》(2003版)评论总量为119份、鲁迅的《阿Q正传·狂人日记他十二篇(呐喊)》(1981版)评论总量为254份。进而,笔者又对比了世界经典科幻作品英国著名科幻作家James P. Hogan的《星之继承者》和美国当代最优秀的华裔科幻作家Ted Chiang《呼吸》两部作品的评论量。James P. Hogan的《星之继承者》日译本于1980年由东京创元社发行出版,翌年荣获第12届日本星云奖海外最佳长篇奖,提名1978年轨迹奖,其在“亚马逊”平台的参评数为705份。Ted Chiang的《呼吸》荣获2009年雨果奖,后于2019年由早川书房出版发行,其参评数为181份。由此可见,《三体》日译本的参评读者较多、整体评价较高、接受度较好,仅仅发售两个月,在日本的讨论之热、关注度之高、期待之至可谓前所未有。至笔者2020年12月采集数据止,其月度平均评论量约为100份。2020年7月,又出现了一次评论热潮,这是由于《三体Ⅱ·黑暗森林》在日本发售,再次引发读者对于第一部《三体》的关注度和评论热度。第三部发售之际,应当会再次引发目标受众的注目,译作评论量仍有较大增长可能。

文学生命的不竭动力是读者的接受,“在这个作者、作品和大众的三角形之中,大众并不是被动的部分,并不仅仅作为一种反应,相反,它自身就是历史的一个能动的构成,一部文学作品的历史生命如果没有接受者的积极参与是不可思议的。因为只有通过读者的传递过程,作品才进入一种连续性变化的经验视野”。[8]读者以其自身阅历、知识储备、生命想象填补了作品的“空白”。《三体》在日本的读者评级及讨论热度展现了其跨越国界的艺术生命力,同时也丰富了《三体》异域阐释的他者想象。

(二)读者情感分析

情感分析是计算机科学在自然语言处理中的一个典型应用,同时也是数字人文研究的重要方法,对文学作品、经典影视剧的分析有关键性的作用。[9]情感分析旨在对不同类型(商品评论[10]、微博内容[11]、文学作品[12]等),不同粒度(文档[13]、句子[14]等)的文本数据进行自动化的情感倾向判断。其作用于《三体》作品的读者评论,可反映整体的读者群对于《三体》的情感态度倾向。本文拟基于单一主体、主观信息文本的设定,将评论文本视为仅有单一情感态度倾向的句子集合进行自动化判断。正面情感代表该读者对《三体》作品的认可度高,负面情感表示该读者对《三体》作品的某一方面或者多方面不满意。深度学习拥有强大的特征提取及归纳总结能力,近年来被广泛应用于情感分析中。[15]但相对于训练一个深度学习模型所需的数据量来说,本研究涉及的规模及范围有限,不足以构建一个鲁棒的情感分类模型。

经调研,笔者发现“百度AI大脑”和“Google Cloud”目前已开源了其自有的情感分析模型,这些模型在大规模PB级的评论数据(如:商品、电影、博客等)上进行训练,而书籍作为商品的一个子类较为适用于商品的评价体系,故这些情感分析模型对本文的数据具有普适性。“百度AI大脑”的情感分析模型目前主要针对中文文本,与本文不符,故笔者直接调用了“Google Cloud”中日语情感分析模型的处理接口,对每一条所收集的评论文本进行情感分析,该情感分析模型为两分类的深度学习模型,故其输出为每一条评论文本属于正面和负面情感的隶属度(P正和P负),它们的大小介于0到1之间,且每条评论文本正面和负面情感的隶属度之和为1(P正+P负=1)。故只对评论文本的正面情感隶属度(P正)进行了直观性的可视化表述,P正越接近1代表评论文本的情感极性越偏向正面,反之P正越接近0,也就是P负越接近1(P负=1-P正),则代表评论文本的情感极性偏向负面,而若P正和P负大小相近,则代表评论文本属于正面或者负面情感的极性不清晰,笔者定义其为中性情感。

《三体》评论情感的隶属度分布如图2所示,X轴为评论正面情感隶属度,Y轴为评论数量。笔者以隶属度小于等于0.2和大于0.8为分界线,0.8以上作为正面情感(图2中绿色部分)、0.2及以下作为负面情感(图2中红色部分)、0.2—0.8之间作为中性情感(图2中蓝色部分)。其中正面情感评论为1,535份、中性为273份、负面为243份,分别占总体的74.9%、13.3%和11.8%。可见,日本读者对于《三体》的评价虽有相异,但整体趋向正面评价。进而笔者对评论文本长度进行统计分析,得到三种情感类别(正面、负面和中性)的平均评论文本长度分别为168、162和164个字符,发现不论是哪类情感的评价都并非仅为简单粗略的点评,而仍有诸多评论为细致详尽的阐述。

图2 评论情感隶属度分布图

基于上述情感分析结果,为了进一步分析正面和负面情感倾向的内容维度及主要关注点。笔者首先对全部评论中的词语进行了词频分析,去除部分低频词语(出现次数小于5)后,将剩余的关键词按出现次数进行排序并编号,针对出现次数和排序序号之间的关系进行了统计分析,如图3所示,发现本文研究的评论数据词频在指数分布上基本符合“齐夫—曼德尔布罗法”[16],证明所研究的《三体》读者评论数据具有社会科学规律性,保证了后续基于词频分析研究的有效性和普适性。

图3 评论关键词词频分布规律图

进而笔者对正面评论和负面评论文本分别可视化为对应词云图,对其中出现频率较高的“关键词”进行突出显示,字号的大小反应该词语在评论中出现的频次。正面和负面情感评论中所出现的高频词汇,除了读者阅读作品后的正、负面情感表达性词汇,还有反映不同情感倾向的读者对作品内容关注维度的词汇,通过词云图可形象、具体地表现出读者阅读作品后的正、负面情感状况及其可能的产生原因。如图4所示,(a)为正面情感评论词云图、(b)为负面情感评论词云图。

图4(a)中,关键词有“ゲーム”(游戏)、“文革”(文革)、“人類”(人类)、“宇宙”(宇宙)、“面白い”(有趣)、“壮大”(宏大的)、“翻訳”(翻译)、“受賞”(获奖)、“続編”(续集)、“期待”(期待)等。这些关键词直接反映出日本读者关注的主题以及《三体》读者评价正面情感产生的原因。关于日本读者关注的主题,笔者将在后文详尽叙述,此处仅做简要分析。图4(a)所能反映的主题有《三体》的具体内容,如“ゲーム”(游戏)是作者以“三体游戏”为媒介置入作品中,通过设定为地球三体组织联合开发的一款游戏这一模式,来吸引地球上不同玩家加入三体文明,进而来联结地球文明与宇宙中遥远的三体文明。日本读者关注这一关键词,说明这一艺术手法吸引了日本读者,且得到大部分读者的赞同和肯定。如有评论:“三体游戏部分最棒”(博愛,Kindle读者,2020-9-10)。而“文革”作为中国政治历史的一环融入作品内容之中,引发日本读者对于中国现实及意识形态的好奇。而“人類”“宇宙”“面白い”“壮大”则突出表现了作品的宏观叙事手法及艺术魅力,从侧面体现日本读者正面情感的产生原因。“受賞”“翻訳”“続編”“期待”表明日本读者阅读《三体》的动机及阅读后的体验,其对于第一部呈主动、积极的阅读欲望,阅读后则意犹未尽、期待续集的发行。

(a)正面情感评论 
(b)负面情感评论

图4 高频词云图

   

而在图4(b)中,关于《三体》的关键词出现了“いやがらせ”(讨厌)、“普通”(一般)、“我慢”(忍受)、“退屈”(无聊)、“難解”(难懂)等负面性情感表达。诸类负面性的词语反映出部分日本读者对于作品内容、翻译等不甚满意的情况。读者基于自身知识储备和人生阅历,先在理解和先在知识使其在心理上形成既定的思维指向与观念结构,而这种既定的心理图式则使日本读者对于《三体》产生不同的期待视野。显然,日本读者反馈的较多不满在于《三体》内容上的乏味冗长及翻译中的晦涩难懂。如有读者对于内容评论到:“好久没读这么累的书了。太难理解了,读起来很痛苦。特别是最后的30页,完全无法理解。”(育音,阅读计量表读者,2019-11-25)“我读它的时候非常期待,因为它是“雨果奖”获奖作品,但是当我读到一半的时候,感觉很痛苦,我想把它扔掉。”(たろさ,亚马逊读者,2020-5-19)还有对于翻译不甚满意的评论,如:“只是人名不好记,大家是用哪个(日语读还是中文读)记住的?”(shiba,阅读计量表读者,2020-8-12)“名字是汉字的,虽然有中文音读,但对日本人来说,一开始阅读起来是有点困难。但之后也习惯了。”(乐天图书读者,2020-8-21)

同时,可发现,在图4(a)和图4(b)中均出现“地球”“物理”“现实”“宇宙”“文革”等热点词汇,诸类热点词汇所反映的是在正、负情感分布中日本读者对于《三体》的关注重点和维度,读者在诸类主题中产生不同的审美评价。在“一部文学作品在其出现的历史时刻,对它的第一读者的期待视野是满足、超越、失望或反驳,这种方法明显地提供了一个决定其审美价值变化的尺度”。[17]《三体》的正、负面情感评价体现了日本读者的阅读动机和接受效果,一方面基于媒体宣传的影响、欧美社会的追捧,另一方面鉴于《三体》摘得科幻界权威奖项“雨果奖”的桂冠及故事设定的“文革”背景引发的意识形态好奇,点燃了日本众多读者的阅读欲望,但无论是正面评价抑或负面评价,均成为《三体》审美价值的重要组成部分。

(三)热点词汇聚类及共现分析

热点词汇聚类和共现分析是大数据文本分析中的两种常用量化研究方法。聚类分析根据各热点词汇相互之间的关联关系,将全部热点词汇聚合成多个词汇簇,可反映读者对于《三体》的主要关注维度。共现分析基于各热点词汇共同出现的频次,发现潜在关联性,同时将其可视化为语义关联图,进而更深层次地挖掘由热点词汇所构成的词组或词群的含义。笔者基于对评论文本的分词结果,统计了各热点词汇的共现频次,生成热点词汇共现矩阵,进而使用VOSviewer完成了对共现矩阵的语义关联可视化和聚类分析。VOSviewer是一个以“共现聚类”为核心思想设计的软件,旨在基于词汇之间相关关系的强度和方向对词汇完成“团体”聚类,生成不同类别的词汇簇,同时将词汇之间的关联关系呈现为可视化表述。所得到的语义关联图如图5所示,图中每一个网络节点代表一个热点词汇,网络节点之间的连线代表所连接的词汇相互之间的共现关系,线条愈粗则表示关系愈紧密,而不同的颜色则代表不同的词汇“团体”。

图5 热点词汇语义关联图

基于热点词汇聚类结果的考察,即图5中所展示的不同颜色的词汇“团体”,笔者总结出以下六大主题,如表1所示。日本读者的关注维度主要基于三大类——《三体》源文本及其衍生出的生命宇宙观、科学技术理念和产生的译介效果。其中,关于《三体》源文本的主题可继而划分为人物、内容、评价这三方面。从热点词汇聚类可粗略观察到日本读者的阅读倾向,而基于关键词的共现分析,可考察各主题之间具体语词的潜在关系。

表1 热点词汇类别

续表1

图6 “訳”语义关联图

如在“译介效果”的词汇聚类中,以“訳”(翻译)为中心节点,可得到图6的语义关联图。其中与“中国”、“SF”(科幻小说)、“日本”、“英訳”(英译)、“邦訳”(本国翻译)、“楽しい”(开心的)、“続編”(续集)、“早く”(快点)等语词的关联性较高。从这些语词之间高度的相关性可得知,日本大部分读者对于《三体》日译本持肯定态度,同时期待续集的进一步译介。如:“虽然像预想的那样读得很辛苦,但很有意义,非常满足。我觉得是优质的小说。翻译也很棒。”(ひつじとはね,阅读计量表读者,2019-9-15)“没怎么读过SF,但鉴于成为热门话题,以及其评价很高,所以试着读,作为娱乐作品读起来很有趣。不仅仅是作品本身的能量,译者的能量也传达了出来。期待明年翻译的下一部作品。”(gonzui,阅读计量表读者,2019-9-14)同时,还值得关注的是语义图中出现“英訳”“邦訳”等语词,日本读者或已读过《三体》的英译本,或将英译本与日译本作比较来阐释其译介效果。《三体》首先在欧美译介出版,受到欧美各阶层读者群的喜爱,继而风靡全球。而其在日本的译介和出版则晚于欧美,不少日本读者的阅读出于《三体》在欧美摘得“雨果奖”这一契机;还有读者是受美国前总统奥巴马大赞《三体》影响,迫不及待地一睹作品内容,如“第一本科幻小说和第一本中国作家的作品。我被‘奥巴马的赞誉’所吸引,并买下了它”(乐天图书读者,2020-10-12)。日本部分读者为抢先领略《三体》风采而阅读英文版,如有读者评价到:“被以惊人规模展开的故事所压倒。日语版的后续是明年发售,迫不及待地读着英文版。”(ごまだんご,阅读计量表读者,2019-9-23)当然,还有将日译本同英译本作比较的读者,如“虽然英文版是由ケン·リュウ(刘宇昆Ken Liu)翻译的,但是ケン·リュウ的水平要高很多”(tom,阅读计量表读者,2019-12-15)。

图7 “SF”语义关联图

若以“SF”为中心节点,可得到图7的语义关联图。“SF”与“三体”“世界”“科学”“大作”“ハード”(坚硬的)、“面白い”(有趣的)等语词的关联度较高。可见,《三体》作为中国科幻小说的代表作,其所展现的巧妙构思和“硬科幻”知识,成为博得日本读者芳心的不二法门,“老实说,虽然在物理学和数学理论方面我完全不懂,但是我读了那些书也觉得很有趣”(Shimaneko,阅读计量表读者,2019-12-13)。同时,“SF”与“中国”“本格”(正宗的)、“すごい”(厉害)、“好き”(喜欢)、“圧倒”(压倒性的)、“歴史”、“現代”等词关联亦较高,可发现日本读者对以《三体》为代表的中国科幻文学表达方式、叙述风格以及所展现的独具魅力的中国历史文化之肯定。“前总统也称赞过。虽然也有天文物理学等难以理解的科学记述,但在加入SF、VR、地球外生命体等各种要素的同时,完成了富有想象力的作品,这一点是压倒性的。”(えっくん,阅读计量表读者,2019-11-29)另外,亦可发现“SF”与“日本”“期待”等词具有高度关联性,可见日本读者将之与日本科幻文学作对比,肯定中国科幻文学的发展速度,期待中国科幻文学的发展前景。“《三体》作为中国的科幻小说,是一部能够提升中国科幻作家地位的作品。”(しまちゃん,阅读计量表读者,2019-11-30)“我认为本书作为中国科幻小说进一步向世界文学扩展的先驱。”(檜の棒,阅读计量表读者,2019-10-8)

图8 “三体”语义关联图

若以“三体”为中心节点,可得到图8的语义关联图。“三体”除了与上述与“SF”“中国”“世界”“科学”等相关外,还与“VR”“地球”“人类”“文革”“謎”“面白い”“壮大”“ゲーム”等相关。“这部科幻作品包罗万象,如人类存亡的危机、文明的终结、人生的毁灭、中国三国历史等。还涉及到个人、社会、国家、人类层面的幸福。这样看来,拯救全人类危机的不是一个超级英雄,而是一些平凡庸俗的人们。在描绘大局之前,每个人都有着非常生动的动作,令人印象深刻。很遗憾不能马上看续集。”(夜長月新潮部,阅读计量表读者,2019-9-24)“从文革时代到现代中国的时代变迁,虽然不知道该如何展开,但从文洁收到来自三体世界的信息开始,故事一下子展开了。以压倒性的科学技术知识为基础,描绘了独特的世界观,虽然不能说是一部字数多、易读的作品,但却是一部给人留下深刻印象的大作。特别是在遥远文明进步的三体世界里,也有和地球一样文明后的烦恼,也有对急剧增长知识的地球人的恐惧,这一点很有意思。”(石野真,阅读计量表读者,2019-9-22)可见,日本读者对于《三体》作品中文革部分的描写和游戏的设定较为关注,说明其创作手法和艺术审美符合日本读者的期待视野,同时其宏大叙事和哲学命题亦引发了日本读者对于宇宙文明和人类文明的思考。

三、读者评论质化分析

通过前文的“读者星级评价及评论热度分析”“读者情感分析”及“热点词汇聚类及共现分析”等概况性的大数据量化分析,直观地展现了《三体》在日本的接受状况,而更细致、深入地分析则需对评论文本进行质化分析。笔者选择了100条优质评论,并结合日本媒体、新闻、专家人士等不同读者层的点评,深度考察日本读者群的关注维度、情感态度及阐释角度,探讨《三体》日本之旅所赋予的“中国文学作品”海外传播启示。

(一)作品审美观照:艺术魅力与民族基因

《三体》糅合趣味、历史、现实,以其宏大的叙事方式、丰富的想象力和超群的专业知识,开阖流宕地铺展出极富中国文化气息的社会图景,引起日本读者的注目。

日本读者赞叹其精妙的情节设定、迫人心弦的叙述方式和虚幻中夹杂的真实感。“科学、宗教、外星人、思想、理想,所有的情节都完美地结合在一起。”(いわにほ,阅读计量表读者,2019-12-1)“故事从文革肃清的生动描写开始,一下子进入了真正的SF,规模宏大。故事情节也非常优秀,总之是让人在意后续剧情的设计。”(0o0,阅读计量表读者,2019-9-25)毋庸置疑,情节是叙事作品最为重要的一环,“它在一系列精心安排的事件或行动中塑造人物和讲述故事”。[18]作品将科学家杨冬的自杀这一结果置于作品之首,以汪淼、史强调查这一事件为开端,将叶文洁父亲“文革”期间的悲惨经历和伊文斯童年目睹其他物种毁灭的故事嵌套于这一大故事之中,从而论述“三体空间”与“地球空间”之间的对抗。与空间变换并行的则为时间的转换,体现为叶文洁所讲述的1970年代(过去)、汪淼作为主轴的2010年代(现代)以及与地球上所有法则不同的VR游戏“三体”的世界(虚拟现实)。不断变更的叙述视角,因果倒置的逻辑排列,时空交替的虚幻错觉,在作品繁密的情节钩织下,唤起读者兴趣。

作品的艺术魅力是其能够走出去的内质因素,而根据前文量化数据中的语义关联图可知,日本读者亦倾心于其叙述方式所展现的中国现实叙事和民族历史文化。文学终究描绘的是人类所在的世界和时代文明,是对现实客观世界的艺术性提纯。“一方面科技给人类打开了更为阔朗的空间,另一方面文学的想象力也在极力扩大我们的精神空间。”[19]因此,虽虚幻情节携想象以超四海,然有读者评价《三体》“是一本极具说服力的书”(hohe,阅读计量表读者,2019-8-8)。

这种虚幻中夹杂的真实感源于《三体》的“文学现实”。一方面对中国特殊意识形态影响下的特殊时代轮廓进行勾勒,以“文革历史的汇入,使其在时间轴上增加了真实感”(teddy11015544,阅读计量表读者,2019-8-4)。另一方面,以VR技术、物理、数学、天文学等“硬科幻”知识塑造出现代社会的科学面貌。“VR游戏‘三体’的描述似乎是在解释游戏的内部,实际上,这是一种‘欺诈性’的写作方式,它是对存在的外星人世界的一种解释。这样的结构使得读者可以通过使地球人理解三体世界(外星人实际生活的地方)来理解故事的世界观。”[20]穿插于VR游戏中的“周文王”“秦始皇”等历史人物及中国历朝文明的游戏模式设定则彰显了繁荣的华夏文明和悠久的历史文化,使熟稔中国历史和文学的日本读者亦觉亲切。“古今东西的伟人在三体文明的基础上集结的样子让人强烈感受到中华思想。不由得想起封神演义。”(さわでぃ,阅读计量表读者,2020-5-2)“日本人熟悉的纣王、周王在VR游戏中登场也很有趣,其他人物的造型也是如此。”(村上春巻,阅读计量表读者,2020-4-2)

《三体》以细腻专业的科幻想象和“观照现实”的文学笔触绘就了一幅宏伟的中国现代社会发展图景,将富有中国元素和中国独特民族文化的科幻图呈现给异域的知音。

(二)作品的译介策略与文化语境

结合上文“热点词汇聚类和共现分析”的数据内容,可发现,“译介”成为《三体》读者评论中一个至关重要的主题,评论中所出现的“翻訳”“英訳”“邦訳”等热点词汇反映出日本读者对译介效果的关注。其日译本亦分别斩获“日本第51届星云赏最佳海外长篇奖”“第七届‘图书日志’图书奖”,足以佐证《三体》日译本卓越的译介效果。

中国文学作品的外译与传播是其文学赋值和文化输出的重要手段。相较于纯文学在日本市场的门可罗雀之态,《三体》的日译成为了中国文学作品外译的新标杆。翻译是作品打通海外读者市场的重要环节,对源语文本亦是一个再生历程。从比较文学的角度来看,翻译是一种“创造性叛逆”,“它不仅延长了作品的生命,而且赋予它第二次生命”。[21]对外译介主要由“译介主体、译介内容、译介途径、译介受众和译介效果”五部分组成。译介效果的褒贬状况很大程度上取决于译介主体,“译介主体的能动作用是影响译作在目的语国家命运的重要因素,而恰当的翻译策略是保证译作被顺利接受的重要条件”。[22]因此,探讨译者的翻译理念和方式则为将来作品“走出去”提供借鉴和启示。

《三体》首先由光吉樱等人将中文版翻译为日文版,而后由日本著名科幻小说翻译家、书评家大森望按照日文习惯对其做以对应的修改,以适应目标读者群的阅读习惯和审美需求。大森望在论及翻译这一问题时谈到,其最初阅读的是英译本、中文本及由一位非专业人员翻译的日译本,“结果发现,英译对原文极为忠实,于是我答应下来翻译日文本,但一旦着手开始就想处处修改,结果基本八九成是从原本的日译本改稿而来的”。[23]大森望考虑到译本的目标受众是日本读者群,故十分注意语词的修改,将翻译置于具体的文化语境和时空语境之中,从整体上宏观地衡量中日两国的文化差异。

中文版读者普遍反映的“文笔平淡”问题,在日本读者反映中却寥寥无几。如,源文本关于红卫兵的描述:

原文:比起已经在风雨中成熟了许多的第一代红卫兵,新生的造反派们像火炭上的狼群,除了疯狂还是疯狂。[24]

译文:苦難に耐えて鍛えられてきた第一世代の多くの紅衛兵と比べても、四·二八兵団の新たな造反者たちの狂乱ぶりは、燃えさかる火の中で踊り狂う、正気を失った狼の群れのようだった。[25]

译文“四·二八兵団の新たな造反者たちの狂乱ぶりは、燃えさかる火の中で踊り狂う、正気を失った狼の群れのようだった”(四·二八兵团新生的造反派这种疯狂状态,就像在熊熊烈火中疯狂跳舞、失去理智的狼群一样)一句,译者采取了归化的翻译策略,对原文进行意译。通过调整语序和语言结构,将主语“新生的造反派们”更换为“新生的造反派这种疯狂状态”,并以“燃えさかる火の中で踊り狂う、正気を失った狼の群れのようだった”来形容此种疯狂状态,使译文语句更显生动。德国翻译学家汉斯·弗米尔(Hans Vermeer)强调:“翻译的成功取决于译作中所体现的意愿与接收者环境中的意愿的内在一致性,即他所说的‘语内连贯’(intratextual coherence)。”[26]译者通过语词的更改、语序的调整,使虽流畅但起伏较小的原文经过译者的重新布局后更为具体细腻,符合日本读者的阅读和审美习惯。

同时,大森望提出了文学作品社会图景的色调变化这一理念。他将作品图景划分为四种,分别为文革时代的过去图景、迷宫式的现代图景、现代正在进行的VR游戏图景、行星“三体”世界图景。大森望认为“原文中有描写像西洋画一样温暖的过去农村的场景、异星人平淡生活的场景,也有在VR游戏场景中现代科幻的描写,诸多丰富多彩的描绘方法,全部是不同的色调”。[27]大森望将翻译放置到一个宏大的文化语境中来审视,将源文本改造为适合本国文化语境的新文本。

除此之外,大森望认为日语区别于汉语、英语的一大特点在于它同时吸收了汉语和英语词汇,在四种不同图景中所应用的词汇亦有区分,“比如现代部分,为了使读现代娱乐部分的日本读者没有违和感,而使用起源于英语的片假名用语。文中向宇宙外发送信息的部分,则为了传达出科幻小说的氛围而使用了许多专业用语。至于描绘三体文明的部分,为了表现出其宏大实验的天马行空之感,口吻上则采用了易于理解的类型化表现”。[28]文本进入他国的文化、社会、历史体系中,在翻译家的“创造性”和“叛逆性”地改造下获得与本国文化语言习惯相符的新文本,成就其二次生命。而作为源文本的《三体》经历了英译本和日译本的改造,其实质已是两种不同文化的新文本,英译本又开始了在日本的文本旅行,日本读者在本国文化形态和社会背景下,对二者作出审视和阐发,在这种交流、碰撞、对比之中,使《三体》源文本获得新的发现而走得更远。

当然,日译本也存在众多问题,如诸多读者反映翻译的“人名”难记,如“葉文潔(イエ·ウェンジエ)”这种翻译方法是直接用日语模仿中文发音,以达到贴切中文发音的效果。但对于日本读者来说,这种翻译方式使他们难以记住作品中纷繁复杂的人名,不似直接用音读的方法翻译成日文更为方便。

翻译是作品能否走出去的重要环节,“翻译活动是所有参与者之间全球对抗的关键赌注和武器,是世界文学空间内部斗争的特殊形式,是一种多维几何工具”。[29]“我们既要重视原作从源语系统到目标语系统的“译”,更应关注译作在复杂的目标语系统中适应、接受并产生传播影响力等“介”的问题”。[30]因此,作品的翻译策略将直接影响读者的阅读体验,而《三体》这种参考不同语种版本的多人协作翻译和符合目标语文化语境的归化翻译策略,显然获得了众多日本读者的青睐。

(三)作品的世界文化定位:普世性价值

中国文学要从“走出去”变为“走进去”,不仅需要“民族性”,也应具有“世界性”,“民族文学要具有永恒价值,要具备全人类共有的普世情怀和价值”。[31]普世价值以人类为中心,以人类的角度审视世界和思考问题。尽管千百年来科学一直以其客观性证明人类和地球在宇宙中的普遍性,但《三体》中所描绘的诸种冲突,无不是将人类和地球置于宇宙中一个特殊的位置来看待,从侧面体现了作者以人类视角出发而关切人类命途的思考。

《三体》以宏大的叙事结构展现了历史、社会、环境、宇宙、现代科学等多重冲突关系所造成的“人的异化”这一生存困境,“这种世界性的写作题材跨越了文化差异障碍,为《三体》的海外传播提供了一个文化交流的支点”。[32]科学的兴起,使人类认识到自己的无知,为不断填补自身欲望而激发昂扬斗志去发现和探索科学的魅力。“科学革命并不是‘知识的革命’,而是‘无知的革命’。真正让科学革命起步的伟大发现,就是发现‘人类对于最重要的问题其实毫无所知’。”[33]同时,科学与世界经济、政治彼此牵制、支撑、推动,使资本成为窜入其中的有效筹码,其成为推动科技革命、社会进步的齿轮,亦改变了人类的生活方式,同时资本的原始罪恶不可避免地使“科学”间接成为地球资源的掠夺者,迫使人类社会结构发生质性改变。科学与人类文明、环境资源引发的种种矛盾冲突使人类深感迷茫,从而对现实和人类文明产生幻灭感,对以科学为信仰的理念发生质疑,导致最终“异化”,陷入试图寻找新的更高级智慧文明来拯救人类现世的泥沼,并以此来完成自我救赎。而作品中的“三体组织”则是“人的异化”的集中体现。“竟然有这么多的人对人类文明彻底绝望,憎恨和背叛自己的物种,甚至将消灭包括自己和子孙在内的人类作为最高理想,这是地球三体运动令人震惊之处。”[34]科学信仰的崩塌,使叶文洁对人类社会感到绝望,亲手杀死了自己的丈夫;从小目睹资本家为了经济利益而致环境遭受污染,诸多动物濒临灭绝的伊文斯,成为“地球三体叛军”的一员;他们憎恶现代文明引发的地球环境污染和物种灭绝问题,绝望于人类本性的“恶”,二者欲将外星文明引入地球,冠以拯救人类的名号来抚慰幼年内心遭受的伤痛,完成自我的救赎。

“人的异化”将人类推向宇宙的深渊,衍生出关切人类价值存在及命运抉择的重大问题。现代科学促进了物质文明的巨大飞跃,人类依赖和享受于自己所创造的人工智能带来的一切卓越生活,却也恐慌“科学”或将成为悬在人类头顶之上的达摩克利斯之剑。站在“人类命运”的十字路口,人类开始反思自身,未来何往,价值何在,人类何存?“即使科学能够与海豚沟通,我们人类拒绝与他人相互理解的悲剧性精神也找不到处方。”(茶幸才斎,阅读计量表读者,2019-12-17)“虐待、镇压、自然破坏,不断重复的人类的愚蠢也触动了我,我觉得这是一部警示人类是否有生存价值的作品。”(えっくん,阅读计量表读者,2019-11-29)“幼年期结束后,人类究竟将走向何方?”(とくとく,阅读计量表读者,2020-4-27)“今后人类和地球会变成什么样呢?”(mii22.,阅读计量表读者,2020-4-11)马尔库塞认为技术逻辑正作为一种极权的意识形态对人进行奴役,人逐渐沦为技术的附庸,抑制了内心的否定和对社会的批判。科技一方面承载着人类的欲望和需求,另一方面也逐渐割裂人与人、人与社会和自然之间的维度,“‘技术的逻辑’有时可能背离人们的初衷,偏离预设的轨道,挣脱人们的控制,导致公开的或隐蔽的反主体性效应”。[35]《三体》以冷血无情、深邃冷峻的笔触描写人类与宇宙之间的对抗和人类置身于这种对抗中的无力感和悲剧感,看似是站在一个去道德化、去人类中心主义的高度来叙述人类即将面临的毁灭,但其实却笔含温情,其中所呈现的“科技”与“人类”的相生、对“人”的关切和人类文明命途的担忧则是关乎全人类的普世性议题。

结 论

本文基于《三体》日译本读者评论数据,通过对日本读者接受状况的定量分析,发现日本读者的关注维度主要在于文本内容、艺术手法、译介效果及文本衍生出的人类命途思考。诚然,本文的实验方法仅为初始尝试,如若通过更大规模的问卷调查,获取更多的数据,或能更好地完成本实验,从而提供新的思路。

从本文的论证来看,《三体》所表现的中国历史叙事、独特的创作手法及宏大的人类命运观,博得众多日本读者的青睐,使日本读者肯定和期待中国科幻文学的未来发展前景。在译介效果方面,尽管《三体》日译本由于译者的语言、历史文化等差异,不能完全还原原作的内容及思想,以致部分读者对于翻译质量和作品部分内容产生诟病。然瑕不掩瑜,《三体》日译本在日本的评论热度整体较高、读者总体接受度较好,且读者评论的正面情感比例明显大于负面情感比例。以量化分析结论为基础,结合评论文本质化分析,从而得出《三体》日本之旅为中国文学作品“走出去”所展现的新范式:多人协作翻译,译者参考不同语种的版本,针对目的国文化语境采用相应翻译策略,满足目的国读者审美习惯;推出实体书和电子书,实现线上与线下的双重叠加。同时,针对中国文学如何“走进去”也提供了启示:即应书写和选择扎根于华夏文化土壤并立足于作品审美特征和民族特性、观照世界文化议题的文学作品,赋予作品“经以民族,纬以世界”的文学审美和人文关怀。另外,本文所采用的方法为文学作品的接受研究提供了新的思路:即以量化分析为基础,从海量的评论数据中挖掘潜在的规律和内涵,反映大数据视野下读者的关注维度和接受情况,进而支持上层的质化分析,并根据质化分析结果获得细致深入的文本阐释,二者相辅相成,相得益彰。

————————————————————————————————————

The Overseas Reader Acceptance Research of Chinese Literature Base on Multidimensional Information Extraction: Take The Three-Body Problem with Japanese Translation as an Example

Bao Hui, Gao Zeyu

Abstract: The popularity of e-book platforms provides massive data for the acceptance research of literature, especially for overseas reader acceptance research. Based on readers’ comment data of the Japanese translation of The Three-Body Problem collected from several e-book platforms of Japan, this paper uses information extraction technology to conduct detailed quantitative analysis from multiple dimensions, that is the base-level (i.e., time, stars, and popularity) and high-level (i.e., sentiment tendency, analysis dimension, and co-occurrence state) attributes of readers’ comments. Firstly, we use word frequency statistics, part-of-speech tagging, sentiment analysis, and other methods to generate the comment sentiment distribution maps and the positive and negative sentiment word clouds. Next, we construct the co-occurrence matrix of hot vocabularies for the vocabulary clustering. Finally, integrating with the qualitative analysis of high-quality readers’ comments, the following spread enlightenment can be gained: Chinese literature going out should focus on the translation strategy and cultural context, also the national aesthetic view and the world cultural orientation.

Keywords: Information Extraction; Overseas Reader Acceptance; Chinese Literature; The Three-Body Problem; Spread Enlightenment

————————————————————————————————————

*本文为马克思主义理论研究和建设工程重大项目“延安文艺与中国文艺话语体系建设”(MWGT000)阶段性成果。

编 辑  |  赵薇

注释:

[1]王军、张力元:《国际数字人文进展研究》,《数字人文》2020年第1期。

[2]刘石:《大数据技术与古代文学经典文本分析研究》,《数字人文》2020年第1期。

[3]王军、张力元:《国际数字人文进展研究》,《数字人文》2020年第1期。

[4]Ryota Fukushima,《新冷戦時代の百科全書的SF》,《群像》(onlin),2019年11月,https://tree-novel.com/works/episode/e33edde05ca066c7ddd341a7d2cedfad.html。原文为:“中国SFは百年前から蛇行を続けてきたが、『三体』はそれを本格的な文芸ジャンルとして再起動した。”(本文如无特殊说明,所有译文均为笔者自译)

[5]Amazon JP, Customer review [DB/OL], https://www.amazon.co.jp/dp/product/4152098708.

[6]Bookmeter, Customer review [DB/OL], https://bookmeter.com/books/13921330.

[7]Rakutenbook, Customer review [DB/OL], https://books.rakuten.co.jp/rb/15929765.

[8](德)H· R·姚斯、(美)R·C·霍拉勃:《接受美学与接受理论》,周宁、金元浦译,沈阳:辽宁人民出版社,1987年,第24页。

[9]胡启月、刘彬、高剑波:《哈利波特系列电影的客观评价:基于台词情感自相似分形分析》,《数字人文》2021年第1期;Q. Y. Hu et al., “Fractal Scaling Laws for the Dynamic Evolution of Sentiments in Never Let Me Go and Their Implications for Writing, Adaptation and Reading of Novels,”World Wide Web Journal, vol. 24, 2021, pp. 1147-1164.

[10]X. Fang, J. Zhan, “Sentiment Analysis Using Product Review Data,”Journal of Big Data, vol. 2, no. 1, 2015, pp. 1-14.

[11]H. Saif, Y. He, H. Alani, “Semantic Sentiment Analysis of Twitter,” International Semantic Web Conference, Springer, Heidelberg, 2012, pp. 508-524.

[12]Q. Y. Hu et al., “Dynamic Evolution of Sentiments in Never Let Me Go: Insights from Multifractal Theory and Its Implications for Literary Analysis,”Digital Scholarship in the Humanities, 2020, https://hal.archivesouvertes.fr/hal-02143896/document.

[13]R. Moraes, J. F. Valiati, W. P. G. Neto, “Document-level Sentiment Classification: An Empirical Comparison Between SVM and ANN,”Expert Systems with Applications, vol. 40, no. 2, 2013, pp. 621-633.

[14]T. Chen et al., “Improving Sentiment Analysis via Sentence Type Classification Using BiLSTM-CRF and CNN,” Expert Systems with Applications, vol. 72, 2017, pp. 221-230.

[15]L. Zhang, S. Wang , B. Liu, “Deep Learning for Sentiment Analysis: A survey,”Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, vol. 8, no. 4, 2018, p. 1253.

[16]B. Liu, J. Gao, “Understanding the Non-Gaussian Distribution of Revealed Comparative Advantage Index and Its Alternatives,”International Economics, vol. 158, 2019, pp. 1-11; J. Gao, J. Hu, “Financial Crisis, Omori’s Law, and Negative Entropy Flow,” International Review of Financial Analysis, vol. 33, 2014, pp. 79-86.

[17](德)H· R·姚斯、(美)R·C·霍拉勃:《接受美学与接受理论》,第31页。

[18]周宪:《文学理论导引》,北京:高等教育出版社,2014年,第157页。

[19]此语引自申霞艳在2019年5月31日参加由广东省作家协会主办、《作品》杂志社承办的“AI时代与文学创作”论坛上发表的观点

http://www.gdzuoxie.com/v/201912/11593.html)。

[20]此语引自对译者大森望的一篇采访:《「三体」翻訳者·大森望さんインタビュー「若かったころのSFの、野蛮な魅力に溢れている」》,原文为:“VR ゲーム「三体」の描写も、ゲームの中のことを説明しているようで、実は存在する宇宙人の世界の説明であるという‘詐欺的’な書き方なんですよね。(宇宙人が実際に住む)三体世界を地球人に理解させるという体裁で、読者にも(物語の世界観を)分からせる構造になっているのがうまい。”(https://book.asahi.com/article/13522904

[21](法)罗贝尔·埃斯卡皮:《文学社会学》,王美华、于沛译,合肥:安徽文艺出版社,1987年,第137—138页。

[22]吴赟、何敏:《〈三体〉在美国的译介之旅:语境、主体与策略》,《外国语:上海外国语大学学报》2019年第1期。

[23]参见《翻訳者は語る 大森 望さん》,STORY BOX,2019年10月。原文为:“その結果、英訳が原文にきわめて忠実だということがわかったので、これならなんとかなるだろうと引き受けましたが、いざ手を入れはじめるとあちこち直したくなってしまい、結局全体の八、九割は元の文章から改稿しました。” (https://shosetsu-maru.com/interviews/translator/21

[24]刘慈欣:《三体》,重庆:重庆出版社,2016年,第58页。

[25]刘慈欣:《三体》,大森望、光吉樱译,东京:早川书房,2019年,第9页。

[26]谢天振:《译介学导论》(第二版),北京:北京大学出版社,2018年,第45页。

[27]参见皆川裕子整理:《翻訳者は語る 大森 望さん》,STORY BOX,2019年10月。原文为:“原文でも、昔の農村を描くシーンでは西洋絵画のようなぬくもりがあったり、異星人の場面ではベタな描写だったり、VRゲームのシーンでは現代SF的な描写だったりと多彩な描き方なので、全てが同じトーンにならないように気をつけました。”

https://shosetsu-maru.com/interviews/translator/21

[28]参见皆川裕子整理:《翻訳者は語る 大森 望さん》,STORY BOX,2019年10月。原文为:“例えば現代パートでは、英語起源のカタカナ用語を使って、今のエンタメを読んでいる日本の読者に違和感がないように。メッセージの送受信の場面では、SFの空気感が伝わるように天体物理の専門用語を多用したり。三体世界側の場面では壮大な実験のバカバカしさを出すよう、口調なども敢えてわかりやすく類型的な表現を使ったりしました。”(https://shosetsu-maru.com/interviews/translator/21

[29](法)帕斯卡尔·卡萨诺瓦:《文学世界共和国》,罗国祥、陈新丽、赵妮译,北京:北京大学出版社,2015年,第153页。

[30]韩红建、蒋跃、袁小陆:《复杂系统视阈下的中国文学海外译介——以陕西当代文学的译介为例》,《上海翻译》2019年第6期。

[31]摆贵勤、孙宜学:《中国当代文学在“一带一路”何为?为何?——评〈“一带一路”与中国当代文学走出去〉》,《中国比较文学》2020年第4期。

[32]刘舸、李云:《从西方解读偏好看中国科幻作品的海外传播——以刘慈欣〈三体〉在美国的接受为例》,《中国比较文学》2018年第2期。

[33](以色列)尤瓦尔·赫拉利:《人类简史:从动物到上帝》,林俊宏译,北京:中信出版社,2017年,第237页。

[34]刘慈欣:《三体》,第239页。

[35]孙伟平:《人工智能与人的“新异化”》,《中国社会科学》2020年第12期。

原刊《数字人文》2021年第3期,转载请联系授权。

en_GBEnglish