首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

中国网文扬帆出海,人工智能并非东风? | 海斌访谈

第一财经 2023-12-09 14:46:34 听新闻

作者:彭海斌    责编:刘佳

人工智能的发展势不可挡,但它在网络文学领域发挥魔力,还需要技术的进一步突破,还需要更多的时间。

“我们面临的第一个挑战,是术语翻译的准确性。”阅文集团副总裁杨晨在谈到AI翻译的时候表示。

中国网络文学出海,已经成为浪潮。修仙、武侠等类别的小说占据举足轻重的地位,但门派、功法、修炼等中国网文中特有的术语,单纯依靠AI翻译还无法准确表达其内涵。

人工智能的发展势不可挡,但它在网络文学领域发挥魔力,还需要技术的进一步突破,还需要更多的时间。

“不可能三角”

收到海外出版稿费的时候,网络小说作家公子衍有点意外。

公子衍是起点中文网的白金作家。她的网文作品被翻译为英文在美国等市场传播。海外稿费是一笔不小的收入,她近期接受第一财经记者采访时候说,除了美国外,泰国也有她的读者。

中国的网络文学扬帆出海,已经成为一股潮流。根据中国音像与数据出版协会对头部40余家企业的测算,2022年全行业海外营收规模已经超过40亿元,增长了39.87%。网络文学作品的翻译语种已经有了20多种,涉及东南亚、北美、欧洲和非洲的40多个国家和地区。

这背后是中国网络文学生态的不断成长:这一行业去年的规模增长速度远超过中国GDP增速。中国网络文学行业2022年的总营收规模达到317亿元,相较于2021年增长18.94%。同期,中国网络文学作品累计总量达到3400万部,相比2021年增长7.93%。

网络文学世界里,中国读者和海外读者有许多共通之处,比如很多女性读者喜欢甜蜜的爱情文本、霸道总裁小说。

“我就觉得甜甜的恋爱特别地让人愉快。虽然我个人经历的爱情比较单一,因为我已经走入婚姻了,但是这并不妨碍我去幻想很多美好的奇异的爱情方式。我觉得爱情方式有很多很多,我写到现在也才写了其中的某几种方式而已。”公子衍的小说以爱情为主,“我发现海外他们也喜欢国内的爱情故事,就是比较浪漫一点的霸总言情类的。”

据中国作协数据,截至2022年,中国网文累计向海外上线翻译作品9000余部,同比2021年增长200%。到了今年10月,阅文数据显示,旗下海外门户起点国际已上线约3600部中国网文的翻译作品,同比三年前增长110%,阅读量超千万的作品达到了238部。其中,阅读量破亿的9部翻译作品中,讲述现代女性摆脱困境破茧成蝶故事的《许你万丈光芒好》,阅读量超过了4.5亿。

即便如此,中国网文的海外译本也只是沧海一粟。目前中国网文的作品规模已经超过3400万部,翻译作品只是其中极小的一部分,而且翻译作品集中于英文市场。虽然中英文两大市场的用户规模已经接近全球人口比例的30%,但西班牙语、葡萄牙语等多语种市场同样具有巨大的潜力。

网文出海的难点在于,信雅达的翻译很难,也很贵。

推文科技CEO童晔在第二届上海国际网络文学周上表示,这几年来,网文出海的一个重要变化是从翻译的内容出海到原创内容出海,核心的原因比较简单,因为翻译的成本太高,效率很低,不如直接邀请海外作家进行培训,从经济上来说投资回报比较高。“翻译出海的效率、成本、质量,长期以来属于行业的‘不可能三角’”。

桃花源与伊甸园

中国文学的海外出版,最早是以纸质版为主。但在数字化的时代,网络文学的海外载体已经变成了APP。

站在全球的范围内竞争,翻译的作品总是难以彻底消除中外文化隔阂。

据中国人民大学新闻学院林升栋教授观察,李子柒的视频走到海外,中国的观众很容易就想到中国的田园风格,“中国人确实通过李子柒的视频看到了一个桃花源;西方人是要解决他们自己现代社会带来的问题,尤其是过度技术主义带来的问题,他看到的是一个伊甸园的世界,跟我们是不一样的。”

童晔表示,翻译作品的内容本地化是很难的问题。真正的内容出海,要受到当地用户欢迎,核心还是要用当地的语言,包括网络用语、网络梗来吸引当地的用户。

人工智能有望成为行业变数。

“生成式AI在这一年中有了重大的发展,如一股狂潮,势不可当。它的颠覆性、规模性,从我们的角度来看丝毫不亚于当年的互联网革命,既有挑战,也有巨大的机遇。我们站在了生成式AI改变时代的十字路口。”亚马逊云科技中国区跨国企业事业部总经理沈涛近期接受第一财经记者采访时表示,“在这样一个时代的关口,所有企业都需要面向未来不断构建。整个云计算和生成式AI把我们整个中国市场和全球市场拉得更近了。”

AIGC正在推动各行业的变革,网文行业也不例外。今年2月,阅文集团组建了AI翻译技术攻坚小组,尝试将AI能力应用到网络文学的翻译中来,提升中英翻译,同时覆盖更多语种。

在一定范围内的初步尝试来看,“在AI助力下,网文的翻译效率极大提升,由日均翻译十余章节向日均翻译上千章节跃进,效率提升近百倍;翻译成本下降了九成。”杨晨说。

但杨晨也提到人工智能的一些切实挑战:“我们面临的第一个挑战,是术语翻译的准确性。”

在中国的网络文学里,修仙、武侠、玄幻等种类占据举足轻重的地位。但这些网文中的门派、功法、修炼、等级体系等中国网文、中国文化中特有的术语,单纯依靠AI翻译无法准确表达其内涵。这需要通过AI将特殊术语进行提取、翻译并进行校正,为此阅文目前建立了一个拥有上百万条术语的词库。同时,针对西班牙语、葡萄牙语、日语等语种的语法规则和标点特征,进行适配。

除此之外,AI翻译的内容质量、读者对于AI翻译的接受度都是不小的挑战。企业还需要重建网文翻译的流程和体系,搭配人工校正来综合优化AI翻译内容。据杨晨介绍,阅文为此组织了超过3万人次的读者测试及反馈,对AI翻译的细节进行不断地微调。

如何拥抱AI风口

中国网络文学里的“梗”,国外读者往往接不住。

据童晔观察,今年以来大模型出现之后,它开始做到把中文的梗变成平铺直叙的语言,然后转化到目标语言中,寻找一种相对应的梗,从而可以让海外读者理解。

“技术上的实现并不意味着产品上或者生产上能够实现,可能还需要做工程性的工作。”童晔说。

OpenAI公司开发的ChatGPT是最受关注的一款大模型产品。但在童晔看来,ChatGPT翻译网文,“可以说完全不可能”。“一个最简单的例子,ChatGPT会有安全护栏。稍微过点度的内容,一些暴力的内容会拒绝翻译,因为不符合它的安全护栏。”

同时,ChatGPT会有大量的漏译情况,这也是大模型出现之后的显著特征。“传统的翻译模型一个词一个词一句一句对应翻译,现在的大模型是在读了一篇比如五千字的中文小说之后,按照它的理解重新写了一遍,所以中间会有大量的删减因素,漏译情况非常严重。”童晔说,“一篇长内容,能否保证200万字中出现的同一个人名字翻译是一样的?这个做不到,因为它的上下文窗口是有限的。”

未来人工智能能否直接生成一部小说?

“坦白说现阶段我是不看好的”,童晔表示,他在GPT4出来之后做了大量评测,现有的机器智能生成一部长内容基本不可能,因为它的上下文窗口长度是有限的。而且AI不理解逻辑,无法知道一个作家在第三章的伏笔在后面会成为至关重要的影响因素。“真正好的文学作品还是源自人,源自创作者自己的积累和感受,自己每天熬夜写出来的内容,机器在这边起到的作用相当有限。”

沈涛对记者表示:“我觉得每个时代的风口出现了,大家首先拥抱,但是也不要过度解读。AI浪潮是势不可当的,但是我们不要过度地解读生成式AI在‘目前’给我们带来的价值,还是要理性的看待AI在什么样的领域能够带来价值,再一步一步地看以后它有什么价值。”

国外出版体系相对成熟,中国网文出海也有不小竞争。这些竞争首先来自于中国本土企业的集体出海,WebNovel、GoodNovel、Dreame三家互相厮杀抢占海外读者。

在国际网文市场里,韩国也是一个新生力量。2021年,韩国互联网企业Naver收购了成熟的北美网文平台Wattpad。Naver在此基础上,将网文和韩国比较成熟的漫画、影视等进行了一定程度地打通。

童晔认为好的内容是在好的基础设施上“长”出来的,真正有国际竞争力的内容,有赖于宽松的出版政策。“韩国是特别明显的例子。上世纪末韩国开始做文化出海、文化立国,到最近大规模的韩剧出现、电影的出现,全部是基于对于自身国家问题的反思,创作自由的土壤上会有好的作品出来。”

中国是一个远比大多数国家竞争激烈的市场,AI时代的竞争也许会帮助中国网络文学走向更深远的世界。

“我在欧洲的体验度和在这里的体验度完全不一样,我当然也想天天在河边喝咖啡,但是这个时代的浪潮逼着我们在激烈的竞争中不断地前行。”沈涛说,中国已经是世界上最大的AI应用市场,只有激烈的竞争才能催生科技的不断创新,才能提升各行各业数字化转型的速度。”

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。

文章作者

相关阅读

用户需要怎样的行业大模型?︱AI大模型十问(六)

编者按:ChatGPT爆火后,AI大模型层出不穷,面向行业的垂直大模型也陆续发布。那么,怎么才算一个合格的行业大模型?行业数据哪里来?如何将行业know how更好地融入大模型?第一财经推出“十问AI大模型”专题,进一步追问与解密。

01-30 15:28

行业大模型如何拥抱应用场景?︱AI大模型十问(四)

编者按:ChatGPT爆火后,AI大模型层出不穷,面向行业的垂直大模型也陆续发布。那么,怎么才算一个合格的行业大模型?行业数据哪里来?如何将行业know how更好地融入大模型?第一财经推出“十问AI大模型”专题,进一步追问与解密。

01-23 11:15

书生·浦语2.0正式开源,回归语言建模本质,综合性能领先开源社区

1月17日,书生·浦语2.0(InternLM2)发布会暨书生·浦源大模型挑战赛启动仪式在上海举行。

01-18 14:15

2023国内大模型发展情况盘点(二)--中美大模型情况发展比较

截止2023年5月,中国已成功发布超过79个拥有10亿以上参数的基础大语言模型,相同等级模型下,美国发布数量达到100个。全球范围内累计推出的10亿以上参数大语言模型总数为202个,其中中美两国所发布的模型总数占比近90%。相关数据体现国内于大型语言模型开发领域已跻身领先行列,本文将通过中美大型语言模型发展比较深入了解发展现状。

01-14 23:06

国内大模型创新发展与软硬件协同生态论坛在上海徐汇成功举办

2023年12月28日下午,国内大模型创新发展与软硬件协同生态论坛在上海徐汇成功举办。

01-02 14:07
一财最热
点击关闭