“人工智能时代的出版转型”讲座在我校“云端”开讲

3月31日上午,由南京大学信息管理学院和出版研究院主办的出版论坛第102(疫情与出版系列特别讲座之五)在腾讯会议和B站平台进行了在线直播,中国大地出版社执行总经理、中地数媒(北京)科技文化有限公司总经理、融智库董事长张新新高级编辑作了题为“人工智能时代的出版转型”的报告。讲座由南京大学出版研究院院长、博士生导师杨海平教授主持。来自包括我校师生在内的全国新闻出版官产学研领导、同仁、老师和同学7200余人在线观看讲座,反响非常热烈,得到了大家的一致好评。

讲座伊始,张总给大家推荐了杰瑞﹒卡普兰《人工智能时代》,指出我们出版业现在正处在转型升级大潮,机遇稍纵即逝,要及时把握,优雅转型。而张总所著的《吉光片羽:人工智能时代的出版转型》中指出靠部门制很难完成转型升级,只有公司制才能胜任出版转型的大使命。张总从AI人工智能与出版转型、人工智能的概念与发展历程、智能出版流程、新闻出版+AI四个方面为我们详细讲述了人工智能时代出版如何“优雅转型”。

 


1.AI人工智能与出版转型

首先,张总给大家阐述了国务院于2017年7月发布的《新一代人工智能发展规划》中的主要内容,规划明确了人工智能进入新阶段,将人工智能定位为国际竞争的新焦点、经济发展的新引擎和社会建设的新机遇。其中规定了八项关键共性技术,其中有六项关键共性技术与新闻出版业紧密相关,包括知识计算引擎与知识服务技术、跨媒体分析推理技术、群体智能关键技术、虚拟现实智能建模技术、自主无人系统的智能技术、自然语言处理技术。所涉及的新闻出版业态包括AR出版、VR出版、知识服务、复合出版流程再造、新闻出版大数据、智能机器人应用等。随着数字出版发展步入深水区,迈进高质量发展阶段,未来出版的数字化转型升级将聚焦于四个领域:知识服务、在线教育、全版权运营和智能出版。

知识计算引擎与知识服务技术。要重点突破知识加工、深度搜索和可视交互核心技术,能够实现对知识持续增量的自动获取,具备概念识别、实体发现、属性预测、知识演化建模和关系挖掘能力,最终形成涵盖数十亿实体规模的多源、多学科和多数据类型的跨媒体知识图谱。

虚拟现实智能建模技术。重点突破虚拟对象智能行为建模技术,提升虚拟现实中智能对象行为的社会性、多样性和交互逼真性,实现虚拟现实、增强现实等技术与人工智能的有机结合和高效互动。

自然语言处理技术。重点突破自然语言的语法逻辑、字符概念表征和深度语义分析的核心技术,推进人类与机器的有效沟通和自由交互,实现多风格多语言多领域的自然语言智能理解和自动生成。

  

2.人工智能的概念与发展历程

人工智能的概念已经火了好几年,在2017年的时候成为中国媒体年度十大流行语之一,并被公认为二十一世纪三大尖端技术(基因工程、纳米科学、人工智能)之一。那么人工智能究竟是什么呢?不同的学者给出了不同的定义,张总认为对人工智能最为贴切的定义是“根据对环境的感知,做出合理的行动,并获得最大收益的计算机程序”,简单来说,人工智能就是赋予机器以智能。

 

人工智能的发展经历了三次热潮。第一次AI浪潮发生在1956~1976年。1956年召开的达特茅斯会议,希望确立人工智能作为一门科学的任务和完整路径,标志着人工智能的正式诞生。

第二次AI浪潮发生在1976~2006年。第二次浪潮的热门研究领域包括:语音识别、语音翻译、神经网络、专家系统等。其中最为出名的技术当属“专家系统”,通常由人机交互界面、知识库、推理机、解释器、综合数据库、知识获取等6个部分构成。

专家系统的发展已经历了三个阶段,正向第四代过渡和发展。第一代专家系统:以高度专业化、求解专门问题的能力强为特点。第二代专家系统:属单学科专业型、应用型系统。第三代专家系统:属多学科综合型系统,采用多种人工智能语言,综合采用各种知识表示方法和多种推理机制及控制策略。第四代专家系统:在总结前三代专家系统的设计方法和实现技术的基础上,已开始使用大型多专家协作系统、多学科协同解题与并行推理、人工神经网络知识获取及学习机制等最新人工智能技术。张总指出,目前出版在各个专业领域都构建了知识库,是处于第二阶段的专家系统,下一步的发展是要实现跨学科的知识库构建。

第三次AI浪潮从2006年开始,一直到今天第三次浪潮热门研究领域包括:大数据、深度学习等。建立在大数据的基础上的深度学习,对大数据进行训练,并从中归纳出可以被计算机运用在类似数据上的知识或规律。大数据和深度学习这两个“支柱”把第三次人工智能浪潮推向了高潮。

张总指出,第二次浪潮和第三次浪潮走的路径不一样,第二次试图用演绎的方式、穷尽一个领域的知识,第三次则是用归纳的方式,不断学习知识。值得一提的是,三次浪潮都有在体育竞技领域的标志事件。第一次浪潮在体育领域的标志性事件是:1962年,IBM的阿瑟萨缪尔开发的西洋跳棋程序战胜了一位盲人跳棋高手。第二次浪潮在体育领域的标志性事件是:1997年5月11日,美国IBM公司研制的并行计算机“深蓝”击败了雄踞世界棋王宝座12年之久的卡斯帕罗夫。第三次浪潮在体育领域的标志性事件是:2016年3月,阿尔法围棋程序(AlphAGo)对战世界围棋冠军、职业九段选手李世石,凭借深度学习原理,以4:1的总比分获胜。2017年中国乌镇互联网峰会,AlphAGo 3:0战胜世界围棋排名第一的选手柯洁九段。

 

3.智能出版流程

在梳理完人工智能的概念与发展历程之后,张总接着具体介绍了以人工智能的视角来审视出版业,会给出版流程带来怎样的变化。目前的编辑、审查、校对、印制、储运、销售等环节仍然依赖人力资源的大量投入,而以大量的自动化、智能化系统取代人力资源的投入将会成为主要趋势。以群体智能为理念先导、以知识体系构建为核心的出版流程再造将会在人工智能时代大放异彩

人工智能对策划最大的启发是群体智能,用协同创新的方式改进选题策划。群体智能在现实生活中已经应用到各个领域了,如基于群体编辑的维基百科、群体开发的开源软件、众问众答的知识共享、众筹众智的万众创新、众包众享的共享经济等。张总举了微软人工智能“小冰”自主创作并出版的诗集《阳光失了玻璃窗》清华大学语音与语言实验中心人工智能“薇薇”自主创作古诗的例子。在不考虑作品质量的情况下,“小冰”的出现给出版企业传统的选题策划与撰稿带来了挑战“薇薇”创作的古诗甚至可以通过“图灵测试”,这意味着 “薇薇”创作的诗词,人类已经无法识别其作者是人工智能还是自然人了。

在智能撰稿方面,“作家”人工智能技术平台Wordsmith,2013年机器自动撰写的新闻稿件数量达到3亿篇,超过了所有主要新闻机构的稿件产出数量;2014年,已撰写出超过10亿篇的新闻稿。机器撰稿的优势在于背后有大数据语料库做支撑,报道更加客观、发稿速度更快、出错量降低,同时也推动记者向着深度新闻报道的方向转型不足在于所撰写的新闻深度不够、缺乏亮点和重点、仅仅局限于信息播报、体育财经等领域。

审校方面,新闻出版企业基于大数据智能、群体智能、自然语言处理等理论和技术构建自动纠错系统、敏感词识别与排查系统和系统编撰系统一系列智能审校系统,智能编校排系统、敏感词识别系统、AI审核系统、富媒体AI审核等一系列智能审校系统的出现大大提高了流程效率。但是,目前来说智能审校系统各个学科的专业知识的储备还不够,真正的未来在于把各个行业的领域词表都纳入进来。

印刷方面,智能印刷的主要发展方向为新型印刷耗材的绿色化、印前的数字化、设备的物联网化和高效化、印制工序自动化、技术服务网络化及管理系统信息化等。

涉及到发行这块的转型,最近比较火的是网红直播销售商品,据不完全统计,直播一姐薇娅在两小时之内能销售5万册,网络直播的新零售是出版发行环节的一个重要方面。另一方面,人工智能参与到发行中来的表现是,智能发行能够做到基于客户关系系统,构建自动化的精准用户画像测评系统,并基于此实现印制规模和发行数量的精准匹配,形成数据回流闭环,进而实现优化完善供给、降低退货率、统计分析和精准投递推送等目标。

 

4. 新闻出版+AI:智能产品服务场景

在人工智能对出版流程重塑之外,张总还和大家分享了AI能够为新闻出版业提供的七个智能化的产品服务场景。

新闻出版大数据。在智能时代,新闻出版业的深度转型,必然伴随着由数字化、碎片化向数据化、智能化的方向进行升级和演进。作为新闻出版大数据建设的重要组成部分——专业出版大数据的构建在国内已经初现成效:审计、公安、法律、地质、海关等领域的大数据平台已在建或建成

 

新闻推荐新闻推荐的主流算法包括:基于内容相似度的推荐、基于用户/物品相似度的协同过滤、热点新闻推荐、基于模型的推荐(用户特征模型)以及混合推荐等算法。通过人工智能技术,基于用户的浏览习惯、阅读偏好等数据,给用户推荐相同或相似的信息。

语音识别。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。目前,语音识别技术的发展还面临着许多困难,如语音信息量大个体发音差异环境噪声对语音识别有严重影响对自然语言的识别和理解较为困难等。

知识计算与识服务目前各行业所构建的单一型专业知识库,将会向多学科知识库的方向演进和升级;知识服务将会从目前的知识库构建、应用为主,转向更加纵深的专家系统,并将与大数据、机器学习等最新技术相融合。

智能AR出版目前国内有大批的企业参与到AR出版技术开发中来,AR技术应用于出版业的结果是融合出版了一大批AR图书、AR游戏出版物,并且逐步催生出AR知识服务系统。但目前仍然存在着技术依赖性强、设备粗糙、标准规范缺失等问题。一方面AR出版物形式新颖、画面精美、互动性强,另一方面AR出版物也存在内容太少、价格太贵、支持的设备有限等缺陷。

 

智能VR出版VR技术主要有四个方面的特征:虚拟性真实性交互性沉浸性。基于这四个特点,VR技术可以应用于历史人物、场景的再现与宣传;出版业的展会论坛、展览展示;教育出版领域的在线教育等;专业出版涉及道路桥梁、地质灾害、文物古迹工业仿真等场景的塑造在这里,张总给大家提出了一个问题:VR出版是一种单独的出版形态,还是一种呈现方式/增值知识服务方式?

智能机器人机器人和无人驾驶属于人工智能领域标志性的产业,也是最容易让人遐想未来的智能产品/服务。应用在新闻出版行业的机器人有以下几种类型:机器人新闻/机器人主播礼仪机器人、盘点机器人仓储机器人、教育机器人、智能销售机器人等。

 

在最后的总结中,张总指出要推动人工智能与新闻出版的融合,推进新闻出版数字化转型向智能化发展的方向迈进,我们还要从以下几个方面再做努力:给予政策和资金扶持;重塑标准化体系,规范行业标注;强化人才培养措施,打造复合型人才;针对社会现实,完善法律法规。