首页 -> 2008年第5期

现代编辑出版业的第二次历史性跨越:编辑自动化

作者:田胜立




  在上期《中国编辑》中,我撰文回忆了“748”工程的历史意义(《现代编辑出版业的历史性跨越:汉字信息处理与排版印刷技术革命》),并且预言出版业再次实现跨越式发展,仍然要靠科学技术的突破。并提出,在数字通信和数字信息处理技术成熟的今天,出版业再次跨越式发展的突破口在编辑环节,在编辑加工自动化。
  近年来,在推广应用“方正”新闻采编流程计算机管理和新闻综合业务网络系统过程中。报社已积累了丰富的数据资料。培养了数字采编队伍。有的报社建立了颇有规模的数据库。许多编辑记者能熟练地运用各种数码采集设备和网络采集、发送、编辑数字新闻稿,他们已有条件运用计算机网络系统使用计算机辅助编辑技术处理采编业务。以黑马自动校对软件为代表的汉字文字自动编校软件在应用推广中智能化水平不断提高,以WPS、Word为代表的汉字文字处理软件在日常写作、修改、编辑处理等工作中使用越来越普遍,这都为编辑迈向自动化积累了应用基础。被社会各界指责编辑质量不高的常用例证多是错别字和词语搭配不当,其实多发错别字不过两百来个,常见词语搭配不当也只有数百对,其数量比病毒库样本少多了,完全可以开发一个人工智能软件,对待加工稿件自动扫描、报警、替换、计数,再设计上自学习功能,该系统工作效率会越来越高,准确度也会越来越高。目前的人工智能工程已能做到,只要人工专家的经验智慧能描述清楚,样本收集比较全面,就能做出相当实用的专家系统。也就是说,编辑加工中的语言文字规范加工由计算机自动完成在技术上不难实现,就像现在文字排版可由计算机自动完成一样。类似的,科技类稿件中常见的科技术语、法定计量单位以及地名、人名的翻译,引文的核对,都可以通过相应规范的数据库由软件自动分析、比对、校正,至少可用人机结合的方式,由计算机在后台查检提示、由人工拍板决定,编辑加工的工作效率也可大大提高。也就是说。编辑工作中过去耗费许多时间和人工的非创造性活动可以也应当交机器完成。编辑需要集中精力做好机器难以替代的创造性编辑工作。数据库和专家系统技术在不断提高编辑自动化水平上能发挥关键作用。20世纪80年代科学出版社出版学术著作平均周期500天,瓶颈是排校改环节,自动排版突破以后,出书周期大大缩短。在现今双面八色轮转印刷机轻松实现每小时5万印和高速自动装订生产线普及的印装技术平台上,向审读加工这个编辑环节要质量要效率的问题就凸现出来。出版提高效率的瓶颈现今是编辑环节,提高出版质量的关键原本就在编辑环节,策划设计适销对路的出版物的焦点公认在编辑环节,所以,实现再次跨越的焦点是编辑,应该没有太大疑义。可是,编辑加工自动化为什么迟迟没有提出来呢?
  本文认为,编辑加工弹性大、可替代性高、不被重视是重要原因。弹性大,一是指编辑加工的要求不易量化,目前只有错误率一个量化指标:二是加工对象的需加工程度散布大,有的来稿几乎不用怎么加工而有的却几乎需要重写;三是留给编辑加工的时间不是由加工需要决定而是由其他因素决定,这样有时使编辑加工不得不从简甚至从略。可替代性高,需要时可委托外编加工,由别人来做;也可以发挥作者的能动性来降低编辑加工阶段的难度和压力。上述的客观原因引发了方方面面主观上的不重视,加上出版业个体脑力为主的工作特点和出版物品种繁多,远不如大批量流水作业的制造业重视科技进步和标准规范,包括编辑加工自动化在内的编辑自动化需求自然就没有多少人去考虑。辛辛苦苦的编辑们不会提,谁想让机器把自己的饭碗砸掉呢?忙忙碌碌的老总们不会提。加工不出来可发外编加工,不是还可从简么?有心开发的软件商一厢情愿,虽然看到了潜在市场却不了解需求,研发的产品总不大合用。于是编辑加工自动化难以突破。
  随着互联网的普及和手机性能的提高,随着宽带网普遍使用,在其他媒体的竞争压力下,在国外同行示范效应激励下,报业首先感到跨媒体组织新闻传播的重要性,而且现有的技术条件能够支撑报业进行跨媒体传播。以往一份稿件,做一次加工,只能用在一种媒体上,换一种媒体则需要再次加工和设计,这就多了一份时间和人工的耗费,因为不同的媒体格式版式不同,稿件信息不能从一种媒体的格式版式状态直接传输给另一种媒体。
  同一条新闻,如何尽快地在互联网、手机网、街头大屏幕和报纸上推出?同一篇言论,如何尽快地送达各位受众?报业对跨媒体出版传播的需求已很强烈和迫切。
  电脑手机屏幕各有大小,有线无线网络各有自己的技术和标准,视觉媒体听觉媒体各有编码和转换规则,文本数位诸多文件类型各有自己的格式。纸质荧屏视觉感受各不相同,版面大小不同处理规律各有特点,直排竖排左起右起版式各有要求,文配图图配文文图并重各有功用,同一份内容怎样才能适应这些不同的条件和需求?关键是内容加工处理要同内容展现形式明确分开,内容加工过程不带版式格式运行。只在向人展示或与人交互时才根据展示环境带上版式格式表达出来。这样对一份内容作一次加工就可发给各种不同的媒体形态同时或先后展示出去。它比现行面对每种媒体都要重新输入编排效率高多了,费用也节省多了。展示时内容按特定格式版式呈现是自动完成的。这样的“一次加工,多重发布”技术路线,将给出版业特别是报业开展跨媒体出版,打开一片新天地。
  一些有远见又有实力的报社已经着手按上述路线建设自己的报网呼应机制开展跨媒体出版,新闻出版总署也启动了列入国家“十一五”文化发展规划纲要的数字复合出版系统工程,集中力量突破技术难点,为各类传统出版单位开展跨媒体出版打造得力工具和平台,大力促进出版产业升级改造。可以说。编辑加工自动化进程业已启动。
  当代人们在感受到互联网上信息方便易得的同时,也对信息的冗余越来越难以忍受。
  不同的读者对信息检索结果的查全率和查准率要求不同。我们先分析一下阅读需求。对阅读需求可以有多种分类,从阅读功能角度可把阅读分为三种情况:学习性阅读、娱乐性阅读、情感性阅读。学习性阅读是以研究或学习为目的所进行的阅读,它又可分为专业性阅读和非专业性阅读两种。专业性阅读指读者在本专业或熟悉领域内的阅读,其特点是读者对所读内容有较强的分辨力,能较容易地理解阅读内容,也能较准确地确定自己需要的东西。非专业性阅读指读者在不熟悉领域内的阅读,此时读者对内容的分辨力理解力较弱。往往难以分辨真伪正误、甚至难以分辨是否有用。在传统阅读情况下,非专业阅读时离不了词典和百科全书的帮助。以研究为目的的阅读和大部分以学习为目的的阅读属于专业性阅读,此时读者往往希望尽可能全面地占有资料。再通过浏览挑选需要的内容研究分析。但是读者慢慢感觉到查准率越来越重要。靠推敲优化检索策略提高查准率对普通读者来说可能要求过高。而在非专业性阅读情况下,准确的检索结果则是首位需求。一项准确而权威的结论,就

[2]