大数据 是否能为现代印刷保驾护航?

来源: 发布日期:2013-09-05 32

什么是大数据?这是我们认识大数据、应对大数据发展需要回答的首要问题。从一般意义上说,大数据是指那些超过传统数据库系统处理能力的数据,数据量通常在10TB(1TB=1024GB,为1万亿字节)以上。具体来说,大数据具有4个基本特征:一是数据体量巨大。百度资料表明,其新首页导航每天需要提供的数据超过1.5PB(1PB=1024TB),这些数据如果打印出来将超过5千亿张A4纸。有资料证实,到目前为止,人类生产的所有印刷材料的数据量仅为200PB。二是数据类型多样。现在的数据类型不仅是文本形式,更多的是图片、视频、音频、地理位置信息等多类型的数据,个性化数据占绝对多数。三是处理速度快。数据处理遵循“1秒定律”,可从各种类型的数据中快速获得高价值的信息。四是价值密度低。以视频为例,一小时的视频,在不间断的监控过程中,可能有用的数据仅仅只有一两秒。

大数据时代来啦!

大数据是与智能制造、无线网络革命并行的又一次颠覆性的技术变革。其具体内容包括:海量数据分析技术、大数据处理技术、分布式计算技术、数据可视化技术。其中的分布式计算技术,也称云计算技术,可以同时满足海量数据处理需求,比如1000万人同时搜索某一数据,它会将这些数据交给分布于全世界的服务器并通过它们来进行处理,结果与1万人同时搜索这一数据没什么两样。

大数据发展之快,已远远超出人们的想象。特别值得关注的是,2012年3月,奥巴马政府发布了“大数据研究与开发计划”,并宣布先期投资超过2亿美元的资金,用于研发大数据关键技术,以抢占数据资源开发利用的制高点。2012年5月,联合国“全球脉动”计划发布了《大数据开发:机遇与挑战》报告,英国、德国、法国、日本、加拿大等发达国家积极响应。我国也于2012年10月成立了中国通信学会大数据专家委员会。种种迹象表明,世界各国特别是发达国家都把大数据的发展摆到国家战略层面加以推动,使大数据正在成为世界新的战略资源争夺的一个新焦点。

对于大数据的发展,全球知名咨询公司麦肯锡研究认为,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于海量数据的运用将预示着新一波生产率增长浪潮的到来,在政府公共服务、民生医疗服务、维护社会安定、动态安全监管等领域的广泛应用,将产生巨大的社会价值和产业空间。有机构预测,大数据应用将使美国零售业净利润增长实现60%,可使制造业的产品开发和组装成本降低50%。这种影响和变化是革命性的,说明大数据蕴含着大价值。

   数字出版向大数据进化

以阅读为起点,在数字技术的支撑下,一本书的数据究竟会有多大?从当前数字出版产品的形态看,读一篇小说,或许5M绰绰有余;查阅学习资料,也许涉及300M文献;享受一段声光电多媒体读物,可能总计不足1G……因此,数字出版目前典型的特点是“小数据”生产与制作,数字出版产品能够带给读者更多的是碎片化的知识、相关的兴趣点以及多姿多彩的阅读体验。至于阅读的深度挖掘、知识的重新组织,乃至阅读信息本身的智能型分析与匹配、数据之间的关系,读者阅读兴趣产生的数据,则正是大数据浪潮下,数字出版开启的瑰丽想象。

在不远的将来,数字出版或许应该首先是数据出版,它整合、梳理大量内容资料,全面、细致囊括相关知识,是海量数据、庞大数据库的有效管理。其次,它将是数据关系的智能服务,它能够智能挖掘、匹配一切阅读兴趣,为读者的沉浸阅读、深入学习提供内容和工具,是满足阅读需求的数据综合服务。最后,数字出版必将成为大数据出版,即以内容为基准,包含各种服务的PB级大数据;处理速度迅速、涵盖多种类型以及信息感知无处不在、随机变化但智慧关联。

印刷业如何敲开大数据之门

数码印刷的出现,成为了处在困境中的传统印刷行业的救世主,它由于无需传统胶印繁杂的工序,只需由计算机发往印刷机即出成品,准确又即使,成为当今印刷的偏爱。数码印刷具有快速及时、成本节约、无版印刷、信息可变等等一系列优点。

按需印刷指按照用户的要求,依指定的地点和时间予以提供为目的,直接将所需资料的档数据进行数码印刷、装订。按需印刷又称“实时印刷”和“闪电印刷”,是数字技术在印刷环节的极好实践,即“按当天的订数印刷,第二天发货”。它始于20世纪80年代,能满足个性印刷、减少浪费及印刷品一步到位的要求,实现零库存、实时出书和可选择的个性印书。

不论是数码印刷还是按需印刷,它使得传统印刷走向了高速与及时。这为数据处理提供了保证与可能。

传统印刷业在不断转型与升级,大数据是一种趋势,如果传统印刷业抓住了它,也就等于抓住了市场。