谈电子资源格式对图书馆电子资源建设的影响及对策 https://www.chnlib.com https://www.chnlib.com/LunWen/318.html 摘要:数字图书馆,离不开丰富的电子资源,在电子资源建设过程中,我们不仅要根据自身需要购置或自建所需数据库,而且还要对电子资源的制作方式、存储格式、空间占用量大小等情况有比较全面的了解,尽量减少硬件资源的开支,使软硬件资源得到充分利用。建立一个真正高效的数字图书馆关键词:数字图书馆,电子资源,数据库随着网络技术的日益成熟和飞速发展,图书馆已进入了数字图书馆时代,传统图书馆正在向现代图书馆过渡。而数字图书馆,首先要有一定的电子资源为基础,这其中包括图书资料的数字化,文献资料的数字化,视听资料的数字化等,这些电

谈电子资源格式对图书馆电子资源建设的影响及对策


  • 时间:2008-07-05 11:04:36
  • 来源:本站发布
  • 作者:王敬福

摘要:数字图书馆,离不开丰富的电子资源,在电子资源建设过程中,我们不仅要根据自身需要购置或自建所需数据库,而且还要对电子资源的制作方式、存储格式、空间占用量大小等情况有比较全面的了解,尽量减少硬件资源的开支,使软硬件资源得到充分利用。建立一个真正高效的数字图书馆
关键词:数字图书馆,电子资源,数据库

随着网络技术的日益成熟和飞速发展,图书馆已进入了数字图书馆时代,传统图书馆正在向现代图书馆过渡。而数字图书馆,首先要有一定的电子资源为基础,这其中包括图书资料的数字化,文献资料的数字化,视听资料的数字化等,这些电子资源我们可以通过购买(放在本地)获得,也可以通过图书馆自己制作获得。也可通过远程访问他人已有的资源(一般需购买)来获得。但无论通过什么方式,我们都要对这些资源数字化的制作方式,数据量大小,存储格式等有一个详细了解,以便我们在进行数字化建设的过程中,能够根据自己的实际情况,最大限度地利用图书馆现有资源,使其发挥最大效用。同时能给读者更便捷的访问。
图书馆电子资源主要包括电子图书,电子报刊,以及各种图片、音像资料等多媒体信息资源。而这些电子资源除了根据我们的需要决定取舍外,它们又是如何制作的呢,它们有什么特点呢,它们对硬件资源的要求又是怎样的呢,了解了这些,我们才能够充分利用有限的资金最大限度的进行电子资源的配置与建设,提高硬件资源的利用率。

1.电子资源的制作方式
1.1、简单扫描:对纸介信息进行电子扫描后生成电子图像序列,纸的每一页都是一张电子图像。这种作法加工技术简单,但生成的电子信息占用的存储空间太大,大大增加了硬件的投资。另外它还不能进行全文检索、页面标注、摘录、字体缩放等功能,在数字图书馆发展的初期,这种形式的电子书占有很大的比重,社会上的许多电子图书资源提供商大多提供的也都是这种形式的电子书。
1.2、增强扫描:在对纸介信息进行电子扫描后再进行OCR识别,得到识别率在95~98%的纯文本信息,与简单扫描电子书配合使用,初步实现了全文检索功能,同时保证了书的内容和版式100%的正确率。但用这种方式实现的全文检索功能,只能将检索到的词条定位到它所在的页,而不能精确定位到字或词,由于用于全文检索的纯文本信息的正确率达不到100%,因此也降低了检索的正确率。增强扫描除了在简单扫描的基础上增加了全文检索功能外,并没有解决简单扫描原有的其他缺陷。因此这种方式也只是电子书向更高阶段发展过程中的一种过渡方式。
1.3、OCR识别: OCR(光学字符识别)技术可以将纸介的图书资料转换为电子书,但OCR技术存在两个弱点,一是识别率不高,经过多年的发展也很难超过98%的界限,在要求比较高的数字化业务中,这种正确率达不到使用要求。二是不能保留原书的版式:文字和图片关联的消失。公式和表格更是面目全非,为了解决这两个问题,一些厂家开发了用于专业领域的OCR识别系统。将一些相关技术与OCR技术配合使用,达到满意的数字效果。首先是通过版面分析技术,完整再现纸介信息上的字体、字号、分栏、图片等版式信息,对于复杂的公式、表格则作为图片处理,其次采用计算机辅助校对功能,差错率可控制在万分之一以内。OCR识别书不仅可以实现完善的可定位到字的全文检索,页面批注、摘要、字体缩放等功能,文件所占的存储空间相对扫描书也大大降低。对于纸介信息资料的数字化这是综合质量最高的一种技术。
1.4、录入排版:将书的内容重新录入排版,虽可完善地实现全文检索、页面批注、摘要、字体缩放等功能,但由于需要人工输入、排版、校对,最终结果的质量取决于操作人员的能力。
1.5、格式转换:目前纸介信息的排版已基本上实现了数字化,但这种用于印刷的排版文件,存储数据量过大,解释又比较复杂,格式也难以统一,不适合直接作为面向广大读者的电子书格式。格式转换就是将用于印刷的排版文件直接生成为一种统一的格式,并能完整保留原排版文件的内容和版式信息,而且把数据量降到最低,电子书的质量与通过出版社多次校对把关的排版文件完全一致。这种方式也更好地实现了可定位到字的全文检索、页面批注、摘要、字体缩放等功能,全部字体保留矢量描述信息,任何比例的放大或缩小都能保证高质量的字体轮廓,对公式和表格中的文字也能进行检索和摘录。是质量最高,功能最强的电子书形式

回到顶部