纸质图书数字化加工
时间:2009-8-11 16:27:13 人气指数: 【 大 中 小 】
北京天润智力专业从事纸质文献的数字化加工,将文献资源制作成符合国际标准的数字资源,进行深度数据加工和加密处理,制作成全文检索光盘供用户使用,非常适合于图书馆、出版社、期刊杂志、各类企事业单位以及个人用户。文档整理
对原始文档进行整理、拆分、分类,区分是否适合扫描,制定数字化方案。
图书扫描
对特色图书、期刊、论文进行筛选后进行扫描。可以采用高速扫描仪进行快速图像采集,也可以采用平板扫描仪进行不拆分扫描,生成TIFF、JPG、PDF等图像格式。
影像处理
对扫描后的图像增强处理,提高识别率和增强美观度,如格式转换、动态二值化处理、自动校正、自适应纸张大小、灰度加强和去黑边等功能。
文字识别
采用OCR软件支持对扫描的图像文件进行文字识别,生成文本文件。天润智力采用国际领先的OCR识别技术,既可以识别常见的简体汉字、繁体汉字、英文,也可以识别日文、韩文、俄文、德文、法文等190多种文字,超强的版面分析能力,最大限度减少手工操作量,识别准确率高达99.8%。
格式转换
转换成双层PDF格式,可以对图像内容进行全文检索,检索结果定位到文档所在页面的具体位置,文件内容原版显示,无须二次排版。
数据标引
对文档的元数据进行标引;制作文档目录;在PDF中制作书签链接,非常便于阅读使用。
光盘发布
以全文检索数据库为核心,以HTML模版为界面,支持单字段(著录项)简单查询,也能进行多字段多条件模糊检索、二次检索、复合检索,还可以实现数据的导入导出、添加片头片尾多媒体等多种功能。
数据加密
通过数字版权保护技术(DRM)将电子文档进行加密处理,例如数据库加密、文件加密、口令保护、软件序列号认证、硬件加密等,有效保证数据安全。