DjVu(读作déjà vu)是一种计算机文件格式,主要用于存储扫描的文档。这种格式的特色包括图像分层、渐进加载、算术编码、对二进制图像进行有损压缩,从而以较小的空间,存放高质量的可读图像,过去曾经广泛的用于扫描书籍保存的格式。

Djvu标志
Djvu标志

DjVu 可添加光学文字识别的文本层,这样就可以使用复制与粘贴操作。

DjVu技术最初由AT&T实验室扬·勒丘恩(Yann Le Cun)、Léon Bottou、Patrick Haffner和Paul G. Howard于1996年开发。DjVu是一种开放的文件格式,文件格式规范与参考库的源代码都公开发布。商业开发的所有权几年来被转给了不同的公司,包括AT&TLizardTech。原作者维护着一个GPL实现,称为DjVuLibre[1]

2002年,DjVu、TIFFPDFInternet Archive百万书籍计划(Million Book Project)选中,作为公有领域书籍扫描后上线的文件格式[2]

对比

渐进加载使得DjVu适合于应用于互联网。DjVu 格式在扫描文档上,文件大小和开启速度通常都优于 PDF 格式。

由于大部分编辑软件不支持生成 DjVu 格式,同时支持 DjVu 格式的编辑器相较于 PDF 格式来说并不普及。存储空间和网络速度和已经不再是瓶颈。文字为主的书籍更多的保存为 ePub 格式(适合在小尺寸的移动设备上阅读,自定义排版)和 PDF,种种原因使得在新的个人扫描文件上 DjVu 格式已经不再普遍。

参考资料

  1. ^ DjVuLibre. [2006-03-24]. (原始内容存档于2006-03-15). 
  2. ^ Million Book Project

外部链接