世界数字图书馆(WDL)现状与发展分析 数字图书馆厂家

  摘 要:本文通过对世界数字图书馆项目的深入剖析,结合笔者参加该项目年度会议的心得,阐述了该项目的现状,并对该项目的未来发展从创新资源存储和组织策略、资源主题的扩展、加强互动性、加强参与性、开发移动应用等方面进行了详细分析,最后总结了国内数字图书馆合作项目可以借鉴之处。
  关键词:世界数字图书馆;WDL合作伙伴会议;少数民族数字图书馆
  随着数字图书馆理念深入人心,技术越来越成熟,资源量也不断增加,各国国家图书馆都或多或少地开展了数字图书馆项目,对反应本国特色的资源进行了数字化,这些资源代表了各国的文明,体现了本国的文化,因此,通过在一个统一平台上展示这些代表性的数字资源显得意义重大,影响深远,文明的融合交流将对促进世界文明的发展具有重要作用,在这样的背景下,世界数字图书馆(World Digital Library,简称WDL)项目应运而生。
  1 WDL项目现状
  2005年6月,美国国会图书馆馆长詹姆斯H林顿(Billington.J.H)在一次讲话中向美国教科文组织全国委员会建议设立WDL,基本思想是建立一个以互联网为基础的,易于访问、收集有世界各国文化财富,突出所有国家和文化之成就的数据库,从而促进各国文化间的认识和理解[1],该提议得到了联合国教科文组织(United Nations Educational, Scientific and Cultural
  Organization,简称UNESCO)的支持,决定由几个图书馆建立一个公开、可供自由访问的WDL网站。2009年4月,WDL网站向全世界推出,内容涵盖了联合国教科文组织的每一会员国,现已经有77个国家的165个伙伴成员为该网站提供了各类数字资源,给世界人民提供了一个共享的平台。WDL建设的主要目的[2]包括:
  1)促进国际和文化间的相互理解;
  2)增加互联网上文化内容的数量和种类;
  3)为教育工作者、学者和普通观众提供资源;
  4)加强伙伴机构的能力建设,以缩小国家内部和国家之间的数码技术鸿沟。
  1.1 WDL官方网站(www.wdl.org)
  WDL官方网站界面十分简洁,但功能相当完善,包括以下四个部分:
  1)资源揭示
  WDL网站的资源揭示包括三种方式,即浏览、搜索和年代轴,浏览方式提供地点、时间、专题、资源类型和机构五种模式,世界各国读者可以从各个角度来获取资源,但WDL为了让资源的获取更加直观化、立体化,利用了年代轴方式,结合资源的年代和世界地图,让读者在拖动时间轴拨杆时,能看到北美、欧洲、中亚与南亚、东亚、拉丁美洲和加勒比海地区、中东与北非、东南亚、非洲、大洋洲和太平洋地区的资源图像随年代变化而变化,如同欣赏一条世界历史的长河,长河的头源于公元前8000年,而这条河在不断延伸,让世界人民共享历史文化的财富。
  2)最新信息
  为了让世界人民随时了解该项目资源建设的最新进展,最新信息模块以列表形式将最近新增或更新的资源展现出来,并显示WDL最新独特信息,便于让人们了解WDL的动态发展情况。
  3)资源展示
  WDL收集和发布资源,从一开始就相当强调元数据和标准规范的建设,资源展示界面是标准规范建设的成果。展示界面首先让读者看到资源图片,并提供PDF或者图片格式的文件下载,然后在右侧用统一的元数据对资源进行揭示,其元数据元素根据不同的资源而略有不同,WDL为所有需要提交资源的机构制订了标准的元数据集,共有17个元素,包括标题、描述、贡献者(包括作者、摄影师等)、出版社、出版地、创建日期、语言、地理位置(资源描述的地方)、时间、主题、资源类型(图书、手稿等)、附加主题、备注、物理描述(例如页数、大小等)、丛书题名、机构、资源在线网站等,同时这些元数据的内容通过超链接进行了关联,通过这17个元素的描述,读者对于WDL展示的资源就有了全面的了解。
  4)语言选择
  WDL网站具有七种语言来展现世界文化,包括阿拉伯语、汉语、英语、法语、俄语、西班牙语和葡萄牙语,除了葡萄牙语,其他6种语言都属于联合国官方语言,葡萄牙语则是世界语言中,应用较多的语言之一。为了提高翻译效率,工作组还使用了一个集中的翻译记忆工具,它避免了翻译人员重复翻译同样的单词或短语。另外,特别值得一提的是,WDL七种语言朗读的贴心设计,通过引入强大的语音朗读引擎,WDL的资源显示页面内容能够被朗读出来,人们不用看网页内容,只需要听即可,同时还提供了该网页朗读的语音下载,笔者聆听了某一中文简体的网页,朗读效果均属上等水平,抑扬顿挫基本符合了中国人的习惯,朗读速度也有快中慢三档选择,可见WDL项目在攻破语言障碍方面下了很大功夫。
  1.2 WDL项目进展概况
  WDL项目组专门制作了项目网站[3],以方便项目相关信息的发布,同时为了加强沟通,根据WDL章程的规定[4],该项目组每年都会举办一次“WDL合作伙伴会议和执行委员会会议”,所有参与国均派出代表参会,在会上,对项目的进展进行回顾和总结,对未来的发展进行展望。笔者有幸于2012年12月5日至6日与国家图书馆魏馆长、文化部徐副调研员共同参加了在美国国会图书馆举行的2012年WDL合作伙伴会议和执行委员会会议,获取了WDL进展的第一手资料。WDL给全体会议参与者的印象是:一年来WDL项目有较大进展,项目组做了不少工作。详细总结如下:
  1)成员机构增加
  截止到2012年11月,已经有77个国家的165个成员加入了WDL项目,其中在WDL网站上发布内容的有46个国家的89家机构,并且机构在不断增加,在将来的数月里将增加10-12家机构来提供资源。
  2)内容提升
  截止到2012年11月,在WDL上发布的资源达到了6,588件,包含了319,340幅图片,比2011年的成员会议以来增加了2,508件,增长率达到了50.3%,年底将再增加134件。而且在资源较少而意义较大的高关注度领域有了关键性进展,这些领域包括阿拉伯科学手稿、中国古籍和手稿、来自中世纪和文艺复兴时期欧洲的各类珍藏、美索美洲的法律文件等。可见在发布内容上,不管是数量还是质量,都有较大的提高。   3)帮助发展中国家的数字图书馆建设
  在WDL建立的时候,就倡导建立数字转换中心,以帮助发展中国家生产高质量图像的资源,便于WDL的展示,多年来,美国国会图书馆已与在巴西、乌干达、埃及、伊拉克和俄罗斯的合作伙伴建立了数字转换中心,2012年,WDL工作人员在帮助完善某些国家的因特网方面得到了成功,例如乌干达国家图书馆,其网络的完善才能让这些发展中国家的资源更快地在WDL网站上进行呈现。为了提高发展中国家信息工作者的信息素养,同时还尝试在卡塔尔国家图书馆建立了培训工作室,以期为中心培养更多的人才,为WDL资源建设提供更好的素材,为发展中国家数字图书馆水平的提高起到了重要作用。初步展示了WDL能协助发展中国家建立知识架构和资讯能力,以缩小“数字鸿沟”的功能。
  4)工作流的完善
  WDL的工作流是以编目为中心,对各机构提供的各种资源,依次进行内容选择、转换、处理、资源描述、元数据抽取和项目翻译并发布的全过程,工作流分别由四个相应工作组完成,即内容工作组、描述工作组、元数据工作组和翻译工作组[5],作为需要各国共同参与的巨大工程,其工作流的完善对该项目的运转起到至关重要的作用。
  成员提交资源的工作流包括内容提交、内容审核、元数据审核、发布等工作,2012年,也进行了卓有成效的工作。
  (1)资源提交
  内容提交过程包括资源提交和元数据提交,对于资源提交,进一步强调了成员在提交资源时,对所提交内容的简单介绍,以利于工作人员对资源进行快速梳理,提高了由资源提交到资源发布的效率,并有利于WDL工作组有针对性的建设重点资源等。
  2012年引入了新的资源提交方案,改变了过去成员以提交硬盘、光盘为主的方式,引入了Amazon公司的简单云存储设备(Amazon S3)方案,通过该方案,各成员实现了资源的自助提交、自助管理等功能。
  (2)资源审核
  资源审核是对成员所提交资源的内容和元数据的审核,目前增加了提交资源的审核预览功能,WDL制作了专门的资源预发布平台[6]供成员查看其提交的资源在WDL呈现的模样,当发现所提交的资源显示或者描述等有问题时,可以进行更改,这样可以提高资源的提交正确率,推动评审进程,提高WDL网站发布资源的效率。
  2 WDL未来发展
  在本次会议上,项目成员对WDL的未来发展提出了很多建议,笔者在结合相关建议进行了归纳和分析的基础上,对WDL的未来发展提出如下思考。
  2.1 创新资源存储和组织策略
  WDL项目的资源是通过各成员提交资源而得到的,所有资源都存储在WDL本地,成员负责提交资源的描述、元数据和对象数据,这种方式构建的是本地资源仓储,优点是质量较好、标准统一、访问速度最快,但缺点是资源增长较慢、对WDL项目工作组的压力过大,各成员提交资料的积极性参差不齐,另外这种方式下,只培养了伙伴机构的资源数字化能力,而其资源组织能力没有得到培养,因此笔者提出一种创新的资源采集策略,即云计算策略。充分利用云计算分布式存储和分布式部署的特点,WDL项目工作组可以协助各机构建立资源存储和管理平台,通过建立全球唯一标识符系统来实现对日益增加的机构资源平台的管理,所有的资源均分布存储在各机构中,WDL制定资源的加工组织管理标准,并为有需要的机构员工提供资源加工、组织、管理和发布的专业培训,保证每个机构都能构建本地的WDL资源平台供本地民众查看,同时WDL工作组也能够通过统一接口采集各机构的资源的元数据,元数据必备元素包括资源的缩略图和链接到对象数据的超链接,再将元数据集成到WDL主页上,这种整合方式在保留了原WDL的资源展示风格的基础上降低了存储消耗,具体优点如下:
  1)促进资源的快速增长。
  由于是各机构自主创建数据库,且资源不用实际的提交到WDL项目的服务器中,一定程度上消除了各机构对于资源流失的担忧,各机构在满足WDL要求的同时也建设了自己的资源库,从而大大提高了机构建设资源库的积极性,资源量定会得到快速增长。
  2)降低成本。
  在存储成本方面,资源都存储在不同机构的服务器上,WDL需要投入的存储资源较少;在沟通成本方面,之前的模式,WDL需要督促各机构提交资源,检查资源的质量,并需要反复审核,时间周期较长,成本较高,而若采用云计算分布式模式,WDL只需要制定统一的资源展示标准,并和各机构沟通资源链接接口,WDL项目定期自动从各机构获取最新的资源即可。
  3)提高伙伴机构的资源建设能力。
  WDL的目的之一是加强伙伴机构的能力建设,以缩小国家内部和国家之间的数码技术鸿沟。通过培训各伙伴机构建立自己的资源仓储库和发布平台,可以快速地提高其资源建设能力,推动各国数字资源建设的发展,以产生更多的资源,吸引更多的机构,扩大WDL的影响力。
  这种方式也有不足之处,首先,网络环境影响很大,由于WDL保存在本地的仅仅是元数据,对象数据需要链接到各个伙伴机构的对象数据上,网络的好坏直接影响到用户的体验效果,因此需要制定网络环境的标准,并帮助发展中国家来搭建良好的网络环境。其次,不同的国家和机构,设备和技术条件相差较大,例如落后国家的机构,没有数字化的设备、服务器等基础设施,很难短时间内搭建一个平台来提供服务。
  建议结合现有模式和云计算服务模式,扬长避短,优劣互补,推动WDL馆事业的发展。
  2.2 资源主题的扩展
  在2009年发布的WDL内容选择指南[7]中,指出WDL所收集的资料包括各国重要文史原始资源及相关元数据的数字版本 [8],可见WDL收录文献主要以收录文史方面的原始资料为主,在这次会议上,与会者对资源选择的问题进行了讨论,WDL项目主任、美国国会图书馆乌登那仁先生就指出,“现在正是需要对2009年发布的WDL内容选择指南进行再次审视的时候了[9]”。WDL在逐步实现展示各国历史文化的基础上,可以尝试全面展现各国现代文化的发展成果,如具有历史意义的科技成果、各国旅游文化等,吸引更多的读者在WDL项目上找到兴趣点、学习点,让WDL真正成为一个全面展示各国文化的重要窗口。   2.3 加强互动性
  WDL项目已经引入了web2.0的一些社会网络应用,例如wiki和twitter,各国读者都可以通过这两个应用关注和了解WDL,并与WDL进行互动,但是从WDL官方网站看,其互动性并不强,可以考虑增加用户社区功能,每种资源的描述页不仅仅显示资源的元数据,同时还显示该资源用户的关注度、排名、读者评价、读者推荐等,通过这种互动,可以挖掘到更多的资源,并形成热点专题,通过热点专题的展示,来自不同国家不同语种的资源被聚合在一起,打破了资源之间的界限,从而促进不同国家读者之间的沟通与交流,为实现WDL项目最重要的目的,即促进国际和文化间的相互理解而努力。
  2.4 WDL的wiki化,加强参与性
  WDL项目在世界维基百科上已经有了相应条目[10],世界人民可以通过该条目了解WDL,但对比WDL项目和wiki项目,我们可以发现,他们具有共同点,即均为多方合作建设的结果,因此,可以考虑WDL的wiki化,即WDL可以让各国人来参与建设,主页可以变成模块化,内容可以让读者进行修改和更正,并组织专门团队进行维护,倡导开放建设,这样的好处是可以让资源描述得更详细更准确,并在一定程度上可以解决资源描述的多语种翻译问题。
  2.5 开发移动应用
  WDL项目的资源现在还主要停留在官方网站上,在这次会议中,乌登那仁先生在其报告[11]中的未来发展部分就提出了要在手机和平板移动设备上使用WDL资源的议题。WDL可以基于苹果系统、安卓系统和windows等移动系统开发相应的应用程序,吸引更多的年轻人通过移动设备来访问WDL的资源,并与WDL工作组进行交互,这将会是一个重大的进步,是WDL市县泛在化服务的基础,为全世界读者提供无时不在的资源阅读和推送服务。
  3 总结和启发
  一年一次的WDL合作伙伴会议,项目组通报了WDL项目的进展,统一了各成员国的意见,对WDL项目未来的发展作出了展望,为推动WDL项目的持续进展起到了重要作用。WDL项目是世界项目,它为延续世界文化、促进国与国之间的文化交融为目的,各国积极参与WDL建设的同时,也可以借助此平台促进本国的数字资源建设。
  对中国的数字图书馆合作建设,WDL项目有一定的启发作用。
  3.1 标准规范建设
  WDL在项目初始就十分重视标准规范的建设,例如内容选择指南[12]、元数据描述需求[13]、数字图像提交标准[14]、命名标准[15]等,正是因为有了这些标准规范,WDL才能保证采集到高质量的数字资源,进行高效的资源整合与发布,这是我国数字图书馆合作发展的关键所在。
  3.2 资源预发布平台建设
  资源预发布平台[16]是WDL的一个颇具特色的功能,当伙伴成员提交资源后,WDL项目会为此自动生成项目ID号,根据ID号能够调出所提交资源预览界面,以利于提交资源的成员机构发现错误并进行修改,借鉴该功能,对各数字图书馆为提高资源合作的质量会有很好的效果。
  3.3 中国民族文化数字图书馆的建设
  中国是由56个民族组成的国家,少数民族的语言、文字、服饰、传统习俗等文化是我国的珍贵财富,可以参考WDL项目的模式,收藏整理少数民族相关的服饰、语言、传统习俗等文化资源,并对其进行图像、语音数字化等处理[17]。在组织上,可以考虑由国家图书馆牵头,由各地方图书馆收集所在省市县寨的各民族遗存和现存的民族文化资源,并通过统一平台发布,从而构建中国民族文化数字图书馆。
  随着WDL项目的不断发展,WDL的影响将逐步增强,不管对于发达国家还是发展中国家,都要充分利用好这个平台,宣传和推广本国的资源和文化,为世界文化的传承作出贡献。
  参考文献:
  [1] 关于世界数字图书馆:背景.http://www.WDL.org/zh/backg
  round/. 访问时间:2013-2-10.
  [2] 关于世界数字图书馆:愿景.http://www.WDL.org/zh/about
  /. 访问时间:2013-2-11.
  [3] 世界数字图书馆项目网.http://project.WDL.org/. 访问时间:2013-2-11.
  [4] 世界数字图书馆章程.http://www.doc88.com/p-219942189
  938.html.访问时间:2013-2-15.
  [5] Jason Yasner. Content Milestones and Proposed Workflow Changes. http://project.wdl.org/meeting_2012/wdl_2012_content
  _proposals_jyas.ppt. 访问时间:2013-2-12.
  [6] 资源预发布平台.http://review.WDL.org/.访问时间:2013-2-14.
  [7] 世界数字图书馆内容选择指南.http://project.WDL.org/content/contentguidelines.html.访问时间:2013-2-14.
  [8] 世界数字图书馆常见问题.http://www.WDL.org/zh/faq/.访问时间:2013-2-11.
  [9] John Van Oudenaren. Project Update.http://project.WDL.org/meeting_2012/WDL_2012_project_update.ppt.访问时间:2013-2-12.
  [10] WDL的wiki条目.http://en.wikipedia.org/wiki/World_Dig
  ital_Library.访问时间:2013-2-12.
  [11] John Van Oudenaren. Project Update. http://project.WDL.org/meeting_2012/WDL_2012_project_update.ppt.访问时间:2013-2-12.
  [12] 世界数字图书馆内容选择指南.http://project.WDL.org/content/contentguidelines.html.访问时间:2013-2-14.
  [13] 元数据描述需求.http://project.WDL.org/standards/metadata
  .html.访问时间:2013-2-12.
  [14] 数字图像提交标准.http://project.WDL.org/standards/image
  standards.html.访问时间:2013-2-12.
  [15] 命名标准.http://project.WDL.org/standards/filenaming.html.访问时间:2013-2-12.
  [16] 资源预发布平台.http://review.WDL.org/.访问时间:2013-
  2-14.
  [17] 王凤珠.世界文化的展示与交流-世界数字图书馆(WDL)网站开通及其启示.图书馆建设,2009(11).