最新文章
·爱拼才会赢:2004台湾...
·lenovo3000的国际顶级...
·假如用友和金蝶合并…...
·【独家】指斥消费者利...
·【牛哄哄】windows经...
·“一搜”:MP3搜索引...
·服务器市场趋势“租多...
·IT会计核算体系关键成...
·台DC代工厂:08年全球...
·渠道上演乾坤大挪移
·【牛哄哄】笔记本还是...
·情侣共享,声色俱“丽...
相关文章
·亚洲CeBit5月11日开幕...
·联想提前弃用IBM品牌I...
·让人才为你的“质量”...
·掌控:2006年国内手机...
·戴尔服务遭质疑
·第十五届中国国际自行...
·99元溜溜MP3魔法在线...
·九城公司在纳斯达克挂...
·2005 信息化运营商视...
·环境如何拗得过经济3
·《财富》:微软的门户...
·朱立军:中国宽带普及...
推荐文章
·99元的MP3要不要买
·泛微渠道拓展升温 推...
·海尔吸油烟机首批获“...
·《知识经济》:红旗降...
·时尚VIKA合作之《时尚...
·BBC北美来鸿:电子垃...
·微软图形渲染再爆严重...
·想要唱衰联想 戴尔你...
·【我与网吧征文】网吧...
·从QQ到QQLive,谁能挡...
·TOM科技:把工作留在...
·坚守IT的智慧
  您现在的位置: 休闲居 >> IT时代 >> IT风云 >> 

远离信息泥潭(2003-03)
作者:软件工程师  人气: 【字体:大 中 小】
  发布时间:2006-08-24 17:25:50

远离信息泥潭

如果不在知识体系和科学管理上多下些功夫,未来我们会不会被信息的泥潭所淹没?休 闲 居 编 辑

 

文/杨龙江(山东东营)

很多人都有在图书馆查询资料、检索信息,在一排排书架中倘佯的体验。而今天,互联网的出现令内容无限、图文并茂、无边无界的“数字图书馆”成为可能。20世纪90年代以来,随着计算机技术和数据通信技术的飞速发展,信息检索正面临着时代变革所带来的严峻挑战,同时也迎来了难得的发展机遇。在信息载体数字化和信息传播网络化的推动下,数字图书馆检索应运而生并逐渐成为各国竞相投入的一个热点。数字图书馆的呼声此起彼伏,业内人士言必称数字,好像数字检索近在咫尺,而图书馆建一网站或是拥有一些电子出版物,或是将部分特色文献扫描一遍便成了数字图书馆。时下数字检索的热潮,玩的多是“数字”,是概念,有谁会多考虑一下检索,多为用户想想呢?

技术固然重要,但它再重要也是载体,对信息优化管理、对人文、对完善知识体系的忽视只会让使用者慢慢冷却,渐渐远去。信息检索不能陷入技术的怪圈中,笔者想提醒人们在进行数字图书馆的建设时,不仅要注重引进和吸收关键技术、加强标准化研究、重视人才和知识产权保护等等,更重要的是要注重于人性和科学管理。

偏正词组还是联合词组?

IT界是一个热点不断的领域,DOT-COM、宽带、.NET……你方唱罢我登场,每一个名词背后都潜伏一股狂热的理想与激情。热潮之后,又常有事后诸葛亮似的反思。那么,在“数字图书馆”的概念趋升之际,是否有必要重新审视一下其理论,为它的发展奠定一个更为坚实的基础呢?现在看来,参与数字检索技术讨论和研究的主要是一些计算机界的人士,论题也大多在技术领域展开,这种情况非常类似当年的“DOT-COM”热潮。当时的潮头人物均为IT界中人,于是他们多谈互联网,多谈“电子”,忘了“电子商务”这一名词中还有不可忽略的“商务”一词。那么,在“数字图书馆”这一名称的背后,除了“数字”一词,我们是不是也应更多关注一下“图书馆”呢?“数字图书馆”到底是一个偏正词组还是联合词组?

互联网的主体毕竟仍然是人,是由人来组织管理并为人来服务的。那么,一切都应围绕人来服务。“数字图书馆”所要满足的,正是人未来对知识的渴求。

数字、图书馆,以及数字图书馆

技术日新月异,未来的几十年,到底人们会使用一种什么样的传输方式来选择、接收自己所需的信息,是电话还是移动终端,或者其他载体?这一问题似乎连未来学家都难以预测。但有一点是不会改变的,那就是人类对知识的需求。相信每个网友在网上都有过这样的阅读经历,在超级链接的指引下会不知不觉离原本关注的问题越来越远。早在1997年,就有学者撰文谈“数码复制时代知识分子的命运”,反思了互联网时代的知识获取方式,文章提及在使用一个光盘版百科全书时发生的情形:本来是要查“小说”这个条目,但顺着超级链接一路点下去,最后居然链到了“切腹自杀”这一条目。在数字图书馆的建设方面,这是属于知识体系层面的结构性问题。目前,我们关注数字检索多偏于技术方面,如果不在知识体系和科学管理上多下些功夫,未来我们会不会被信息的泥潭所淹没?

很显然,未来知识的获取并不仅仅是将众多的知识条目网状结点化所能完成的。某种既可以手动查看也可以自动播放,兼有跳转、翻页、检索等功能的软件学习方式固然方便,但它只是手段而非目的。未来世界的信息量呈爆炸性增长,目前已经有网民感慨无序的信息让人难以捕捉到自己的需要。如何考虑信息的精细加工与结构调整才是亟待解决的问题。从当前的检索手段即可以明显看出弊病:如果在互联网上检索“数字图书馆”一词,当前的检索引擎通常这样运作——把“数字图书馆”切分成“数字”和“图书馆”,凡是与“数字”、“图书馆”、“数字图书馆”有关的条目都会检索出来,但其实这些并不都是用户所需要的,反而会错过真正需要寻找的信息。从这个过程我们能够看到,海量数据的检索效率与速度是数字检索系统面临的最大问题。尤其在用户提出的关键词的关联性不是很强,其组合方式又很初级的时候,这种检索会花很长时间。美国有人做过试验,在1TB的信息系统使用简单的全文检索测试,用了6个小时才检索到满足用户要求的结果。因此我们急需新型信息管理模式加以组织,以加快搜索速度,才能避免陷入信息泥潭的危险,并且使检索出的信息真正为用户所需。

信息处理,以人为本

今后的数字检索技术对不同的内容,需要不同的分类体系和索引机制。而能否制定一个比较好的分类方法和索引机制,将直接影响到后续工序能否开发出一个比较好的检索工具。成功有效的搜索需要对资源进行有效的组织,目前通常的信息组织方法是将信息分为元数据和对象数据,利用元数据的共享,使得各种查询工具可以充分地发挥作用。这种方法的好处是,充分利用对于信息的分类和特征的描述来构造某些信息的特征数据,这些数据称为“元数据”,然后共享这个元数据,查询系统在元数据库中寻找满足用户要求的信息,可以实现更多元数据的共享。同时,为了满足人们利用互联网提供的服务便捷地学习和创造,迫切需要大力建设网上的优质信息资源,使得互联网真正成为人类进步的加速器。

对数字检索系统信息资源的数字加工、存储与传输技术研究的成果现在已经有许多。不可否认,对数字图书馆在技术方面所能达到的是建立一个把数字化信息、互联网、用户和服务商集成在一起的信息环境,其信息存储结构经过优化,形成一个虚拟分布的、有组织、有结构的信息集合。但为用户提供一个一致的检索接口,实现跨信息平台和存储地的无缝查找,并根据用户的定制信息需求,提供基于内容的智能化访问和报送服务,亦是急待解决的战略性问题。同时我们也希望,技术以人为本不致成为一句空话,对信息的处理将以人而非技术为对象展开,愿技术的双刃剑不会让我们承受另一种意外的繁琐。

 

虽然数字图书馆是热门话题,其建设声势浩大,但是我们应该清醒地看到,实现数字检索是一个庞大的社会系统工程,处理不好,就会产生负面的影响。

数字检索系统的建设是一个相当长的过程,数字图书馆和传统图书馆也会互相融合、相互补充、共同发展。数字检索具有很多优势,可以为用户提供多种服务。同时,将会根本改变国家科技、文化信息资源的保存、管理、传播、使用的方式和手段,克服信息资源不能有效利用和共享的弊病,为知识传递和知识创新营造一个良好的环境。

重点提示:

技术固然重要,但它再重要也是载体,对信息优化管理、对人文、对完善知识体系的忽视只会让使用者慢慢冷却,渐渐远去。我们也希望,技术以人为本不致成为一句空话,对信息的处理将以人而非技术为对象展开,愿技术的双刃剑不会让我们承受另一种意外的繁琐。

 

背景链接:关于数字图书馆

所谓数字图书馆,就是指图书馆各种载体的文献资源都要借助于“0”和“l”两个元素进行数字化处理、存贮和传输,即指对具有高度价值的图像、文本、语言、音像、软件等多种数据、信息进行收集,组织规范性的加工,进行高质量保存和管理,实施知识增值,并提供在广域网上高速跨库连接的电子存取服务,同时还包括知识产权、存取权限、数据安全等范畴,即超大规模的、可跨库检索的海量数字化信息资源库。

数字图书馆建设以统一的标准和规范为基础,以数字化的各种信息为底层,以分布式海量资源库群为支撑,以智能检索技术为手段,以宽带高速网络为传输通道,将丰富多彩的多媒体信息传递到各种用户。这一概念最早出自欧美,在美国,数字图书馆是政府倡导的信息高速公路计划的重要组成部分,也是1993年美国提出“国家信息基础结构(N11)”和“全球信息基础设施(G11)”行动计划的重点。美国己率先在这一领域开始了工程性研究。

数字图书馆已成为国际高科技竞争中新的制高点,同时已经成为当前评价一个国家信息基础水平的重要标志,是近年来发达国家十分重视的基础性项目。我国政府也非常重视数字图书馆工程的建设,其理论阐释早已开始,图书情报界和IT界也陆续组织了有关数字图书馆的研讨活动,对数字图书馆的体系结构、检索技术以及著作权等问题进行了详细的论述。

≡ 查看、发表评论 ≡