您的位置:首页    学术交流    年会    2014年会专辑

2014中国图书馆学会年会第22分会场:机构知识库建设渐成大数据环境下学术机构关注热点

时间:2014-10-16

高校、研究所等学术研究机构不断产生海量的学术信息资源,这些信息构成了机构最重要的组织财富,对于科研和学术意义重大。机构知识库是伴随着开放获取运动而兴起来的,可以有效的获取、存档、管理和利用机构产生的信息资源。然而,在当今的大数据环境下,我们应该怎样定位机构知识库?机构知识库要如何构建并且怎样才能为学术研究工作提供更好的服务?业界对此一直没有提出明确的概念和想法。

为了弄清上述问题,进而促进学术交流传播和学术繁荣,1011日,来自清华大学、北京大学和全国各地图书馆机构的专家学者齐聚北京,参加2014中国图书馆学会年会,并围绕“大数据环境下机构知识库的构建与服务”这一主题进行了热烈探讨。

重“数量”到重“服务”

机构知识库不是“档案”数据库

ROAR注册机构库统计,截止到2014102日,包括台湾、香港和澳门地区,全国共有89个注册的机构知识库。而以美国为代表的北美洲有782个,以德国、英国为代表的欧洲已经建有1315个机构知识库。

清华大学图书馆馆长邓景康认为,国内的机构知识库建设相比欧美还有很多不足。除了数量上的巨大差距,学者的认知度、建设规模、服务力度等仍处于摸索建设阶段,还没有进入稳定成熟期。造成差距的原因,除了缺乏清晰明确的政策说明之外,更多的是在理念上。以图书馆为主导的信息服务机构应立足于“服务”角色,这也是图书馆生存最重要的优势。

人民大学教授周晓英对此表示认同,她站在一个机构知识库使用者的角度,指出了当前国内机构知识库发展存在的问题。她认为:机构知识库不应是一个储存资料的“档案”数据库,机构知识库的构建与服务要取得成效应该摈弃数据库的模式,成为一个立足服务角色面向应用的跨界开放平台。

“小作坊”到“大工厂”

强强联合保证机构知识库规范构建

清华大学图书馆馆长邓景康指出,以往科研人员管理自己的学术成果,往往通过在密密麻麻的文档内“数数”来完成,还处在“手工作坊”的阶段,缺乏规范的管理。

据同方知网创新公司总经理薛德军介绍,在当前的大数据时代,最重要的特点就是数据量的大规模增长,例如淘宝的用户数据,知网的文献数据和用户检索数据等。知网通过基于XML碎片化技术实现了数据的PB量级,通过深度挖掘服务建立数据间的关联,保证了知识库的规范性。

北京大学图书馆馆长朱强认为,机构知识库的建设是一个需要多方合作,循序渐进的过程。机构知识库的构建需要联合合作,互相帮助进行资源的共享。薛德军对此表示认同,他指出图书馆等机构自己建设机构知识库需投入相当的人力、资金和设备,并且要花时间进行运营和维护。薛德军建议,可以借助中国知网的大数据出版来帮助图书馆进行机构知识库的建设。整合知网20年来的2亿多篇数据库文献,和机构自建资源库及学者的个人资源,通过深度标引和个人认领来存缴资源,并通过平台化来提供云服务。

薛德军表示,中国知网实现了中外文之间的引文关联,数据和资源的完整率达到95%以上,保障了资源和服务的持续性。经过机器辅助加人工编改每一条记录,使得数据的准确率高达99%。中文数据做到日更新,外文数据定期更新,通过知网公有云加机构私有云的建设模式进行资源的定期推送。

转载: