系统配置:关于 997 查重字段
997 字段,里面存储了一个唯一性的查重键值。当任何书目记录保存的时候,都要先自动在服务器端产生这个 997 字段,然后对所有数据记录进行检索查重,不重的才让保存。这个新特性是配置了才启用的,默认是不启用,以兼容以前的不查重的效果。
这项查重机制一旦启用,就是必须保证新增 MARC 数据与已有数据不重复才可以保存,要求比较很严格了。这样可以有效改变目前大部分用户单位书目记录重复严重的局面。如果以前的记录已经发生重复了,它们必须要归并以后,只剩下一条才让修改,所以 dp2内务 也提供了一套对比修改记录的机制。
在导出 MARC 数据时,如果不需要含有 997 字段,可以在导出过程中过滤掉该字段。
如何为书目记录创建 997 字段
(注:这里是介绍如何创建 997 字段。当书目记录都有了 997 字段以后,还需要在 dp2library 的 library.xml 配置文件中配置 unique 元素,才能启用自动查重功能)
一般新安装的 dp2library 服务器,如果是用内务前端导入的书目记录,会自动为记录创建 997 字段,不需要额外的操作。
而一些旧版本时期创建的书目记录,或者是从 dp2batch 导入进入书目库的记录,就缺乏 997 字段。那么就需要为它们创建 997 字段。
操作方法如下:
-
准备工作。如果 dp2library 是很早就安装的,可能书目库的检索点配置文件里面没有定义查重键这个检索点。需要专门针对所关注的书目库执行一次刷新检索点的操作(用内务系统管理窗)。较新安装的 dp2library 不需要做这个操作。可以用内务的“书目查询窗”观察一下是否已经具备了“查重键”这个检索途径,如果已经有了就不需要刷新书目库的检索点了。
-
启动内务前端,打开“功能/系统维护/批处理任务窗”;
-
选择“重建检索点”任务,点“开始”按钮,启动这个任务;
-
在“启动重建检索点任务”对话框上,选择功能为“重建查重键”。然后在“数据库名”文本框中输入要重建查重键的书目库的名字,如果有多个书目库,每行输入一个数据库名。
在批处理任务窗左下角点工具条按钮“一直显示进度”,这是一个 On/Off 状态按钮,让它保持按下状态,就可以看到窗口中持续显示批处理任务进度。等批处理完成。
997 完全相同的两条书目记录,如果需要共存
可以手动在 998 字段内容创建一个 $k 子字段,输入足以和另一条记录区分的内容,比如版本号或者注释文字,这样书目记录就可以保存了。
原理:dp2library 检查两条记录之间是否重复的时候,是利用 997$a 内的查重键来比较的,查重键的算法,除了包含一些关键字段子字段内容,它最后也包含了从 998$k 抽取的特殊区分字符串。