dp2 icon indicating copy to clipboard operation
dp2 copied to clipboard

系统配置:关于 997 查重字段

Open paopaofeng opened this issue 7 years ago • 2 comments

997 字段,里面存储了一个唯一性的查重键值。当任何书目记录保存的时候,都要先自动在服务器端产生这个 997 字段,然后对所有数据记录进行检索查重,不重的才让保存。这个新特性是配置了才启用的,默认是不启用,以兼容以前的不查重的效果。

这项查重机制一旦启用,就是必须保证新增 MARC 数据与已有数据不重复才可以保存,要求比较很严格了。这样可以有效改变目前大部分用户单位书目记录重复严重的局面。如果以前的记录已经发生重复了,它们必须要归并以后,只剩下一条才让修改,所以 dp2内务 也提供了一套对比修改记录的机制。

在导出 MARC 数据时,如果不需要含有 997 字段,可以在导出过程中过滤掉该字段。

paopaofeng avatar Aug 23 '18 02:08 paopaofeng

如何为书目记录创建 997 字段

(注:这里是介绍如何创建 997 字段。当书目记录都有了 997 字段以后,还需要在 dp2library 的 library.xml 配置文件中配置 unique 元素,才能启用自动查重功能)

一般新安装的 dp2library 服务器,如果是用内务前端导入的书目记录,会自动为记录创建 997 字段,不需要额外的操作。

而一些旧版本时期创建的书目记录,或者是从 dp2batch 导入进入书目库的记录,就缺乏 997 字段。那么就需要为它们创建 997 字段。

操作方法如下:

  1. 准备工作。如果 dp2library 是很早就安装的,可能书目库的检索点配置文件里面没有定义查重键这个检索点。需要专门针对所关注的书目库执行一次刷新检索点的操作(用内务系统管理窗)。较新安装的 dp2library 不需要做这个操作。可以用内务的“书目查询窗”观察一下是否已经具备了“查重键”这个检索途径,如果已经有了就不需要刷新书目库的检索点了。

  2. 启动内务前端,打开“功能/系统维护/批处理任务窗”;

  3. 选择“重建检索点”任务,点“开始”按钮,启动这个任务;

  4. 在“启动重建检索点任务”对话框上,选择功能为“重建查重键”。然后在“数据库名”文本框中输入要重建查重键的书目库的名字,如果有多个书目库,每行输入一个数据库名。

在批处理任务窗左下角点工具条按钮“一直显示进度”,这是一个 On/Off 状态按钮,让它保持按下状态,就可以看到窗口中持续显示批处理任务进度。等批处理完成。

DigitalPlatform avatar Aug 02 '19 07:08 DigitalPlatform

997 完全相同的两条书目记录,如果需要共存

可以手动在 998 字段内容创建一个 $k 子字段,输入足以和另一条记录区分的内容,比如版本号或者注释文字,这样书目记录就可以保存了。

原理:dp2library 检查两条记录之间是否重复的时候,是利用 997$a 内的查重键来比较的,查重键的算法,除了包含一些关键字段子字段内容,它最后也包含了从 998$k 抽取的特殊区分字符串。

DigitalPlatform avatar Mar 17 '22 07:03 DigitalPlatform