dp2 icon indicating copy to clipboard operation
dp2 copied to clipboard

如何导入书目转储bdf文件

Open lunvo opened this issue 7 years ago • 2 comments

有了书目转储bdf文件之后,可以通过 批处理\从书目转储(.bdf)文件导入系统。

导入系统之前,要注意确认一下几点:

  1. 要导入的信息中包含哪些书目记录下属记录。比如:册记录,订购记录,评注记录,对象 等。是否都需要导入。导入前要预先设置。

  2. 所导入的册记录的册条码是否会与系统中已有的册记录相冲突。如果大范围冲突,是否有必要导入前勾选“为册条码号增加随机后缀”选项。

  3. 所导入的册记录中是否存在条码冲突的记录,如果有,重复的是否需要导入。如果要导入,要勾选为遭遇重复的号码自动添加后缀”选项,给重复的册条码添加后缀后导入系统。

  4. 目标服务器中导入的书目库是否具备接受数据的能力。bdf中所包含的数据可能有实体,期,评注等信息,要求所导入的书目库也要具备这些下属库,才能使导入顺利进行。

操作步骤

  1. 登录dp2内务,点菜单 批处理\从书目转储(.bdf)文件导入,打开 从书目转储(.bdf)文件导入 窗口。

  2. 在 源文件 选项卡,指定书目转储文件名,必须是.bdf文件格式。

    如果在导入书目信息的同时,需要一起导入书目附带的册信息、订购信息、期信息、评注或对象信息。可以根据需要,勾选 册、订购、期、评注或对象 复选框。

    另外,还可以设置导入记录的范围,例如:输入 0-9,表示导入第1条到第10条书目记录。注意,这里用的是物理顺序号,从 0 开始。这个范围字符串可以支持这样的形态:1,3,5,7-9。

    源文件 选项卡设置好之后,点 下一步(N) 到 转换 选项卡。

  3. 在 转换 选项卡,可以根据需要对源文件的数据进行转换设置。

    勾选 为册条码增加随机后缀(以避免转入的数据和系统内的册条码重复),导入时,会为册条码增加随机后缀。

    勾选 为册记录添加书目信息元素,导入时会为册记录添加书目信息元素。导入完成后,可以在册窗的 XML 选项卡,查看册记录的书目信息元素 biblio。

    勾选 为合并的册记录添加书目信息元素,导入重复书目时会为合并的册添加书目信息元素。导入完成后,可以在册窗的 XML 选项卡,查看合并的册记录的书目信息元素 biblio。

    勾选 重新生成参考ID,为了避免导入过程由于参考ID重复导致导入不成功。

    输入 册记录批次号,一般填写当日时间的批次号,比如20181029。

    点 从数据中获取馆藏地,初始化馆藏地转换表 ... 按钮,系统会收集数据,并且将源文件中的馆藏地列举出来,可以根据需要修改目标馆藏地,但是要使用系统中存在的馆藏地。建议:bdf导入之前,根据需要先配置好馆藏地。

    转换 选项卡设置好之后,点 下一步(N) 到 目标库 选项卡。

  4. 在 目标库 选项卡,可以指定目标书目库,设置记录路径,并且可以模拟数据导入。

    从下拉列表中选择 目标书目库名。注意,必须是系统中创建好的书目库名称。另外,目标书目库和源书目库的marc格式必须保持一致,才能成功导入。

    <使用文件中的原书目库名>:支持用户从bdf文件的多个书目库导入到系统多个同名的书目库,前提是在系统创建好同名的书目库。 假设bdf文件中有两个书目库:党史、文献,在系统中创建好两个同名的书目库:党史、文献。导入的时候,目标书目库名 选择 <使用文件中的原书目库名>,就可以把数据分别导入到两个书目库。

    勾选 为遭遇重复的号码自动添加后缀,表示当 dp2library 创建册记录的时候,如果发现册条码号或者登录号发生重复,则自动为号码添加一个随机的后缀字符串,以便创建操作能顺利完成。但为了引起系统管理员注意,这种被服务器改变过号码字段内容的册记录,其状态(state)字段也会被自动添加一个值“数据错误”。

    勾选 恢复到原先的记录ID,则导入到系统的书目记录路径,会与bdf文件中的书目记录路径保持一致,不作修改。

    在正式导入之前,可以点 模拟导入 按钮,模拟数据导入,此时数据并没有真正导入到系统。

    点 下一步(N) 正式导入数据。

如何处理重复书目记录

如果系统配置好了查重空间,正式导入的过程中,遇到marc数据有重复,系统会弹出 处理重复书目 对话框。

对话框的底部提供了 4个功能: 合并到...、创建新记录、跳过 和 自动选择。

处理重复书目 对话框,点 合并到...,弹出 请指定合并方式 对话框。 用户可以根据数据质量,选择 marc源文件 或者 目标 marc文件,如果选择 源,则书目采用的是bdf导入的新的marc数据,如果选择目标,则采用的是原来书目库里面的书目marc数据信息。

处理重复书目 对话框,点 创建新记录,则会在系统创建一条新的书目记录,并且为书名增加随机后缀。

处理重复书目 对话框,点 跳过,则忽略该条重复记录,不作导入。

处理重复书目 对话框,可以选中 自动选择 来批量处理重复书目记录。 1)点中 自动选择,如果再点 合并到...,弹出 指定合并方式 对话框, 选择采用源或者采用目标,点 确定 后,后面所有的操作,都会按照前面选择的来做,即一直选择源,或者一直选择目标。

2)点中 自动选择,如果再点 创建新记录, 第一个操作会创建新记录,后面所有的操作,都会按照前面选择的来做,即创建新记录,不再逐条提示用户。

3)点中 自动选择,如果再点 跳过, 第一个操作会跳过,后面所有的操作,都会按照前面选择的来做,即跳过,不再逐条提示用户。

通过“Ctrl键 + 从书目转储(.bdf)文件导入”打开bdf文件导入窗口

点菜单 批处理,按住Ctrl键的同时,点 从书目转储(.bdf)文件导入,打开 从书目转储(.bdf)文件导入 窗口。 此时,切换到 目标库 选项卡,可以看到三个选项: 勾选 不查重,导入过程碰到重复的册记录,系统不会弹出提示。

勾选 不写入操作日志,从bdf文件导入的过程不会写入操作日志。采用这种方法,可以避免产生大量无用的日志影响系统运行效率。

勾选 不修改operation元素,导入完成后,operation元素显示bdf文件的内容,不作修改。

lunvo avatar Nov 28 '18 03:11 lunvo

增加 “为遭遇重复的号码自动添加后缀”

在“目标库”属性页,增加了“为遭遇重复的号码自动添加后缀” checkbox。若勾选了它,表示当 dp2library 创建册记录的时候,如果发现册条码号或者登录号发生重复,则自动为号码添加一个随机的后缀字符串,以便创建操作能顺利完成。

但为了引起系统管理员注意,这种被服务器改变过号码字段内容的册记录,其状态(state)字段也会被自动添加一个值“数据错误”。导入结束后,系统管理员可以用实体查询窗检索这个状态值,调出这些册记录进行适当修改处理。

如果不去修改处理这些状态为“数据错误”的册记录,则这些记录所代表的册在借书操作时会被拒绝。

这个功能要配合 dp2library 3.10 或以上版本使用才有效。

此参数和“为册条码号增加随机后缀”的区别

“为册条码号增加随机后缀”,是内务前端主动给发出(保存)的册记录的册条码号字段增加随机后缀。所有册记录,不管其条码号是否会发生重复,都加了后缀字符串。

而“为遭遇重复的号码自动添加后缀”是一种 dp2library 服务器端的试探性功能。内务前端发出的记录中的册条码号并没有加后缀,和 .bdf 文件中的形态是完全一样的。只是到了服务器一端,服务器先进行查重,如果没有遇到重复,则原样保存这条记录;如果遇到了重复,才会修改记录中的号码然后保存。

但使用“为遭遇重复的号码自动添加后缀”,毕竟是一种竞争状态,或者说是丛林法则的争抢号码的操作,要注意使用是否合理。比如,两个分馆本来有明确的号码空间范围,那就应该首先遵从这个范围规定,而不要试探性地使用这个功能。“管他三七二十一反正导入了就行”这种做法是会带来很多问题的。可能会让原本合法的一个分馆的号码被抢走,自己反而用不了该用的一些号码了。

DigitalPlatform avatar Dec 01 '18 13:12 DigitalPlatform

2018/12/02

这个功能挺好,正在我想要的,仅对重复的册条码或登录号增加后缀,这样最后在系统里也方便过滤出问题记录;而不是全部加了后缀,区别不出来原来不重复和重复的。

适用的场合不同。比如某馆的案例,另外两个分馆的号码空间明显侵入了原馆的号码空间,这时候就要给它们全部都加上后缀。如果改用新功能,则就会变成丛林法则,后面原馆自己的新书号码就会遇到被占的情况。

所以新功能是给那些偶尔重复的情况。而不适用于明显号码空间被入侵的情况。

那某馆还是以为导入数据的册条码全部增加后缀的方案。

renyh avatar Dec 10 '18 13:12 renyh