dp2 icon indicating copy to clipboard operation
dp2 copied to clipboard

书商编目:一条MARC数据多种编目规则

Open renyh opened this issue 7 years ago • 3 comments

原始数据 样例

image

规则标注说明

image

如果某字段或子字段仅属于特定规则,在前面加前缀{cr:***} {cr:CALIS},表示仅符合 CALIS 编目规则的数据。 {cr:NLC} 表示仅符合国图编目规则。 cr 的意思是 cataloging rule,编目规则的意思。 如果不加{}前缀,表示CALIS与国图都适用。

前缀{cn:}处在 字段指示符 后面,第一个子字段出现以前的位置,表示 整个字段 仅符合指定规则。 前缀{cn:}处在 子字符指示符 后面,表示该 子字段 仅符合指定规则。

按不同规则导出

image

renyh avatar Oct 24 '18 12:10 renyh

如何把导出操作和其他流程紧密结合起来。通过书目查询窗检索一定批次的记录导出,这个操作针对书商这样的大批量加工和提供数据的单位是不合适的,操作起来很细碎很麻烦。

我们设计了一种流程,就是假定书商的车间,把图书馆目标客户,按照 dp2 系统的分馆或者不同馆藏地来定义。比如书商有十个图书馆客户单位,就可以定义十个“馆藏地”。这些馆藏地用图书馆的名字命名就可以。

这样,在书目数据加工的阶段,除了加工好这条 MARC 书目记录以外,需要编目员在种册窗的册属性页,做一个模拟的“册登记”操作,假装让这个图书馆登记得到了这种图书,数量一本就可以。后面我们可以开发一个快捷键,操作很方便,瞬间就登记了,不需要和真的图书馆操作一样填写什么册条码号。其实只需要一个馆藏地字段就可以。 (注:如果书商针对每个用户单位都册登记一笔工作量太大的话,也可以考虑从书商的 ERP 系统中导出订购单位的名称列表,然后通过dp2的API自动为这些订购单位的名称做一笔册登记,增加到书目记录下面。dp2 系统有册登记的API,整合开发量不大。)

这样,准备工作做好以后,就可以利用册统计窗,开发一个非常简单的统计方案。这个统计方案,开始询问,图书馆名字?输入或者选择以后。统计方案开始自动批处理。它实际上从册记录中反向查到那些书目需要导出。

然后,根据一个预先配置的图书馆名字和编目规则的对照表,一个小小的文本文件就可以,最终得到是 CALIS 还是 NLC 这样的字符串名字。然后就可以调用刚才我说的过滤函数,处理一下 MARC 记录,然后就写入 ISO2709 文件了。整个过程非常自动化,常年使用,能大大节省书商数据加工团队的工作量。

因为一条 MARC 记录,主要的部分是没有差异的,只有一些字段,国图和 CALIS 有微小差异。这样的小代价是值得的,比复制出来修改要强。


这种流程如何具体操作?包括书商为不同用户配置不同的馆藏地,做虚拟的册登记,馆藏地与编目规则设置对应关系,书商为用户导出数据时直接导出对应规则的数据。

renyh avatar Oct 24 '18 13:10 renyh

根据册记录导出它们从属的书目记录,并自动按照编目规则过滤 MARC 记录

  1. 启动内务前端。打开用户文件夹,创建一个名为 cataloging_rules.xml 的 XML 文件。内容如下:
<?xml version='1.0' encoding='utf-8'?>
<root>
	<location name="北方大学" catalogingRule="NLC" />
	<location name="南方大学" catalogingRule="CALIS" />
</root>

注意实际的文件编码方式应该和 XML 文件 prolog 的声明一致。location/@name 属性要根据实际情况配置。配置工作只需要做一次即可。只对这一台前端机器管用。如果其他前端机器也要用导出功能实现按照不同编目规则自动导出,那需要复制过去这个文件。

  1. 在实体查询窗里面检索命中一批拟导出书目记录的册记录。检索命中的是册记录,后面即将导出的是这些册记录所从属的书目记录;

  2. 浏览列表中,上下文菜单使用命令“导出/将所从属的书目记录导出到 MARC”。按照提示操作即可。


注意一种特殊情况,就是当浏览框中要参数批处理的册记录,倘若有两条以上属于同一条书目记录,软件只会合并导出一条这样的书目记录。所采用何种编目规则,是使用处理时候遇到的第一条册记录的馆藏地对应的那种编目规则。

如果不需要按照特定编目规则过滤导出,目前只能是删除用户目录下的 cataloging_rules.xml 文件。这时导出对话框会出现选择编目规则的组合框。(后面这里可以改进一下)

DigitalPlatform avatar Oct 24 '18 15:10 DigitalPlatform

2018/11/1-ryh测试:配了cataloging_rules.xml文件后,导出书目的格式为册记录馆藏地对应的编目规则,不需要手动再选择编目规则了。

renyh avatar Nov 01 '18 12:11 renyh