zhongwencm
zhongwencm
例如 在唐和宋的作者文件中都出现了. 1. 作者应该作为一个实体. 确保 唐诗 和 宋诗 中他写的诗都能链接到同一个作者实体 2. 把作者当成一个实体看待.那么应该合并2个作者文件. 可以增加相应的标记.标明他属于 唐 或(/和) 宋. 唐 和 宋 只是这个作者的属性. 感觉历史学相关的应该有一套比较好的方法 3. 诗是否应该也作为一个实体? 它是由某个作者在某个时间点在某个地点写成. 它可以出现在或, 这些也都只是它的一个属性
绝大多数重名为同一人. 少部分确实为多人. 需人工鉴别 ```json [ { "幸夤遜": [ { "desc": "幸夤遜,夔州雲安監(今四川奉節)人,一說成都(今屬四川)人。仕後蜀,累官至工部侍郎,知簡州。入宋,授右庶子。太祖開寶五年(九七二),爲鎮國軍行軍司馬。年九十餘而卒。《宋史》卷四七九、《十國春秋》卷五四有傳。今錄詩三首。", "name": "幸夤遜", "id": "ca5f66d8-dee4-4341-bdd8-8d4696f1261a" }, { "desc": "幸夤遜,夔州雲安監人一云成都人。仕後蜀,爲翰林學士、工部侍郎,隨昶入宋。詩一首。", "name": "幸夤遜", "id": "b5c5c12e-3c6b-4345-a5b8-f80832d623c0" } ] }, { "朱存": [ {...
最近想在项目中使用. 看了下数据. 有些建议和发现一些错误. 希望能给每个条目增加一个UUID作为唯一的id值. 好处有很多. 1. 事实上.无论是作品条目还是作者条目都有可能会出现错误或缺漏. 添加id后. 相应的修复可以很方便的定位. 在实际项目中会很实用. 可以迅速更新相应的条目. 也方便他人发现错误时进行报告修改. 2. 最好可以增加相应的条目修改 history文件. 注明id即可. 也是方便实际的项目实用及溯源 3. 作品条目可以增加一个作者id. 增强关联性及解决部分问题 4. 用代码过了一遍数据. 作者json文件大概有几十个条目有问题. 名字为单字.如 "王" 等. 查看数据.其有传.可以根据传来确定实际名称. 5. 部分作者重名.且都没传.部分是名字为单字错误导致. 可以修正错误后.清洗无效数据.保持数据的正确性....