JG
JG
嗯 , 可以, 我得学学 branch 功能, 把你修订的数据, 放一个branch, 简体中文先不维护,繁简转换并非一对一的 map 转换, 在特定的语境下, 有不同方式的转换。
多谢提醒,此数据库(JSON结构化数据)是计算机数据属于软件,仅对衍生整理的工作产物保留许可权, 包括对作品的结构化整理、标签化数据等。 在之前有讲过古典文集的版权问题: https://github.com/chinese-poetry/chinese-poetry/issues/5#issuecomment-287548257 很多同学向我索取许可权, 我不太希望自己被过多的这种事情打扰, 标注 MIT 许可协议后可以避免这个。MIT许可协议是几大开源协议最宽松的一个,初衷让更多人完全自由的使用,而没有太多限制。 任何人都不能绝对占有此份数据,我觉得 MIT 许可非常适合这份数据。 简而言之, 古诗词数据已没有版权保护, 我对古诗词做的衍生整理数据通过MIT许可分发。 如果这样做是有侵犯原作品或有不合情理之处, 欢迎指正,我可以拿掉。 目前先挂着, 此 issue 开放讨论, 后面再看。 附上 MIT 许可内容: https://zh.wikipedia.org/wiki/MIT%E8%A8%B1%E5%8F%AF%E8%AD%89
@XAS-712 CC协议限制相对 MIT 限制还是挺多的... 比较适合有版权又想分享的作品
也有因为一首诗, 对诗人感兴趣的。 虽然此数据库很庞大, 但大多数人不需要这么多, 其他未收录的作品集不再考虑是否齐全(通过后续维护补充), 而是偏重作品集的质量, 能够让数据更有吸引力(尽可能采取更多的维度)。
#30 有讨论, 而且目前古诗(唐诗和宋诗)已经加上一部分tag。 会尽快加上宋词的tag。
@jtian0 感谢, 学习了新的规范, 请问这种有对应的表吗? 我个人比较倾向于这种规范的标示方式, 可能需要一个一个的翻译并替换。
我统计了一下全篇大概有5000+处 这种表现手法,排重后2124处, 发现一些和IDC 转换的规律, 但不确定。 ``` {罒/離} => ⿱ {山/敖} => ⿱ {赤皮} => ⿰ {雨/對} => ⿱ ``` 但是还有一些其他的可能确定 如 ``` {椃几=旦} {氵麻}溪} {下爲火} {右上爲尤} {兩字左均加兀} ``` 不知道目前这种表现方式`{罒/離}` `{赤皮}`有没有规范,...
感谢提供, 如果作为采集源一定按照要求采集。
你好 有什么建议吗? 可否详细说下
还需要进一步考证研究。