nbnhhsh icon indicating copy to clipboard operation
nbnhhsh copied to clipboard

考虑不依赖后端服务器而使用本地的数据集

Open jim-kirisame opened this issue 4 years ago • 20 comments

当前这个脚本还需要后端服务器配合,是否会考虑出一个离线版本(带有本地数据集)?

jim-kirisame avatar Mar 25 '20 14:03 jim-kirisame

这样就可以在github用pr提交词库了

LovelyCatHyt avatar Mar 25 '20 15:03 LovelyCatHyt

离线版是好东西🤔这样就可以避免服务器参与转义了。

@LovelyCatHyt 词条管理这里还是考虑到方便与否,最终还是做了个后端+管理界面🤣

itorr avatar Mar 27 '20 15:03 itorr

赞同 就像 caniuse 那样可以提供完整的 json 文件 顺便还可以写一个转换函数发布到 npm 方便供其他任何项目使用

u3u avatar Mar 30 '20 03:03 u3u

一定要有后端才能有管理界面吗。

Crystal-RainSlide avatar Mar 31 '20 18:03 Crystal-RainSlide

@Crystal-RainSlide 你在问啥。

itorr avatar Apr 01 '20 03:04 itorr

如果使用本地的数据集,可以考虑编写在本地运行的数据集管理工具。

Crystal-RainSlide avatar Apr 01 '20 12:04 Crystal-RainSlide

@Crystal-RainSlide

把项目分享出去的目的主要是为了能有更多不同交友圈的人来完善词条。 更多人并没有使用 GitHub 的经验和习惯,所以决定了需要有中心的 API 支持的这个方案。 在提供了方便的提交手段的同时,公开提交肯定会有少量 解释不准确、格式不符合、带有针对性恶意的词条以及部分非正常提交,所以需要人工审核。 人工审核也要考虑到审核人的方便,所以肯定要有个方便的界面。

关于本地数据集 我一开始的想法 是在词条丰富到一定程度、可以覆盖到大部分常见场景的时候,定期更新离线数据集。目的是在转义时避免提交用户浏览字段到服务器以提高客户端转义响应速度。

这个项目从名字到简介我觉得都能透露出并不支持拼音首字母缩写代替一般文字的立场,如果再支持本地数据集管理我觉得有违这个项目的初衷。

itorr avatar Apr 04 '20 23:04 itorr

需要保持中心化管理的话,也可以不公开本地数据管理工具,作为本地化的后端供自己使用。最终应当会比一整个后端简易一些。当然,如果后端已经完善或者能用,必要性就不大了。

Crystal-RainSlide avatar Apr 05 '20 06:04 Crystal-RainSlide

大家本是想共同管理。 中心化管理怕提交太多了作者吃不消。 真是辛苦收集和筛选了。其实以WIKI形式也行的。

liu599 avatar Apr 12 '20 14:04 liu599

如果能公开字典就太棒了,想做一个逆向转换

yanzhou01 avatar Apr 12 '20 15:04 yanzhou01

用 GitHub 管理的话还有一个问题会不会出现比较多敏感词,触发某些机制

wayjam avatar Apr 13 '20 04:04 wayjam

如果能公开字典就太棒了,想做一个逆向转换

哈哈哈,我也想搞个逆向转换,让世界充满更多的魔法

wcp1231 avatar Apr 13 '20 06:04 wcp1231

用 GitHub 管理的话还有一个问题会不会出现比较多敏感词,触发某些机制

可以编码一下,比如把「漂亮美眉」存储为 '\u6f02\u4eae\u7f8e\u7709' 什么的

sgalal avatar Apr 14 '20 02:04 sgalal


简写这东西涉及的面太广,比方说ACGN领域每个作品基本都会有几个独有的简拼。如果不是涉及过的话,单凭一个人的审核肯定会导致身心俱疲还有可能掺杂个人观点。


可以让用户针对不同的文本类型选择不同的字典 比方说我现在要查公主连结这个游戏的相关内容(~~不可能有憨批都不知道这是什么东西就来~~),可以选择 通用字典包+游戏字典包 (举个例子,可以再加次级)这样的方式,一方面方便离线部署,而且还好找相关的人帮你管理管理

  • 通用字典
  • 明星字典
  • 游戏字典
  • 动漫字典
  • ....

一点建议,虽然离这个库的初心越来越远了就是 我觉得就这样也挺好 本来网络文化这东西早就独立出来了,注意使用场合还是无可厚非的 当然,要是有人天天用这东西跟我秀优越感,我肯定优美的中国话

MonianHello avatar Apr 24 '20 14:04 MonianHello

简写这东西涉及的面太广,比方说ACGN领域每个作品基本都会有几个独有的简拼。如果不是涉及过的话,单凭一个人的审核肯定会导致身心俱疲还有可能掺杂个人观点。

可以让用户针对不同的文本类型选择不同的字典 比方说我现在要查公主连结这个游戏的相关内容(~不可能有憨批都不知道这是什么东西就来~),可以选择 通用字典包+游戏字典包 (举个例子,可以再加次级)这样的方式,一方面方便离线部署,而且还好找相关的人帮你管理管理

  • 通用字典
  • 明星字典
  • 游戏字典
  • 动漫字典
  • ....

一点建议,虽然离这个库的初心越来越远了就是 我觉得就这样也挺好 本来网络文化这东西早就独立出来了,注意使用场合还是无可厚非的 当然,要是有人天天用这东西跟我秀优越感,我肯定优美的中国话

优美的中国话大草

字典没问题,但是这些字典让谁管理是个大问题 不可能像ACG这类的东西让作者都看一遍吧 那样的话我觉得作者的肝有可能撑不住,当然如果作者是崩3玩家那当我没说(手动滑稽+狗头)

话说回来你还有PDL-FS的资源包吗,上次Fork被我删了结果我就发现那个项目没了

ghost avatar Apr 27 '20 02:04 ghost

简写这东西涉及的面太广,比方说ACGN领域每个作品基本都会有几个独有的简拼。如果不是涉及过的话,单凭一个人的审核肯定会导致身心俱疲还有可能掺杂个人观点。 可以让用户针对不同的文本类型选择不同的字典 比方说我现在要查公主连结这个游戏的相关内容(~不可能有憨批都不知道这是什么东西就来~),可以选择 通用字典包+游戏字典包 (举个例子,可以再加次级)这样的方式,一方面方便离线部署,而且还好找相关的人帮你管理管理

  • 通用字典
  • 明星字典
  • 游戏字典
  • 动漫字典
  • ....

一点建议,虽然离这个库的初心越来越远了就是 我觉得就这样也挺好 本来网络文化这东西早就独立出来了,注意使用场合还是无可厚非的 当然,要是有人天天用这东西跟我秀优越感,我肯定优美的中国话

优美的中国话大草

字典没问题,但是这些字典让谁管理是个大问题 不可能像ACG这类的东西让作者都看一遍吧 那样的话我觉得作者的肝有可能撑不住,当然如果作者是崩3玩家那当我没说(手动滑稽+狗头)

话说回来你还有PDL-FS的资源包吗,上次Fork被我删了结果我就发现那个项目没了

另外管理赋权问题我觉得有必要考虑一哈 毕竟权力过大有可能导致一个小小的内乱就会搞垮整个项目

ghost avatar Apr 27 '20 02:04 ghost

简写这东西涉及的面太广,比方说ACGN领域每个作品基本都会有几个独有的简拼。如果不是涉及过的话,单凭一个人的审核肯定会导致身心俱疲还有可能掺杂个人观点。 可以让用户针对不同的文本类型选择不同的字典 比方说我现在要查公主连结这个游戏的相关内容(~不可能有憨批都不知道这是什么东西就来~),可以选择 通用字典包+游戏字典包 (举个例子,可以再加次级)这样的方式,一方面方便离线部署,而且还好找相关的人帮你管理管理

  • 通用字典
  • 明星字典
  • 游戏字典
  • 动漫字典
  • ....

一点建议,虽然离这个库的初心越来越远了就是 我觉得就这样也挺好 本来网络文化这东西早就独立出来了,注意使用场合还是无可厚非的 当然,要是有人天天用这东西跟我秀优越感,我肯定优美的中国话

优美的中国话大草

字典没问题,但是这些字典让谁管理是个大问题 不可能像ACG这类的东西让作者都看一遍吧 那样的话我觉得作者的肝有可能撑不住,当然如果作者是崩3玩家那当我没说(手动滑稽+狗头)

话说回来你还有PDL-FS的资源包吗,上次Fork被我删了结果我就发现那个项目没了

你的邮箱地址。得到的文件请自行校验(拿什么校验)

MonianHello avatar Apr 28 '20 19:04 MonianHello

同样希望开放本地字典数据集,这样可以脑洞大开做不少有意思的东西。

lemss avatar May 07 '20 06:05 lemss

数据那部分完善起来, 恐怕会很庞大个工程, ~~会发展成一套字典也说不定呢!~~

所以我觉得吧, 数据这部分,其实可以单独立个项目了, 本项目就专注于脚本本身就好了

yichangshengwu avatar May 09 '20 22:05 yichangshengwu

简写这东西涉及的面太广,比方说ACGN领域每个作品基本都会有几个独有的简拼。如果不是涉及过的话,单凭一个人的审核肯定会导致身心俱疲还有可能掺杂个人观点。 可以让用户针对不同的文本类型选择不同的字典 比方说我现在要查公主连结这个游戏的相关内容(~不可能有憨批都不知道这是什么东西就来~),可以选择 通用字典包+游戏字典包 (举个例子,可以再加次级)这样的方式,一方面方便离线部署,而且还好找相关的人帮你管理管理

  • 通用字典
  • 明星字典
  • 游戏字典
  • 动漫字典
  • ....

一点建议,虽然离这个库的初心越来越远了就是 我觉得就这样也挺好 本来网络文化这东西早就独立出来了,注意使用场合还是无可厚非的 当然,要是有人天天用这东西跟我秀优越感,我肯定优美的中国话

优美的中国话大草 字典没问题,但是这些字典让谁管理是个大问题 不可能像ACG这类的东西让作者都看一遍吧 那样的话我觉得作者的肝有可能撑不住,当然如果作者是崩3玩家那当我没说(手动滑稽+狗头) 话说回来你还有PDL-FS的资源包吗,上次Fork被我删了结果我就发现那个项目没了

你的邮箱地址。得到的文件请自行校验(拿什么校验)

没啥东西能拿来校验啊 这就是痛点

ghost avatar May 11 '20 13:05 ghost