Kazumi icon indicating copy to clipboard operation
Kazumi copied to clipboard

在时间表那里点进去看番,有些番的某个源就看不了,而搜索出来的番的片源却正常显示

Open kazuyaalex opened this issue 1 year ago • 32 comments

比如这个《不时轻声地以俄语遮羞的邻座艾莉同学》,girigirilove和nt的源在时间表那里都是没有的,但搜索出来的才有 QQ图片20240714120827 QQ图片20240714120901 QQ图片20240714120906 QQ图片20240714120910

kazuyaalex avatar Jul 14 '24 04:07 kazuyaalex

这不是一个 BUG。

程序的逻辑本来就是这样的。

非搜索场景进入番剧详情页面时,程序会使用番剧的标题在各个视频源进行检索。搜索场景进入番剧i详情页面时,程序会使用输入的关键词在视频源进行检索。

以上面的情况为例。

从时间表进入时,程序使用 不时用俄语说真心话的邻桌艾莉同学 进行检索,但是这个动画在NT的译名是 不时轻声地以俄语遮羞的领座艾莉同学 。这导致了检索失败。

但从搜索场景进入时,你的关键字更加模糊,可能是 不时用俄语 之类的关键词,这样可以检索成功。

这样设计是为了提高检索成功率,如果有更好的处理方式,也欢迎告诉我。

Predidit avatar Jul 14 '24 06:07 Predidit

原来如此,感谢大佬的回答

kazuyaalex avatar Jul 15 '24 05:07 kazuyaalex

这不是一个 BUG。

程序的逻辑本来就是这样的。

非搜索场景进入番剧详情页面时,程序会使用番剧的标题在各个视频源进行检索。搜索场景进入番剧i详情页面时,程序会使用输入的关键词在视频源进行检索。

以上面的情况为例。

从时间表进入时,程序使用 不时用俄语说真心话的邻桌艾莉同学 进行检索,但是这个动画在NT的译名是 不时轻声地以俄语遮羞的领座艾莉同学 。这导致了检索失败。

但从搜索场景进入时,你的关键字更加模糊,可能是 不时用俄语 之类的关键词,这样可以检索成功。

这样设计是为了提高检索成功率,如果有更好的处理方式,也欢迎告诉我。

在追番界面也是一样的问题,但是是否可以这样解决: 应用收藏的不是番剧的标题,而是一个网址。用户下次观看时通过此网址来呈现内容

Forfeit-Yan avatar Jul 30 '24 04:07 Forfeit-Yan

@Dawn9443 我有些没有明白这个解决方案,如果没有从视频源已经取得的搜索结果,我们何来的网址呢。

Predidit avatar Jul 30 '24 04:07 Predidit

@Dawn9443 我有些没有明白这个解决方案,如果没有从视频源已经取得的搜索结果,我们何来的网址呢。

emmm.... 我所指的是追番界面,因为追番也出现了类似的问题,同样是在追番中看不到结果,但是在搜索界面却可以显示

Forfeit-Yan avatar Jul 30 '24 10:07 Forfeit-Yan

我大概明白了,不过这样设计的话有一些其他的问题需要考虑。

比如更加复杂的本地缓存结构,以及使用缓存替代实时检索是否有必要,因为视频源不可用时仍然显示缓存结果的体验并不好。

如果有进展,我会在这里更新。

Predidit avatar Jul 30 '24 11:07 Predidit

我大概明白了,不过这样设计的话有一些其他的问题需要考虑。

比如更加复杂的本地缓存结构,以及使用缓存替代实时检索是否有必要,因为视频源不可用时仍然显示缓存结果的体验并不好。

如果有进展,我会在这里更新。

OK,感谢回复

Forfeit-Yan avatar Jul 30 '24 11:07 Forfeit-Yan

这不是一个 BUG。

程序的逻辑本来就是这样的。

非搜索场景进入番剧详情页面时,程序会使用番剧的标题在各个视频源进行检索。搜索场景进入番剧i详情页面时,程序会使用输入的关键词在视频源进行检索。

以上面的情况为例。

从时间表进入时,程序使用 不时用俄语说真心话的邻桌艾莉同学 进行检索,但是这个动画在NT的译名是 不时轻声地以俄语遮羞的领座艾莉同学 。这导致了检索失败。

但从搜索场景进入时,你的关键字更加模糊,可能是 不时用俄语 之类的关键词,这样可以检索成功。

这样设计是为了提高检索成功率,如果有更好的处理方式,也欢迎告诉我。

对于最开始这个问题,有一种不太靠谱的方法可以尝试去解决: 在编程语言中有一类数据库是可以对于所得到的文字进行拆分(类似于断句的功能),如果导入这一种数据库,将要搜索的番剧名拆成几个小部分,再搜索这些拆分后的词句(相当于用程序来模拟用户搜索),检索的成功率会不会高一点?

Forfeit-Yan avatar Jul 31 '24 01:07 Forfeit-Yan

这不是一个 BUG。 程序的逻辑本来就是这样的。 非搜索场景进入番剧详情页面时,程序会使用番剧的标题在各个视频源进行检索。搜索场景进入番剧i详情页面时,程序会使用输入的关键词在视频源进行检索。 以上面的情况为例。 从时间表进入时,程序使用 不时用俄语说真心话的邻桌艾莉同学 进行检索,但是这个动画在NT的译名是 不时轻声地以俄语遮羞的领座艾莉同学 。这导致了检索失败。 但从搜索场景进入时,你的关键字更加模糊,可能是 不时用俄语 之类的关键词,这样可以检索成功。 这样设计是为了提高检索成功率,如果有更好的处理方式,也欢迎告诉我。

对于最开始这个问题,有一种不太靠谱的方法可以尝试去解决: 在编程语言中有一类数据库是可以对于所得到的文字进行拆分(类似于断句的功能),如果导入这一种数据库,将要搜索的番剧名拆成几个小部分,再搜索这些拆分后的词句(相当于用程序来模拟用户搜索),检索的成功率会不会高一点?

你说的东西类似于分词器?使用分词器处理之后对视频源多次检索并去重理论上可以很大程度上解决问题,但这会成倍增加视频源的搜索服务的负担,我并不想那么做。

此外为什么说是一定程度上,因为有的时候番剧名称的差异并不能通过分词器解决,例如 xxxHolic 在一些场合被翻译为 四月一日灵异事件簿。

Predidit avatar Jul 31 '24 02:07 Predidit

由于有大量重复提问,本Issue现在保持开启。

Predidit avatar Aug 31 '24 06:08 Predidit

我突然意识到,bangumi的番剧详情页也有别名,既然时间表是从bangumi获取的,应该也可以获取番剧的别名吧。 image

YCZ01111 avatar Sep 10 '24 11:09 YCZ01111

我突然意识到,bangumi的番剧详情页也有别名,既然时间表是从bangumi获取的,应该也可以获取番剧的别名吧。 image

网页的大部分内容在 bangumi 开放 api 中没有对应,我们只使用 bangumi 开发 api 中的功能。bangumi此前多次因为泛滥的爬虫而宕机,我们不想使用爬虫这种对 bangumi 负荷极高的方法来获取 api 中没有的内容。

Predidit avatar Sep 10 '24 11:09 Predidit

我突然意识到,bangumi的番剧详情页也有别名,既然时间表是从bangumi获取的,应该也可以获取番剧的别名吧。 image

网页的大部分内容在 bangumi 开放 api 中没有对应,我们只使用 bangumi 开发 api 中的功能。bangumi此前多次因为泛滥的爬虫而宕机,我们不想使用爬虫这种对 bangumi 负荷极高的方法来获取 api 中没有的内容。

那是否可以接入追番

YCZ01111 avatar Sep 10 '24 12:09 YCZ01111

我突然意识到,bangumi的番剧详情页也有别名,既然时间表是从bangumi获取的,应该也可以获取番剧的别名吧。 image

网页的大部分内容在 bangumi 开放 api 中没有对应,我们只使用 bangumi 开发 api 中的功能。bangumi此前多次因为泛滥的爬虫而宕机,我们不想使用爬虫这种对 bangumi 负荷极高的方法来获取 api 中没有的内容。

也许我们可以通过这个网站来获取别名 https://www.themoviedb.org/tv/235758/titles

YCZ01111 avatar Sep 11 '24 10:09 YCZ01111

我突然意识到,bangumi的番剧详情页也有别名,既然时间表是从bangumi获取的,应该也可以获取番剧的别名吧。 image

网页的大部分内容在 bangumi 开放 api 中没有对应,我们只使用 bangumi 开发 api 中的功能。bangumi此前多次因为泛滥的爬虫而宕机,我们不想使用爬虫这种对 bangumi 负荷极高的方法来获取 api 中没有的内容。

也许我们可以通过这个网站来获取别名 https://www.themoviedb.org/tv/235758/titles

在编写kazumi的初期,我考虑过TMDB,它的功能性明显比 Bangumi API 更好,并且后续可以做国际化支持。

但是TMDB有针对应用本身,而不是IP的调用限制,每分钟只能调用50次,这是不可接受的。

Predidit avatar Sep 11 '24 11:09 Predidit

我突然意识到,bangumi的番剧详情页也有别名,既然时间表是从bangumi获取的,应该也可以获取番剧的别名吧。 image

网页的大部分内容在 bangumi 开放 api 中没有对应,我们只使用 bangumi 开发 api 中的功能。bangumi此前多次因为泛滥的爬虫而宕机,我们不想使用爬虫这种对 bangumi 负荷极高的方法来获取 api 中没有的内容。

也许我们可以通过这个网站来获取别名 https://www.themoviedb.org/tv/235758/titles

在编写kazumi的初期,我考虑过TMDB,它的功能性明显比 Bangumi API 更好,并且后续可以做国际化支持。

但是TMDB有针对应用本身,而不是IP的调用限制,每分钟只能调用50次,这是不可接受的。

为何不能像使用规则那样来获取呢

YCZ01111 avatar Sep 11 '24 11:09 YCZ01111

那是完全不同的方案了

Predidit avatar Sep 11 '24 11:09 Predidit

比如说当点击某个番剧后,将标题放入tmdb中搜索,获取到别名,然后再拿所有名称去规则中搜索。这样对于tmdb的请求甚至远少于对于规则中网站的请求不是吗。

YCZ01111 avatar Sep 11 '24 11:09 YCZ01111

我突然意识到,bangumi的番剧详情页也有别名,既然时间表是从bangumi获取的,应该也可以获取番剧的别名吧。 image

网页的大部分内容在 bangumi 开放 api 中没有对应,我们只使用 bangumi 开发 api 中的功能。bangumi此前多次因为泛滥的爬虫而宕机,我们不想使用爬虫这种对 bangumi 负荷极高的方法来获取 api 中没有的内容。

IMG_0745 好像有诶,我也不了解,要不您问问

YCZ01111 avatar Sep 11 '24 16:09 YCZ01111

我重新看了一下 bangumi API 的文档,有这个字段,来自使用 bangumi ID 获取条目详细信息的接口。这个接口没有被kazumi使用过。

我需要考虑一下怎么处理这部分的检索,这部分的逻辑本来就因为需要实现并发查询而稍微复杂。我要想一想怎么实现失败时的别名检索更优雅一些。

Predidit avatar Sep 11 '24 16:09 Predidit

我重新看了一下 bangumi API 的文档,有这个字段,来自使用 bangumi ID 获取条目详细信息的接口。这个接口没有被kazumi使用过。

我需要考虑一下怎么处理这部分的检索,这部分的逻辑本来就因为需要实现并发查询而稍微复杂。我要想一想怎么实现失败时的别名检索更优雅一些。

我很期待检索功能的完善

YCZ01111 avatar Sep 11 '24 17:09 YCZ01111

或者搜索功能能不能出个切换模式,在精确和模糊搜索之间切换,因为这个模糊功能,无论我如何已经知道番剧的确切名称,比如渴求游戏之神,我都已经在bangumi明确出其番剧名,但是我还是无法搜索出该番剧,但按照这个名称搜索,在各个网站都可以搜索出来 Screenshot_2024-09-16-21-50-06-546_com predidit kazumi

Alvin-Blithe avatar Sep 16 '24 13:09 Alvin-Blithe

而且模糊搜索的逻辑我不太明白,我即使知道这个番剧的两三个别名,全试了个遍,都无法搜索出 Screenshot_2024-09-16-21-51-59-927_com predidit kazumi

Alvin-Blithe avatar Sep 16 '24 13:09 Alvin-Blithe

而且模糊搜索的逻辑我不太明白,我即使知道这个番剧的两三个别名,全试了个遍,都无法搜索出 Screenshot_2024-09-16-21-51-59-927_com predidit kazumi

搜日语就搜出来了:は遊戯に飢え 这应该是bangumiapi的问题

YCZ01111 avatar Sep 16 '24 14:09 YCZ01111

而且模糊搜索的逻辑我不太明白,我即使知道这个番剧的两三个别名,全试了个遍,都无法搜索出 Screenshot_2024-09-16-21-51-59-927_com predidit kazumi

搜日语就搜出来了:は遊戯に飢え 这应该是bangumiapi的问题 感谢你的解答,但这样也有个问题,比如我知道在这么多个番源中一般是次元城画质比较好,实际上这个网站按照渴求游戏之神也能搜索出这个番剧,但这APP中这个番源无法检测到,只有两三个画质不是很清晰的能检测,这种如何解决呢? 有没有办法我在APP内转到webview页面的时候,选择这个番剧后拉取到这个内置播放器,因为我想看弹幕 Screenshot_2024-09-16-22-58-32-025_com predidit kazumi

Alvin-Blithe avatar Sep 16 '24 15:09 Alvin-Blithe

而且模糊搜索的逻辑我不太明白,我即使知道这个番剧的两三个别名,全试了个遍,都无法搜索出 Screenshot_2024-09-16-21-51-59-927_com predidit kazumi

搜日语就搜出来了:は遊戯に飢え 这应该是bangumiapi的问题 感谢你的解答,但这样也有个问题,比如我知道在这么多个番源中一般是次元城画质比较好,实际上这个网站按照渴求游戏之神也能搜索出这个番剧,但这APP中这个番源无法检测到,只有两三个画质不是很清晰的能检测,这种如何解决呢? 有没有办法我在APP内转到webview页面的时候,选择这个番剧后拉取到这个内置播放器,因为我想看弹幕 Screenshot_2024-09-16-22-58-32-025_com predidit kazumi

这只能等作者完善别名搜索逻辑了,之前作者已经有思路了,不知道进展如何。 如果你不是ios用户的话也可以直接用次元城的app,也有弹幕的

YCZ01111 avatar Sep 16 '24 15:09 YCZ01111

日语在视频网站里检索不到,我觉得问题出在标题的句号上。应该在搜索时把句号带上,然后视频源应该也能正确得到结果。

Predidit avatar Sep 16 '24 15:09 Predidit

日语在视频网站里检索不到,我觉得问题出在标题的句号上。应该在搜索时把句号带上,然后视频源应该也能正确得到结果。

并不能

YCZ01111 avatar Sep 16 '24 15:09 YCZ01111

日语在视频网站里检索不到,我觉得问题出在标题的句号上。应该在搜索时把句号带上,然后视频源应该也能正确得到结果。

早日实现遍历搜索别名才是真理

YCZ01111 avatar Sep 16 '24 15:09 YCZ01111

如果不想遍历别名的话,也许可以直接在搜索框就选择规则,比如bangumi搜索,dms搜索,age搜索等 但是这样也许对于搜索结果的展示不是很方便,因为最后还要调用bangumi API来获取搜索结果对应的封面之类的内容,很容易出错。

YCZ01111 avatar Sep 16 '24 15:09 YCZ01111