kuscia icon indicating copy to clipboard operation
kuscia copied to clipboard

kuscia数据接入问题

Open walkovernamtso opened this issue 1 year ago • 19 comments

支持csv,试了ok。数据库能支持吗,怎么基于数据库执行psi任务

walkovernamtso avatar Aug 29 '23 11:08 walkovernamtso

支持csv,试了ok。数据库能支持吗,怎么基于数据库执行psi任务

“基于数据库执行psi任务“,具体是指什么意思呢

yushiqie avatar Aug 30 '23 02:08 yushiqie

https://www.secretflow.org.cn/docs/kuscia/latest/zh-Hans/tutorial/run_secretflow_with_api_cn image 是按照这个指导,把自己的数据库导出为csv文件,然后放到/home/kuscia/var/storage/data。 想着怎么可以直接代码连到数据库

walkovernamtso avatar Aug 30 '23 04:08 walkovernamtso

https://www.secretflow.org.cn/docs/kuscia/latest/zh-Hans/tutorial/run_secretflow_with_api_cn image 是按照这个指导,把自己的数据库导出为csv文件,然后放到/home/kuscia/var/storage/data。 想着怎么可以直接代码连到数据库

所以你测试用的数据,是从自己的数据库导出为csv文件放置在上述文档的指定的位置?

yushiqie avatar Aug 30 '23 06:08 yushiqie

https://www.secretflow.org.cn/docs/kuscia/latest/zh-Hans/tutorial/run_secretflow_with_api_cn image 是按照这个指导,把自己的数据库导出为csv文件,然后放到/home/kuscia/var/storage/data。 想着怎么可以直接代码连到数据库

目前secretflow 引擎是直接读取 /home/kuscia/var/storage/data 下的数据执行psi算子。Kuscia将推出DataProxy,对引擎屏蔽数据的实际存储位置(数据库,oss,本地)。引擎对接DataProxy即可获取数据内容。对于用户而言,只需配置相对应的数据源的地址/账户密钥信息即可。

yushiqie avatar Aug 30 '23 06:08 yushiqie

这个功能好,大致什么时间可以有

walkovernamtso avatar Aug 30 '23 07:08 walkovernamtso

这个功能好,大致什么时间可以有 我们在下个月版本,用户可见应该是10月初会发布DataProxy第一个版本,但是一期可能只有文件存储, 也欢迎你跟我们共建,支持更多数据源。

请问你是在生产环境要用数据库吗?是哪类型的数据库啊?mysql?有评估过数据量多大吗?

Eiji911 avatar Aug 30 '23 07:08 Eiji911

mysql,求交数据量一般在千万到亿级,走测试

walkovernamtso avatar Aug 30 '23 08:08 walkovernamtso

mysql,求交数据量一般在千万到亿级,走测试

OK,下个月增加了Mysql的支持。 不过暂不支持where过滤。

Eiji911 avatar Aug 31 '23 05:08 Eiji911

请问你们是在企业单位、还是高效用户啊?是工业场景还是POC场景呢?

Eiji911 avatar Aug 31 '23 05:08 Eiji911

企业poc

walkovernamtso avatar Aug 31 '23 12:08 walkovernamtso

先关闭此issue了,有问题可以再交流。

Eiji911 avatar Sep 06 '23 11:09 Eiji911

mysql,求交数据量一般在千万到亿级,走测试

OK,下个月增加了Mysql的支持。 不过暂不支持where过滤。

对mysql的支持请问有了吗 @Eiji911

walkovernamtso avatar Oct 16 '23 07:10 walkovernamtso

mysql,求交数据量一般在千万到亿级,走测试

OK,下个月增加了Mysql的支持。 不过暂不支持where过滤。

对mysql的支持请问有了吗 @Eiji911

hi,这部分目前还在开发中,预计到10月底,敬请关注

wangyixianggogo avatar Oct 17 '23 10:10 wangyixianggogo

您好,对于mysql的支持,在这次的发布中吗 https://github.com/secretflow/kuscia/releases/tag/v0.4.0b0

walkovernamtso avatar Nov 10 '23 07:11 walkovernamtso

哈喽,因为这部分涉及到要做开源改造,所以本次没带出,更新后之后我们会在这里同步

wangyixianggogo avatar Nov 10 '23 09:11 wangyixianggogo

请问目前 dataproxy 研发是什么状态,是否在新版本中可用?

changhr2013 avatar Feb 20 '24 09:02 changhr2013

同上的问题

killomsc avatar Mar 07 '24 09:03 killomsc

hi  @killomsc @changhr2013 @daydayuphere   感谢您对DataProxy 的关注,为了能让dataproxy更加通用与易用,我们决定将DataProxy接口与SDK 进行了重新设计,目前方案还在评审中,有最新消息我们会在此Issue中及时同步。

UniqueMarvin avatar Mar 08 '24 05:03 UniqueMarvin

同上

ruhengChen avatar Jul 17 '24 01:07 ruhengChen