FATE icon indicating copy to clipboard operation
FATE copied to clipboard

真实业务数据是否需要进行处理才可进行FATE联邦学习训练

Open dyx0001 opened this issue 11 months ago • 5 comments

真实的业务数据包含很多中文,以及字段并不像事例中那么简单,这些需要特殊处理么?还是直接就可以导入FATE进行训练?

dyx0001 avatar Mar 06 '24 02:03 dyx0001

中文的话,你需要实现处理

dylan-fan avatar Mar 06 '24 05:03 dylan-fan

咱们Fate给出的事例中数据处理的逻辑是什么?对比原数据有些看不懂是否可以说明一下? 这个是fate给出的数据来源说明: 微信图片_20240306155106

下面是fate处理后的数据: 微信图片_20240306155117

从提供网址下载的数据: 微信图片_20240306155127

dyx0001 avatar Mar 06 '24 08:03 dyx0001

FATE数据都是公开的数据集,可以查一下数据集对应的任务的

talkingwallace avatar Mar 07 '24 02:03 talkingwallace

我的意思FATE公开的数据集与从真实业务数据拿到的数据明显不一样,是否经过处理?您说的数据集对应的任务意思是处理真实数据生成公开的数据集的任务么?能否指出具体的代码?

dyx0001 avatar Mar 07 '24 02:03 dyx0001

和原始数据是会有些差别,比方说您看的default credit,fate里的样例数据是把原数据做了归一化的

talkingwallace avatar Mar 07 '24 09:03 talkingwallace