赞
踩
目录
提供DataFrame、FedNdarray两种数据结构:
安全提示:一些预处理算子会计算并公开用于辅助计算的统计值,如最大值、最小值,或者一些统计接口本身就会计算和公开统计值,如标准化转换中隐式包含最大值、最小值信息,使用前需要评估统计值是否可以被公开。
附:水平切分、垂直切分及混合切分
水平切分:特征一致、样本不同;
垂直切分:特征不同、样本对齐;
混合切分:数据既包含水平切分,也包含垂直切分。先后无序。
隐私求交(Private Set Intersection,PSI)是一种使用密码学方法,获取两份数据内容的交集的算法。PSI过程中不泄露任务交集以外的信息。在垂直拆分场景中,隐私求交常用于第一步的数据对齐,进一步做数据分析或机器学习建模。
在隐语中 PSI 有两种使用方式(调用同一个kernel,实现方式不同但完全等价)分别如下。同时隐语支持多种 PSI 算法,可根据参与方数量、带宽、算力、数据不平衡度等不同场景合理选择。
- -, alice_psi_path = tempfile.mkstemp()
- -, bob_psi_path = tempfile.mkstemp()
-
- spu.psi_csv{
- key="uid",
- input_path = {alice: alice_path, bob: bob_path},
- output_path = {alice: alice_psi_path, bob: bob_psi_path},
- receiver="alice",
- protocol="ECDH_PSI_2PC",
- sort=True,
- )
- from secretflow.data.vertical import read_csv as v_read_csv
- vdf = v_read_csv(
- {alice: alice_path, bob: bob_path},
-
- #实现样本对齐
- spu=spu,
- keys="uid",
- drop_keys="uid",
- psi_protocl="ECDH_PSI_2PC",
- )
- vdf.columns
附:已实现的隐私求交协议(码住,后续专开一篇介绍)
支持多种决策树算法(XGB),同时支持回归和二分类训练,可根据使用场景和安全性需求选用。
支持多种线性回归模型,满足不同的使用场景,并有一些针对性的优化。
根据使用场景不同,隐语提供了两种神经网络算法:水平联邦学习、垂直拆分学习。
安全提示:水平联邦学习和垂直拆分学习都属于非可证安全算法,其安全性需要根据场景具体分析。可以通过一些安全加固组件(安全聚合、差分隐私、稀疏化等)加强安全性。
本篇文章简单介绍了预处理及隐私求交方法,总结对比各决策树模型及各线性回归模型的API、场景、安全性、性能及算法,最后介绍了神经网络算法:水平联邦学习以及垂直拆分学习的封装模式及使用方法。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。