当前位置：主页 > 查看内容

当传统联邦学习面临异构性挑战，不妨尝试这些个性化联邦学习算法

发布时间：2021-08-09 00:00| 有位朋友查看

简介：本文选择了三篇关于个性化联邦学习的文章进行深入分析。经典的机器学习方法基于样本数据（库）训练得到适用于不同任务和场景的机器学习模型。这些样本数据（库）一般通过从不同用户、终端、系统中收集并集中存储而得到。在实际应用场景中，这种收集样本数据……

本文选择了三篇关于个性化联邦学习的文章进行深入分析。

经典的机器学习方法基于样本数据（库）训练得到适用于不同任务和场景的机器学习模型。这些样本数据（库）一般通过从不同用户、终端、系统中收集并集中存储而得到。在实际应用场景中，这种收集样本数据的方式面临很多问题。一方面，这种方法损害了数据的隐私性和安全性。在一些应用场景中，例如金融行业、政府行业等，受限于数据隐私和安全的要求，根本无法实现对数据的集中存储；另一方面，这种方法会增加通信开销。在物联网等一些大量依赖于移动终端的应用中，这种数据汇聚的通信开销成本是非常巨大的。

联邦学习允许多个用户（称为客户机）协作训练共享的全局模型，而无需分享本地设备中的数据。由中央服务器协调完成多轮联邦学习以得到最终的全局模型。其中，在每一轮开始时，中央服务器将当前的全局模型发送给参与联邦学习的客户机。每个客户机根据其本地数据训练所接收到的全局模型，训练完毕后将更新后的模型返回中央服务器。中央服务器收集到所有客户机返回的更新后，对全局模型进行一次更新，进而结束本轮更新。通过上述多轮学习和通信的方法，联邦学习消除了在单个设备上聚合所有数据的需要，克服了机器学习任务中的隐私和通信挑战，允许机器学习模型学习分散在各个用户（客户机）上存储的数据。

联邦学习自提出以来获得了广泛的关注，并在一些场景中得以应用。联邦学习解决了数据汇聚的问题，使得一些跨机构、跨部门的机器学习模型、算法的设计和训练成为了可能。特别地，对于移动设备中的机器学习模型应用，联邦学习表现出了良好的性能和鲁棒性。此外，对于一些没有足够的私人数据来开发精确的本地模型的用户（客户机）来说，通过联邦学习能够大大改进机器学习模型和算法的性能。但是，由于联邦学习侧重于通过分布式学习所有参与客户机（设备）的本地数据来获得高质量的全局模型，因此它无法捕获每个设备的个人信息，从而导致推理或分类的性能下降。此外，传统的联邦学习需要所有参与设备就协作训练的共同模型达成一致，这在实际复杂的物联网应用中是不现实的。研究人员将联邦学习在实际应用中面临的问题总结如下[2]：（1）各个客户机（设备）在存储、计算和通信能力方面存在异构性；（2）各个客户机（设备）本地数据的非独立同分布（Non-Idependently and Identically Distributed，Non-IID）所导致的数据异构性问题；（3）各个客户机根据其应用场景所需要的模型异构性问题。

为了解决这些异构性挑战，一种有效的方法是在设备、数据和模型级别上进行个性化处理，以减轻异构性并为每个设备获得高质量的个性化模型，即个性化联邦学习（Personalized Federated Learning）。针对 Non-IID 的联邦学习，机器之心之前有专门的分析文章，感兴趣的读者可以阅读。针对设备异构性的问题，一般可以通过设计新的分布式架构（如 Client-Edge-Cloud[5]）或新的联邦学习算法（ Asynchronous Fed[6]）来解决。

针对模型异构性的问题，作者在文献 [1] 中将不同的个性化联邦学习方法分为以下几类：增加用户上下文（Adding User Context ）[8]、迁移学习（Transfer Learning）[9]、多任务学习（Multi-task Learning）[10]、元学习（Meta-Learning）[3]、知识蒸馏（Knowledge Distillation ）[11]、基本层 + 个性化层（ Base + Personalization Layers）[4]、混合全局和局部模型（Mixture of Global and Local Models ）[12] 等。

本文选择了三篇关于个性化联邦学习的文章进行深入分析。其中，第一篇文章关于设备异构性的问题[6]，作者提出了一种新的异步联邦优化算法。对于强凸和非强凸问题以及一类受限的非凸问题，该方法能够近似线性收敛到全局最优解。第二篇文章重点解决模型异构性的问题[7]，作者提出了一种引入 Moreau Envelopes 作为客户机正则化损失函数的个性化联邦学习算法（pFedMe），该算法有助于将个性化模型优化与全局模型学习分离开来。最后，第三篇文章提出了一个协同云边缘框架 PerFit，用于个性化联邦学习，从整体上缓解物联网应用中固有的设备异构性、数据异构性和模型异构性[2]。

一、Asynchronous Federated Optimization

本文转载自网络，原文链接：https://www.toutiao.com/i6875567386905281036/
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：人工智能小冰开放AI设计平台可为纺织企业按需定制 下一篇：没有了

随机推荐

IPv6+，下一代互联网的新起点

截至2020年7月，我国已分配IPv6地址用户数达到14.42亿;市场占比较大的LTE移动终...
为非专业人员量身打造，斯坦福教授一页纸

斯坦福教授 Christopher Manning 用一页纸的篇幅介绍 AI 领域的核心概念。在「A...
6大人工智能应用关键技术，终于有人讲明

01 机器人流程自动化（Robotic Process Automation，RPA） RPA（Robotic Process...
为什么PUE只说明了数据中心能效的一部分

电源使用效率（PUE）是最重要的关键性能指标之一，它可以显示数据中心的能源使用...
了解身边疫情事件与距离UC上线新功能：确

2月10日消息，阿里巴巴旗下智能信息服务平台UC推出确诊病例小区分布功能，以地图...
2021年国内5G发展前瞻（二）：挑战

依靠高速率、低延时、大容量的显著优势，如今5G正成为智慧生活和智能生产的缔造...
App背着你都偷偷干了什么？看完直冒冷汗

近期，小米 MIUI 的一次更新，引起了轩然大波。小米手机最新版操作系统MIUI12 ...
5G专网起飞边缘计算不再“边缘”

边缘计算可以在云和客户之间形成一个缓冲区，进行协同数据存储、计算分析以及网...
功能把微信越甩越远？手机QQ新版详细体验

QQ和微信都是腾讯旗下的IM产品，但在功能方面，毫不客气地说，手机QQ要远远强于...
2020年第十届“新华三杯”全国大学生数字

【51CTO.com原创稿件】2020年11月14日，第十届新华三杯全国大学生数字技术大赛预...

当传统联邦学习面临异构性挑战，不妨尝试这些个性化联邦学习算法

推荐图文

8500万个工作岗位将被取代，工人如何保住“饭碗”？

数据中心安全隐患不可忽视，还需带电清洗定期维护

2020年智能安防技术发展趋势

iPhone 12才有6G运存，安卓早已达到12G，那苹果手机

人工智能和机器学习如何改变DevOps

我国工业互联网快速发展还需迈过哪些坎？

随机推荐

IPv6+，下一代互联网的新起点

为非专业人员量身打造，斯坦福教授一页纸

6大人工智能应用关键技术，终于有人讲明

为什么PUE只说明了数据中心能效的一部分

了解身边疫情事件与距离UC上线新功能：确

2021年国内5G发展前瞻（二）：挑战

App背着你都偷偷干了什么？看完直冒冷汗

5G专网起飞边缘计算不再“边缘”

功能把微信越甩越远？手机QQ新版详细体验

2020年第十届“新华三杯”全国大学生数字

关于我们