某中心协助举办合成数据生成研讨会
ICLR 2021研讨会汇集了研究合成数据生成的社群,旨在改进机器学习并保护隐私。
研讨会概述
我们很高兴宣布首届合成数据生成研讨会将于2021年5月7日在ICLR 2021线上举行。合成数据是解决两个不同问题的强大方案:数据限制和隐私风险。在标记数据有限的情况下,合成数据可用于增强训练数据,减轻过拟合。在保护隐私方面,数据管理者可以分享合成数据而非真实数据,既能保护用户隐私,又能保持原始数据的实用性。
尽管这两种场景共享相似的技术挑战(如质量和公平性),但它们通常被分开研究。我们的研讨会旨在加深对两种场景下合成数据生成挑战的理解。
组织团队
该研讨会由来自学术界和工业界的研究人员团队组织,他们在隐私、公平性、医疗保健和机器学习鲁棒性等主题方面拥有专业知识。团队包括来自某中心的两名科学家:某中心网络服务外部安全服务团队的应用科学家Sergul Aydore,以及某中心网络服务机器学习团队的首席应用科学家Krishnaram Kenthapadi;哈佛大学的Haipeng Chen;韩国科学技术院的Edward Choi;某机构DeepMind的Jamie Hayes;某信息安全中心的Mario Fritz;以及哥伦比亚大学的Rachel Cummings。
活动安排
我们的研讨会包括邀请演讲、投稿演讲、海报展示和小组讨论,汇集了多元化的研究人员和实践者。我们很荣幸地安排了以下七场邀请演讲(按出场顺序):
- 《机器学习能否革新医疗保健?合成数据可能是答案》- 剑桥大学、艾伦图灵研究所、加州大学洛杉矶分校Mihaela van der Schaar
- 《图像合成的生成模型》- 某机构Jan Kautz
- 《使用生成对抗网络的差分隐私合成数据生成》- 某机构云AI团队Jinsung Yoon
- 《迈向金融合成数据》- 某金融机构、卡内基梅隆大学Manuela M. Veloso
- 《深度生成模型的偏见和泛化》- 斯坦福大学Stefano Ermon
- 《音乐生成的生成建模》- DeepMind Sander Dieleman
- 《生成式AI的伦理考量》- 某机构伦理AI团队Emily Denton
入选论文
研讨会收录了24篇论文,每篇论文都将有单独的分会场进行海报展示。其中以下七篇将进行口头报告:
- 《用于模型选择的合成数据》- Matan Fintz(某中心)等
- 《用于合成训练数据生成的GAN集成》- Gabriel Eilertsen等
- 《通过张量幻觉进行少样本学习》- Michalis M. L. Lazarou等
- 《利用公共数据进行实用私有查询发布》- Terrance Liu等
- 《快速、公平和私密的数据生成》- Weijie Xu(某中心)等
- 《通过医学图像生成克服数据共享障碍:全面评估》- August DuMont Schütte等
- 《不完美的图像生成:GAN加剧面部数据偏见的影响》- Niharika Jain等
研讨会将以邀请演讲者的小组讨论和颁奖典礼作为结束。
研究领域
- 机器学习
- 安全、隐私和滥用预防
标签
- 合成数据生成
- ICLR
- 差分隐私
会议信息
ICLR 2021
关于作者
Sergul Aydore是某中心网络服务的应用科学家。
Krishnaram Kenthapadi是某中心网络服务的首席科学家。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
公众号二维码
公众号二维码