当前位置: 首页 > news >正文

因果机器学习算法新进展解析

开源因果机器学习算法

我们很高兴宣布,将开源因果机器学习算法,这些算法是某中心多年图形因果模型研究的成果。除了常规的效果估计外,这些算法还能实现各种复杂的因果查询,包括但不限于异常值和分布变化的根因分析、因果结构学习以及因果结构诊断。在内部,这些算法已被某中心从供应链到云服务的多个团队使用。

与某机构合作创建PyWhy

我们同样兴奋地宣布,在与某机构的共同努力下,我们创建了一个名为PyWhy的新GitHub组织。PyWhy作为微软因果机器学习库DoWhy的新家,我们正将算法整合其中。DoWhy是GitHub上最受欢迎的因果性库之一。某中心和某机构很高兴能与DoWhy用户和贡献者社区合作。

图形因果模型

大多数现实世界系统,无论是分布式计算系统、供应链系统还是制造过程,都可以使用可能相互施加因果影响的变量来描述。

以由许多不同Web服务组成的微服务架构为例。网站加载时间增加的原因是什么?是后端数据库缓慢?负载均衡器故障?还是网络速度慢?

现有的因果性库(包括DoWhy)专注于各种类型的效果估计,其总体目标是识别干预对某些目标变量的影响。在微服务架构的情况下,它们有助于回答诸如"如果我在缓存服务配置中进行此更改,会改善网站加载时间还是使其恶化?"等问题。

我们的贡献通过利用图形因果模型(GCM)的力量,补充了DoWhy的现有功能集。GCM是由图灵奖得主Judea Pearl开发的形式化框架,用于建模系统中变量之间的因果关系。GCM的一个关键组成部分是因果图,它直观地表示观察变量之间的因果关系,箭头从原因指向结果。

因果机制与根因分析

因果图中的每个变量都有自己的因果机制,描述其值如何从其父代的值生成。我们可以训练概率模型来学习这些因果机制,并使用它们将异常事件或机制变化归因于特定节点。这种对机制贡献的分解是我们新型根因分析算法的核心思想。

例如,在上述微服务架构中,我们可能意外部署了一个有缺陷的服务,该服务使用次优的SQL查询从数据库获取数据,从而增加了网站延迟。使用我们称为"分布变化归因"的功能,我们可以识别出这个有缺陷的服务。

GCM的广泛应用

但GCM能做更多:它们可用于计算干预效果、估计反事实、计算节点对其后代的直接和内在影响,或将异常归因于潜在的上游根本原因。通过发布我们的算法,我们希望将这些工具提供给更广泛的研究人员和实践者,并帮助推进围绕GCM的科学方法。

PyWhy的长期愿景

对于效果估计,DoWhy已经使用了两个最流行的因果推断科学框架——图形因果模型和潜在结果——并将它们结合在一个库中。通过我们的贡献,我们希望进一步推动框架及其专用研究社区之间的协同作用。

但我们的长期愿景超越了DoWhy、潜在结果和GCM。这体现在我们创建PyWhy的努力以及我们帮助指导这个新GitHub组织方向的承诺中。我们欢迎其他人加入我们的努力,成为社区的一部分。

我们对PyWhy的希望和雄心——如其使命所述——是"构建一个因果机器学习的开源生态系统,推动技术进步,并使其可供实践者和研究人员使用。我们构建和托管可互操作的库、工具和其他资源,涵盖各种因果任务和应用,通过基础因果操作的通用API和对端到端分析过程的关注连接起来。"

加入我们

如果您是研究因果机器学习问题的科学家或对其感到好奇,请访问py-why.github.io/dowhy/gcm了解DoWhy中新的GCM功能,或在github.com/py-why/dowhy上浏览源代码。

如果您是因果机器学习库的所有者,并认为您的库适合PyWhy,请访问github.com/py-why了解这个新组织,或在Discord上与我们交流。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

http://www.hskmm.com/?act=detail&tid=36125

相关文章:

  • 软件工程作业三
  • CF2127 Atto Round 1 (Codeforces Round 1041, Div. 1 + Div. 2) 游记(VP)
  • 一键生成爆款文章,并自动发布!
  • 机器学习到深度学习发展历程
  • Java数据类型
  • [CF 516 E] Drazil and His Happy Friends
  • NVIDIA Triton服务器漏洞危机:攻击者可远程执行代码,AI模型最高权限告急
  • 2025-10-21
  • 个人骗分导论
  • Java三大特性
  • 高级程序设计第二次作业
  • 10月21日日记
  • home-assistant.-Adding integrations
  • Windows系统内存占用过高,且任务管理器找不到对应进程
  • NOIP 二十五
  • 理想婚姻
  • equal和hashcode
  • Ancestral Problem 题解
  • AWS IAM角色最佳实践:构建云安全的核心防线
  • 正睿 2025 NOIP 20连测 Day6
  • Hetao P5593 删 题解 [ 蓝 ] [ 线性 DP ] [ DFS 序 ] [ 虚树 ]
  • o(N^2)找出所有回文子串
  • 第二次高级程序作业
  • 大学生需要认真听课的肌肉记忆(注意力训练)
  • 初始人工智能和机器学习
  • 10/21
  • 蛋白表达技术概述
  • 二叉树的中序遍历- 递归原理 - MKT
  • 友链测试
  • 二叉树的中序遍历- 二叉树基本-递归 - MKT