当前位置: 首页 > news >正文

KL散度

有两个概率分布:真实分布 P(x):世界的真实规律;模型分布 Q(x):我们模型预测的结果。

KL 散度衡量的就是这两个分布之间的“距离”:\(D_{KL}(P||Q) = \sum_{x}^{}{P(x)log\frac{P(x)}{Q(x)}}\).

越接近 0 → 模型越接近真实分布.

假设你在猜天气:
真实情况 P:晴天 80%,下雨 20%;
你的预测 Q:晴天 50%,下雨 50%。

计算:\(D_{KL}(P||Q) = 0.8log\frac{0.8}{0.5} + 0.2log\frac{0.2}{0.5}\)

取自然对数ln:

\(D_{KL} = 0.8 * 0.47 + 0.2 * (-0.92) = 0.376 - 0.184 = 0.192\)

KL 散度 = 0.192 nats
(如果用 log₂,就是约 0.277 bits)

意思是:你这个预测方案,每次猜天气,平均“浪费了” 0.277 bits 的信息。

注意,KL散度并非对称:

\(D_{KL}(P||Q) \neq D_{KL}(Q||P)\).

严格来说,KL散度不是距离,而是一种信息差异。表示“用模型分布 Q 近似真实分布 P 时,多浪费了多少信息”。

http://www.hskmm.com/?act=detail&tid=34558

相关文章:

  • Win11常用的bat脚本
  • 随便记
  • Map与Map.Entry的区别
  • 真诚
  • 历史和线段树
  • 大数据分析之MySQL学习2
  • [KaibaMath]1012 关于收敛数列保号性的推论的证明
  • 申公豹说
  • 赛前训练 12 树的直径、中心和重心
  • 关于无人巡航小车的学习笔记
  • 详细介绍:springboot+vue智慧旅游管理小程序(源码+文档+调试+基础修改+答疑)
  • 存算一体架构的先行者:RustFS在异构计算环境下的探索与实践
  • 2-SAT
  • CSP-S模拟10
  • CSP-S模拟赛加赛 比赛总结
  • 我要好好写博客了 - Milo
  • 洛谷P4735--最大异或和
  • DAPO代码实现浅析
  • [KaibaMath]1011 关于收敛数列保号性的证明
  • Appium 3.0:跨平台移动自动化测试框架全面解析
  • 赛前训练 12 extra 树上差分倍增
  • 塔吊施工人员操作合规性监测!思通数科 AI 卫士实时守护作业安全
  • Dos命令1
  • 题解:P1073 [NOIP 2009 提高组] 最优贸易
  • 吩咐
  • 互评五
  • 机器人技术新前沿:自动驾驶路径规划算法解析
  • 前端框架文档新思路:基于源码解析的自动化方案
  • 常用模板
  • C++ std::forwardT 的使用