“你正在尝试预测不可预测的事物”
某中心科学家Dean Foster与合著者因其23年前撰写的论文获得"时间检验"奖。
Dean Foster从事预测业务。更具体地说,他致力于确保某中心为其供应链所做的预测尽可能准确。Foster是一名研究科学家,在该机构的供应链优化技术(SCOT)组织工作。"我们的主要重点是在客户购买之前预测他们会购买什么,"他说。"我们需要确保了解人们的需求,以便能够找到商品,将其运送到全国各地,并在客户下订单时等待送达。"
在规模上预测客户在任何给定时间可能想要什么本质上是复杂的。加强这些预测的方法之一是通过称为校准的概念——这是Dean广泛研究的一个主题。事实上,他与Rakesh Vohra 23年前合著的论文《校准学习与相关均衡》本周在第21届ACM经济学与计算会议上荣获时间检验奖。
该奖项由会议奖项委员会颁发,"表彰在十到二十五年前发表的有影响力的论文或系列论文的作者,这些论文对体现经济学与计算相互作用的研究或应用产生了重大影响。"
Foster和Vohra的论文"催生了相当规模的理论文献",某中心学者兼经济学家Steve Tadelis指出。该论文还因其对学习智能体进行的游戏的影响而赢得赞誉,解决了源自著名数学家John Forbes Nash Jr.提出的想法的一个问题。
"如果我们有两个不同的智能体相互学习对战,它们会学会达到均衡,"Foster说。"Nash提出了一个不动点并论证了均衡的存在。但'人们为什么会遵循它们?'这个问题是开放的。" 换句话说,人类的行为既不整洁也不统一可预测。"你并不是一个简单的生物,因此将你的行为建模为好像你今天会做与你一生中其他每一天完全相同的事情是错误的,"他说。
Foster和他的合著者Rakesh Vohra(现为宾夕法尼亚大学教授)着手通过在校准时包含任意序列来解释这种复杂性的一部分。
在这种背景下,校准涉及将预测与其实际结果进行比较,测量两者之间的差异,然后根据需要进行调整。通过从先前的比较中学习,预测模型可以被校准以更准确地匹配结果。
"未校准是一种尴尬,"Foster说,"你应该修复它!如果我试图预测自然将会做什么,比如明天下雨还是晴天,并假设自然只有一个生活目标——让我看起来很愚蠢——尽管如此,我仍然可以使用校准来找出准确的预测。"
Foster指出,虽然这种解释可能看起来夸张,但它与机器学习特别相关。
"这种校准和在世界与你作对时进行预测的想法,现在在机器学习中相对标准。它源于连接许多计算机科学,"他解释说。"在计算机科学中,对于大多数你可以证明的事情,你可以证明最坏情况和平均情况大致相同。因此,对于排序算法来说,最坏可能的数据与典型排序问题一样难以排序。我们采用该模型并说,'嗯,在统计学中这是真的吗?' 这就是这个想法的来源。即使自然在那里试图欺骗你,你也可以做出这些同样好的预测。"
这个想法根植于博弈论,这是一个校准特别有用的领域。博弈论假设你的对手试图欺骗你,例如,一个棋手希望你认为你的皇后处于危险之中,而实际上并非如此。做出错误的预测(或预报)意味着你会更频繁地失败。相反,校准的预测可以帮助你更经常地获胜。
"通过校准预测,如果我认为某人会以三分之二的概率采取某种行动,而实际上他们三分之二的时间确实这样做了,我现在可以知道三分之二是正确的答案,"他说。"并且我可以相信我不必回去说,'嗯,大部分时间,它落在了另一边……' 它正按照我原以为的方式落地。"
Foster指出,校准还有助于确保预测不会因样本量等问题而受到影响。"描述我们预测校准的一种方式是,在我们宣布预测之后,不应该有其他人能够过来说,'嘿,如果你把那个预测加大20%,它会更准确。' 校准是一种检查,以确保你没有留下一个简单的、低垂的果实修改。"
至于预测的未来,在供应链优化方面,Foster看到了很大的潜力。他对某中心扩大使用强化学习特别感到兴奋,强化学习是一种专注于最大化累积奖励的机器学习方法。
"我一直在研究如何采取更经济学的观点,"Foster说。"我们如何将预测与我们做出的经济决策联系起来,以便有一个更综合的方法?我们正试图通过应用更多强化学习技术来实现这一点。"
尽管他的论文获得了所有引用和赞誉,但起步并不顺利。"当我们第一次尝试发表这篇论文时,它在统计学期刊中足够令人震惊,以至于被拒绝了几次,"Foster回忆道。"一位审稿人说,'你正在尝试预测不可预测的事物。'" 在某种程度上,他仍然如此。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
公众号二维码
公众号二维码