某中心在RecSys:评估、偏见与算法
某中心学者Pablo Castells分享他在推荐系统研究中观察到的趋势。
会议:RecSys 2021
与计算机视觉或自然语言处理等会议不同,ACM推荐系统会议(RecSys)具有鲜明的互联网时代特征。某中心学者、马德里自治大学计算机科学副教授Pablo Castells指出:“RecSys的行业参与度非常高。虽然我长期从事学术研究,但推荐系统问题完全可以从数学角度抽象处理,并通过小数据实验进行探索。”
Castells认为当前领域特别关注三大主题:
评估
“如何确定推荐系统是否正常运行?这在生产系统中通过A/B测试等在线评估已充满挑战,离线评估则更为困难。最新趋势认为推荐系统的客户不仅包括终端消费者,还应包含提供推荐服务的卖方。因此算法效果需要从不同利益相关方的多维度视角进行衡量。”
即使针对特定用户,推荐系统性能的衡量也非易事。“推荐系统的有效性不仅在于准确预测用户喜好,更在于提供的内容是否实用。实用性取决于上下文环境和使用目的——收听熟悉音乐与发现新音乐的价值标准就截然不同。过去一二十年间,业界对这种多维价值的认知已显著深化。”
“这还涉及另一个视角:推荐系统既要让用户满意,又需要向用户学习。当向用户展示产品时,实际存在两个可能不一致的目标:即时满足用户需求,以及通过交互数据优化未来推荐效果。”
偏见
偏见问题涵盖但不限于AI领域近期备受关注的公平性议题。“偏见是个多面体:它可能导致系统重复推荐相同内容而失效,也可能干扰实验测量导致决策偏差。在在线零售环境中,还需要考量是否公平展示所有供应商的商品。这无疑是当前最重要的研究课题之一。”
“通常公平性问题不存在唯一绝对解。提高对偏见的认知至关重要——只要充分意识到偏见和不公平现象的存在,即使无法完美解决,也已接近解决方案。”
算法
在算法层面,“深度学习看似正在取代之前的领先算法。当数据包含丰富侧信息或涉及序列推荐等特定场景时,深度学习确实表现更优。但在纯协同过滤等通用任务中,简单算法有时仍与深度学习旗鼓相当。”
Castells分析部分原因在于“推荐领域的人类行为更具不可预测性,而惊喜本身具有价值。协同过滤通过相似用户画像进行推荐,天然具备优势——它能突破单纯基于产品描述或用户特征的推荐模式,通过挖掘人与产品间的隐藏关联,创造更多惊喜体验。算法还可以额外添加探索机制来增强新颖性。”
当然,鉴于深度学习在其他领域的成功,低估其在推荐系统的潜力将是错误的。“很难从会议论文得出最佳算法的结论,因为RecSys发表的研究多基于公开数据,而领域仍需改进实验标准、可复现性和基准测试。众所周知深度学习需要海量数据才能发挥最佳性能,但会议实验通常受数据规模限制,这可能并非深度学习的优势场景。”
“因此我认为最佳算法方案仍是开放问题。尚未形成‘放弃线性矩阵分解和k近邻算法,全面转向深度学习’的共识。这可能取决于具体应用场景、数据特性甚至实验配置。也许明年会出现定论,但目前尚未见到。”
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
公众号二维码
公众号二维码