当前位置：首页 > news >正文

【隐语SecretFlow架构解读】隐私保护模型在线推理系统 SecretFlow-Serving 架构解读

news 2025/10/20 16:50:23

打开链接点亮社区Star，照亮技术的前进之路。每一个点赞，都是社区技术大佬前进的动力

Github 地址： https://github.com/secretflow

在传统机器学习场景中，完成模型训练得到模型之后，如何将模型的推理能力应用到实际的生产业务场景中呢？

通用的做法是通过使用在线推理框架加载这些模型，并将其服务化以提供接口给业务系统使用。

然而，在多方共同参与的隐私计算场景下，数据、调用系统和模型均分散在不同的参与方，尤其是对于推理过程中使用的数据需要保护，无法出域计算。

SecretFlow-Serving 是隐语团队开源的通用、开放且高性能的隐私保护多方在线推理框架，旨在解决上述问题。

SecretFlow-Serving 架构介绍

架构上，SecretFlow-Serving 通过配置的模型数据源模块加载模型到内存中，建立模型执行体进行计算。

在请求端分离了特征数据流与推理请求，通过各个参与方独立的特征数据源模块提供推理过程中的数据，进而完成模型计算得到推理结果。

框架内部通过预测调度器和模型执行体与其他 Serving 系统进行调度与计算的通信，以支持不同技术路线的隐私计算模型推理。

SecretFlow-Serving 技术特性

高性能

SecretFlow-Serving 基于成熟的工业级 RPC 框架 bRPC 构建，内部集成了高性能矩阵运算库 eigen 及高性能向量化计算库 Apache::Arrow，同时基于隐语在蚂蚁内部的实践与优化，基于批量、不同层级的并行化计算以及推理算法的优化，保证推理请求的低延时同时具有较低的通信量消耗。

高可用

在确保在线推理系统的高可用性上，隐语通过 Serving + Kuscia 的组合，实现了在线服务治理、多副本、负载均衡以及故障转移等功能，提供生产级高可用解决方案，同时具备优秀的可观测性。

可观测性

可观测性是指能够通过检查系统或应用的输出、日志和性能指标来监控、测量和理解系统或应用的状态。

对于在线推理系统来说，可观测性在确保应用和基础架构的可靠性、性能和安全性方面发挥着越来越重要的作用。

基于可观测三大支柱的理念，SecretFlow-Serving 已经建设了 logging 以及 metrics 数据输出能力。

基于相关数据，用户可将 SecretFlow-Serving 接入到可观测性平台中，帮助用户主动诊断、分析问题，并追溯问题根源。

通用与开放

在通用性和开放性方面，隐语的目标是提供一个兼容性强且易于扩展的框架。SecretFlow-Serving 通过插件化模块化的框架设计，支持多样化的数据源与隐私计算算子，允许用户进行二次开发，以适应不同的落地场景。

模型图

在模型表示上，SecretFlow-Serving 设计了一套隐私保护推理模型图定义，在支持存储模型数据的同时也能够对多方模型推理的调度与计算过程进行描述，以此实现对不同隐私计算技术路线的模型推理算法的支持，同时基于此定义，使用者可以自行构建隐私计算推理模型并使用 SecretFlow-Serving 进行模型推理预测。

详细说明可见：https://www.secretflow.org.cn/zhCN/docs/serving/0.2.0b0/topics/graph/intro_to_graph