当前位置: 首页 > news >正文

ClkLog埋点与用户行为分析系统:架构升级与性能全面提升

 随着越来越多企业在实际业务中使用 ClkLog,数据规模和分析需求不断提升部分用户日活已经超过10为了顺应这一趋势,ClkLog 秉持 开放透明、持续演进的理念,推出了迄今为止最重要的一次性能优化升级新版本在大规模数据处理与复杂查询场景中,性能表现实现了跨越式提升

 

经过多轮研发与严格测试新版本现已正式上线原有付费版 1.0 基础上架构全面升级同步发布全新 2.0 版本为用户带来更强的性能与更广的适用场景。

 

一、  查找性能突破点

1.  查找性能瓶颈

为了实现大规模数据处理与复杂查询场景性能提升我们需要找到性能瓶颈逐一突破性能要求最高以下两个业务场景

● 自定义查询

1)  查询时间范围较大时,耗时从秒级延长至分钟级

2)  维度数据分散时,甚至可能超时失败

● 漏斗查询

1)  多层漏斗 + 多日转化时,内存占用指数级增长

2)  数据量较大触发内存溢出保护,导致任务失败

 

2.  锁定问题根源

● 非结构化存储解析开销大 ClickHouse 日志缺省JSON字符串存储模式每次查询都要实时解析,CPU消耗高,无法利用索引优化

● 复杂查询全量扫描 CPU与内存压力倍增,最终导致性能急剧下降

 

二、  优化测试与性能对比

1.  最终优化方案

针对上述性能问题根源我们提出了多种优化方案,并通过多轮严格测试进行验证最终确定两套优化方案

● 方案一 1.0升级版ClickHouse新版本25.4 提供原生JSON类型高性能处理方案ClkLog同步数据存储格式升级为原生JSON类型

● 方案二 2.0版本支持全新宽表平铺模式更容易兼容各种OLAP数据库以及二次开发

 

2.  性能比对结果

● 业务场景一:自定义查询

1

 

● 业务场景二:漏斗查询

2

 

三、  新版本中两种存储模式

3

 

四、  版本选型指南(三步判断)

选择存储模式时,建议参考以下三步判断:

1.你的数据规模大吗?

➢ 小规模 → JSON

➢ 大规模 宽表

2.查询复杂吗?

➢ 简单 → JSON日志量也能支撑

➢ 复杂 →宽表

3.需要频繁二次开发/对接外部工具或上下游产品吗?

➢ 否 → 根据两个因素选择JSON宽表

➢ 是 → 宽表

 

五、  总结

1.  付费版衍生出两个存储架构的版本

● 原生JSON类型(即PRO1.0 & CDP1.0)

存储简单、成本低,适合 小规模数据 + 简单查询 + 低频开发

 

● 宽表平铺模式(即PRO2.0 & CDP2.0

性能强大、扩展性好,适合 大规模数据 + 高复杂查询 + 高频开发

 

2.  本次升级包含其他优化

● 系统架构升级

新版日志采集处理架构,新增归档服务,满足合规性审计与历史数据回溯需求。

 

● 数据库版本升级

基于ClickHouse 25.4.12(2025年度官方发布版本)构建数据存储引擎,利用新版优势提高查询效率。

 

● 数据存储模式优化

事件日志数据分区策略调整自然月分区提升基于时间范围查询效率

 

● 系统功能与性能优化

  ○ 自定义分析与漏斗分析模块新增对查询维度及全局筛选条件的自定义属性支持,允许用户通过配置动态添加任意自定义字段作为分析维度,提升自定义分析查询场景的灵活性

  ○ 对漏斗分析场景进行专项优化,提升复杂分析任务的查询效率

  ○ 对前端数据查询结果展示页面进行细节优化,包括缓存优化、刷新优化、图表展示优化等,改善用户操作体验。

 

 

无论是轻量应用还是企业级复杂场景,ClkLog都能帮助企业快速找到最适合的解决方案。

http://www.hskmm.com/?act=detail&tid=9644

相关文章:

  • 常见开源安全工具列表
  • ARC187 做题记
  • SAP物料自动记账科目设置总结
  • SpringBoot启动流程
  • NVR设备ONVIF接入平台EasyCVR视频融合平台智慧小区视频监控一站式建设方案
  • 移远模组使用移远云平台对接指令
  • 解码C语言关键字
  • 接龙大师微信小程序管理系统:一站式社群信息收集与活动管理解决方案
  • Windows环境中安装Zookeeper
  • YOLOv7安全评估揭示11个漏洞:RCE攻击与模型差异风险
  • ​​电流探头选型技术指南:精准捕获电流信号的艺术​​
  • 读人形机器人16本地制造的环境和经济效益
  • 详细介绍:【卷积神经网络详解与实例】10——经典CNN之GoogLeNet
  • openEuler 24.03 (LTS-SP2)安装mysql 8.4.5(glib.2.17)
  • wso2~api的高级限流策略
  • openEuler安装mysql矩阵
  • 【转载】达梦数据库物理备份与逻辑备份的区别
  • openEuler使用xtrabackup报libssl.so问题
  • jmeter中八大元件的执行顺序
  • Ubuntu 安装 JDK
  • EHOME视频平台EasyCVR视频分析设备平台监控摄像机的接入与智能视频分析
  • python+excel实现办公自动化学习 - 教程
  • 详细介绍:集成学习算法简介
  • 智投助手v0.0.4 发布
  • Kaggle的[公共数据集平台]
  • UE5 MPCook 时序图
  • P7435 简单的排列计数
  • Nexpose 8.21.0 for Linux Windows - 漏洞扫描
  • slurm启动验证命令
  • 天上的乌云不见了,但是没有下雨,那它们都去哪了呢?