当前位置: 首页 > news >正文

10.17日学习笔记

  1. HBase + Flink 实时增量同步
    CDC 方案选型
    采用 Flink-HBase-Connector 2.2(基于 AsyncTableOperator),源库 MySQL 8.0,Binlog Row 模式。
    作业拓扑
    MySQL → Debezium JSON → Kafka → Flink SQL → HBase
    Flink DDL:
    sql

CREATE TABLE mysql_user (
id BIGINT PRIMARY KEY,
name STRING,
update_time TIMESTAMP(3)
) WITH (
'connector' = 'kafka',
'topic' = 'db.user',
'properties.bootstrap.servers' = 'kafka1:9092',
'format' = 'debezium-json'
);

CREATE TABLE hbase_user (
rowkey STRING,
info ROW,
PRIMARY KEY (rowkey) NOT ENFORCED
) WITH (
'connector' = 'hbase-2.2',
'table-name' = 'user',
'zookeeper.quorum' = 'zk1:2181'
);

INSERT INTO hbase_user
SELECT CONCAT(CAST(id AS STRING), '_', DATE_FORMAT(update_time, 'yyyyMMdd')),
ROW(name)
FROM mysql_user;
并行度 12,Kafka 15 分区,Checkpoint 30 s,Exactly-Once。
性能结果
峰值 8w 条/s,单条 400 B,Kafka 延迟 80 ms,Flink 端到端平均 350 ms,HBase 端写请求 4.5w QPS,RegionServer CPU 38 %,无 back-pressure。
幂等保障
HBase 侧设置 SET newVersionBehavior = true + Versions = 1,用 Put.setTimestampFromServerSide = false,以 Flink 事件时间作为版本,避免重复 Binlog 导致多版本。
2. VM 内存气球(balloon)深入
驱动原理
内核模块 vmw_balloon 通过 vmci 通道接收宿主机要回收的页数,调用 shrinker 接口把匿名页换到 swap,再填充假页返回给宿主机。
实验观察
层一 VM 8 GB,运行 Redis 填充 6 GB,宿主机触发气球:
bash

vmware-vim-cmd hostsvc/mem/claim 1024 # 回收 1 GB
结果:
客户机 free -m 可用内存瞬间降 1 GB,swap 增 900 MB,si/so 峰值 200 MB/s。
Redis 延迟从 0.3 ms 跳到 3 ms,持续 4 s。
调优:
在 VM 内 echo 10 > /proc/sys/vm/swappiness,并加 vm.min_free_kbytes=262144,延迟下降到 1.2 ms。
禁止气球
把 .vmx 加:
sched.mem.maxmemctl = 0
验证:
vmware-toolbox-cmd stat balloon 显示 0 MB,但失去宿主机内存超售能力,适合延迟敏感型 VM。

http://www.hskmm.com/?act=detail&tid=33343

相关文章:

  • KV缓存(Key-Value Cache)
  • 模型验证
  • Transformer
  • 面试题 02.07. 链表相交
  • 10月17日记
  • 带高度多边形,生成3D建筑模型,支持多种颜色或纹理的OBJ、GLTF、3DTiles格式
  • aaaaaa
  • 突然发现,越研究越没意思
  • 无需重新训练即可为语音识别器添加新词
  • 思科关键漏洞警报:TACACS+认证缺陷可导致网络完全暴露
  • ysyx学习:移植rt-thread
  • 综合性题目
  • 实用指南:从入门到精通:Django的深度探索之旅
  • UML中9中数据流图总结
  • 两种树状数组
  • 斑马日记2025.10.17
  • CF Global Round 29(#2147) 总结
  • 详细介绍:C语言中#pragma的用法
  • JAVA 中断处理
  • 第十五天
  • 软件工程学习日志2025.10.17
  • 天黑了,睡觉
  • 升鲜宝生鲜配送供应链管理系统---- 门店收银 POS 离线工作设计文档(支持线上线下一体化)---02
  • 2025.10.16NOIP模拟
  • Python 基于Python开发的数据库同步检测工具
  • 当AI学会进化:荣耀与用户的“共生式成长”新范式
  • VSCode的下载安装以及配置
  • 2025年终极公众号排版神器排行榜 最新案例研究权威测评
  • NAS安装远程协作神器twake
  • 把三门问题做成了"游戏"