当前位置: 首页 > news >正文

读书笔记:白话解读Oracle哈希分区

我们的文章会在微信公众号IT民工的龙马人生和博客网站( www.htz.pw )同步更新 ,欢迎关注收藏,也欢迎大家转载,但是请在文章开始地方标注文章出处,谢谢!
由于博客中有大量代码,通过页面浏览效果更佳。

本文为个人学习《Expert Oracle Database Architecture Techniques and Solutions for High Performance and Productivity(第四版本》一书过程中的笔记与理解分享,仅用于学习与交流,部分内容参考原书观点并结合>实际经验进行整理。若涉及版权问题,请联系删除或沟通处理。也请大家支持购买原版书籍。

白话解读Oracle哈希分区

什么是哈希分区?
想象你有一堆文件需要分到N个抽屉里。哈希分区的做法是:对每个文件的关键信息(如编号)进行"哈希计算",通过数学公式直接算出这个文件应该放进几号抽屉。你无法人为决定文件去向,完全由算法决定。

具体操作示例:

CREATE TABLE hash_example(hash_key_column date,      -- 分区依据列data varchar2(20)
)
PARTITION BY HASH (hash_key_column)  -- 按此列进行哈希计算
(partition part_1 tablespace p1,  -- 分区1partition part_2 tablespace p2   -- 分区2
);

核心特点:

  1. 不可控性:行存放的分区由哈希函数决定,DBA无法干预
  2. 动态重分布:增加或删除分区时,所有数据需要重新计算并重新分布
  3. 需要选择合适的哈希键:应选择唯一性或高区分度的列,避免数据倾斜

为什么分区数要是2的幂?
通过实验可以清晰看到:

  • 4个分区时(2²):数据均匀分布

    分区p1: 12141行 *****************************
    分区p2: 12178行 *****************************
    分区p3: 12417行 ******************************
    分区p4: 12105行 *****************************
    
  • 5个分区时:出现数据倾斜

    分区p1: 6102行 **************(只有其他分区一半)
    分区p2: 12180行 *****************************
    分区p5: 6040行 **************(只有其他分区一半)
    
  • 8个分区时(2³):重新恢复均匀分布

    所有分区行数都在6000-6300之间,分布均匀
    

哈希分区的适用场景:

  1. 分而治之:将大表拆分成多个小表管理
  2. 提高可用性:单个分区故障不影响其他分区访问
  3. 减少热点争用:将频繁更新的数据分散到多个分区
  4. 并行处理:适合大规模并行查询和DML操作

重要建议:

  • 分区数量务必设置为2的幂次方(2、4、8、16、32...)
  • 选择高基数(不同值多)的列作为哈希键
  • 避免使用只有少数几个取值的列作为哈希键

哈希分区通过数学算法实现数据的自动分布,虽然牺牲了控制性,但换来了更好的负载均衡和可扩展性,特别适合海量数据的分布式存储和处理。

------------------作者介绍-----------------------
姓名:黄廷忠
个人博客: (http://www.htz.pw)
CSDN地址: (https://blog.csdn.net/wwwhtzpw)
博客园地址: (https://www.cnblogs.com/www-htz-pw)

http://www.hskmm.com/?act=detail&tid=37311

相关文章:

  • GIT DUBUG 变量设置
  • 九种类图归纳总结
  • git ssh 已配置公钥,但仍然无法连接成功 - lay
  • 阅读笔记-待选中
  • 2025年10月国内环保悬浮拼装地板生产厂家全景解析报告,基于专业测评的技术、性能及市场优势深度分析
  • 批量跑脚本后自定义消息内容发送至钉钉--自定义发送到钉钉的消息内容
  • 2025年10月国内北京黄金回收公司全景解析报告,基于专业测评的技术、性能及市场优势深度分析
  • 在IntelliJ IDEA中采用Git
  • 国产化Excel开发组件Spire.XLS教程:在Python中将Pandas DataFrame导出到Excel的详细教程
  • 2025 年化工塑料桶生产厂家最新推荐榜:聚焦企业专利技术、品质管控及知名客户合作案例的权威解析
  • 主流CI/CD工具选型指南:助力企业实现高效交付
  • 通过openwrt唤醒pc电脑
  • 图表控件Aspose.Diagram教程:在C#中将VSD转换为PDF
  • Gitee:中国开发者生态的数字化转型引擎
  • Windows 11 24H2 堆栈防护:从功能解析到实战配置
  • 2025年轴流风机品牌前十强排名及选购指南
  • 支持HART通信协议输入的16位DAC芯片TPC2201
  • 2025年陕西省基本农田调整技术服务品牌排名前十权威解析
  • 2025年陕西省基本农田调整技术服务公司排名前十权威解析
  • 2025.10.23 VP Record
  • 2025年英国留学服务商排行榜:Top 10权威推荐与选择指南
  • 2025年市面上信号灯品牌口碑推荐榜单:十大优质厂家综合评测
  • 2025年高压电缆品牌哪家好?鑫佰亿线缆权威推荐与选择指南
  • 2025年高压电缆品牌哪家好:鑫佰亿线缆全面评测与权威推荐
  • 2025年高压电缆品牌哪家好:鑫佰亿线缆权威推荐与选择指南
  • 硬件编写_基于STM32单片机的汽车急控优秀的系统
  • 升级windows 11 25h2的步骤(xjl456852原创)
  • 华为FusionCompute超融合上传ISO镜像方法教程
  • QMPlay 编译
  • 2025 氧气/氮气/工业/氩气/高纯/液态/气体公司推荐榜:港骅 5 星领跑,黄骅及周边全品类供应,这些细分领域服务商更懂生产需求