当前位置: 首页 > news >正文

字符串基础

字符串Hash

我们定义一个把字符串映射到整数的函数 \(f\) ,这个 \(f\) 称为是 \(Hash\) 数。

我们希望这个函数 \(f\) 可以方便地帮我们判断两个字符串是否相等。

基础公式:

$f(s)= {\textstyle \sum_{i=1}^{l}} s[i] \times b^{l-i} $ \((mod\) \(m)\)

哈希冲突

指在一定模数下,两个不同的字符串映射到相同\(Hash\)值。

我们设 \(Hash\) 的取值空间(所有可能出现的字符串的数量)为\(d\),计算次数(要计算的字符串数量)为\(n\)

\(Hash\) 冲突的概率为:

\(p(n,d)=1-\frac{d!}{d^n(d-n)!}\approx 1-exp(-\frac{n(n-1)}{2d})\)

赛场常用技巧

  1. 自然溢出:使用\(unsigned\) \(long\) \(long\)定义\(Hash\)值变量,此时模数为\(2^{64}\),优点是方便、代码简单,缺点是极其容易被卡,详见oi-wiki。

  2. 双值\(Hash\):同时使用两种不同模数求出一个字符串的\(Hash\)值。当两个字符串相同时,两值必定都相同。优点是不容易被卡、应对赛场环境足以,缺点是代码复杂。

  3. 多次询问\(Hash\)值:令\(f_i(s)\)表示字符串\(s\)的长度为\(i\)的前缀的\(Hash\)值,可以得到\(f(s[l..r])=f_r(s)-f_{l-1}(s)\times b^{r-l+1}\)成立。

  4. 二分求最长公共子字符串

常用\(Hash\)

  1. 998244353

  2. 1000000007

  3. 19260817

  4. 自然溢出

http://www.hskmm.com/?act=detail&tid=18901

相关文章:

  • 在CodeBolcks下wxSmith的C++编程教程——使用 wxGrid
  • 题解:P12479 [集训队互测 2024] 长野原龙势流星群
  • linux下nginx
  • 9.27
  • OI 笑传 #12
  • spatial芯片设计语言 学习笔记
  • 【C++】23. C++11(上) - 教程
  • kali2025搭建ARL灯塔系统
  • 实用指南:AI 术语通俗词典:LLM(大语言模型)
  • java学习 2025-9-27
  • 题解:P11667 [USACO25JAN] Astral Superposition B
  • 北极通讯网络题解(做题记录)
  • elasticsearch安装插件 - 实践
  • 个人学习——前端react项目框架
  • 软件基础第一次作业
  • LGP9755 [CSP-S 2023] 种树 学习笔记
  • 7、revision 是 Maven 3.5+ 引入的现代版本管理机制 - 实践
  • P1731 生日蛋糕 做题记录
  • 如何有效提升代码覆盖率:从单元测试到集成测试的实践指南
  • Spring知识点(2)
  • 超越实习期的AI自动化工具:播客工作流与Slack导出器实战
  • 调度器的各项指标以及计算方式
  • 浅谈dsu on tree
  • JavaDay10
  • 昇腾多机推理极速上手:10倍简化的 DeepSeek R1 超大规模模型部署
  • python开始exe应用程序初级教程
  • B站油管抖音一键笔记
  • 介绍自己
  • pycharm更换国内源
  • 基于Python+Vue开发的反诈视频宣传管理系统源码+运行步骤