当前位置: 首页 > news >正文

粘连字符验证码的分割与识别思路

在验证码设计中,常见的一种防护方式是字符粘连:多个字符之间没有明显的空隙,甚至部分笔画重叠。这种情况使得传统 OCR 很难直接识别。本文将介绍一种基于投影分析与轮廓分割的处理流程,帮助我们从粘连验证码中分离出独立字符。

一、问题分析

粘连验证码的典型特征:

字符之间边界模糊,甚至部分笔画重叠;
更多内容访问ttocr.com或联系1436423940
简单的二值化无法区分不同字符;

OCR 在整体输入下容易输出错误结果。

解决思路:

通过二值化得到字符轮廓;

对二值图像进行垂直投影,寻找字符间的“谷值”;

在谷值附近切割,得到单个字符;

再逐一送入 OCR 识别。

二、实现步骤(Python 示例)

  1. 导入依赖
    import cv2
    import numpy as np
    from matplotlib import pyplot as plt
    import pytesseract

  2. 读取与灰度化
    img = cv2.imread("captcha_stick.png")
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    _, binary = cv2.threshold(gray, 128, 255, cv2.THRESH_BINARY_INV)

cv2.imwrite("step1_binary.png", binary)

  1. 垂直投影计算
    h, w = binary.shape
    projection = np.sum(binary, axis=0)

plt.plot(projection)
plt.title("Vertical Projection")
plt.savefig("step2_projection.png")

  1. 根据投影谷值分割字符

找出投影中接近 0 的区域,作为切割点

threshold = np.max(projection) * 0.2
cuts = []
in_gap = False

for x, val in enumerate(projection):
if val < threshold and not in_gap:
cuts.append(x)
in_gap = True
elif val >= threshold and in_gap:
cuts.append(x)
in_gap = False

切割并保存字符

chars = []
for i in range(0, len(cuts)-1, 2):
roi = binary[:, cuts[i]:cuts[i+1]]
chars.append(roi)
cv2.imwrite(f"char_{i//2}.png", roi)

  1. OCR 单字符识别
    for i, c in enumerate(chars):
    text = pytesseract.image_to_string(c, config="--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ")
    print(f"字符{i}: {text.strip()}")
http://www.hskmm.com/?act=detail&tid=13832

相关文章:

  • 深入解析:【Spark+Hive+hadoop】基于spark+hadoop基于大数据的人口普查收入数据分析与可视化系统
  • part 8
  • 【本地音乐库】的搭建管理工具推荐
  • 扭曲变形验证码的图像处理与识别思路
  • 每日收获
  • C++中std::map容器中元素删除方法汇总 - 详解
  • 物理半程与半时问题
  • 从用户态到内核态:Windows CC 技术深度解析(第一篇:DNS隧道)
  • 9.22 科研小结:不要总是预设成功,失败才是常态
  • STM32光强传感器实验详解 - 实践
  • 在CodeBolcks下wxSmith的C++编程教程——从Hello world开始讲述wxSmith使用基础
  • 【Azure Batch】使用Start Task来挂载Storage Blob
  • HP notebook set your key to action key /multimedia key
  • newDay01
  • springboot 整合Redis实现发布/订阅功能
  • CCPC online 2025题解 ( A~H+K)
  • 2025.9.22总结 - A
  • 实用指南:GESP三级考纲+三级考试知识点详解
  • github操作备忘录
  • 9.22每日总结
  • 算法人生
  • 动态规划专题
  • 【51单片机】【protues仿真】基于51单片机PM2.5温湿度测量蓝牙架构
  • 每日反思(2025.9.22)
  • 洛谷题单指南-进阶数论-P4942 小凯的数字
  • 【炼石计划NOIP】第八套 赛后总结
  • 下载了idea
  • vite7-webos网页版os管理|Vue3+Vite7+ArcoDesign搭建pc端os后台系统
  • 三门问题的多种解法,总有一个你看得懂
  • hbase学习——创建springboot+hbase项目