干扰线去除算法_android识别验证码图片的原理与思路

Ⅰ 现在在弄openCV的OCR，不知道怎么展开，求大神指点迷津一些思路什么的，要求可以自己训练，识别字符数字

假设已经把验证码图片保存到本地了
验证码识别的大致步骤
1，读取图片到bitmap
2，进行灰度操作
3，进行才二值操作
4，如果有干扰点一般用滤波器或八邻域去干扰点
5，如果有干扰线如果是简单的直线可以用扫描法，八后法等，复杂的应该根据特点调整算法
6，如果有干扰色块也应该想法去除
7，如果有较大的倾斜需要进行适当校正
8，此时得到的应该是比较干净的字符了，如果是非粘连的可以直接用投影法分割成单个字符
如果有粘连，需要根据图形特点从算法上做相应的处理，保证大致分割正确
9，分割成单个字符以后，如果字符比较正常变形扭曲程序不大，可以直接用模式识别
如果变形扭曲较厉害，一般建议使用神经网络进行训练后再识别
如果是比较简单的验证码可以使用网上的一些组件，我常用的一个是OcrKingApi
不是太复杂的识别效果还可以，关键是免费的。使用文档可以看一下文库的链接
http://wenku..com/view/b5b6721555270722192ef7b3.html
字符识别没大必要用openCV 你不觉得它太大了吗，而且它的主要适用于计算机视觉方面的处理
如果是变形比较厉害的可以用神经网络训练常用的有BP ,SVM等

Ⅱ android识别验证码图片的原理与思路

假设已经把验证码图片保存到本地了
我说一下验证码识别的大致步骤吧
1，读取图片到bitmap
2，进行灰度操作
3，进行才二值操作
4，如果有干扰点一般用滤波器或八邻域去干扰点
5，如果有干扰线如果是简单的直线可以用扫描法，八后法等，复杂的应该根据特点调整算法
6，如果有干扰色块也应该想法去除
7，如果有较大的倾斜需要进行适当校正
8，此时得到的应该是比较干净的字符了，如果是非粘连的可以直接用投影法分割成单个字符
如果有粘连，需要根据图形特点从算法上做相应的处理，保证大致分割正确
9，分割成单个字符以后，如果字符比较正常变形扭曲程序不大，可以直接用模式识别
如果变形扭曲较厉害，一般建议使用神经网络进行训练后再识别

如果是比较简单的验证码可以使用网上的一些组件，我常用的一个是OcrKingApi

不是太复杂的识别效果还可以，关键是免费的。使用文档可以看一下文库的链接

http://wenku..com/view/b5b6721555270722192ef7b3.html

Ⅲ 图像识别新人求教

3.16 icePub_imgToSingleBmp

l 函数原型：
int WINAPI icePub_imgToSingleBmp(char *strImgFilename,char *strBmpFilename,int thresholdValue)
输入：strImgFilename 待处理图像文件名
strBmpFilename bmp图像名
thresholdValue 256级灰度值的阈值(函数会先将图像转换成灰度再根据thresholdValue做黑白2值化)
输出：

VC sample代码：

typedef int (WINAPI ICEPUB_IMGTOSINGLEBMP)(char *strImgFilename,char *strBmpFilename,int thresholdValue);
ICEPUB_IMGTOSINGLEBMP *icePub_imgToSingleBmp = 0;
HINSTANCE hDLLDrv = LoadLibrary("icePubDll.dll");
if(hDLLDrv)
{
icePub_imgToSingleBmp=(ICEPUB_IMGTOSINGLEBMP *)GetProcAddress(hDLLDrv,"icePub_imgToSingleBmp");
}
if(icePub_imgToSingleBmp)
{
icePub_imgToSingleBmp("my24.bmp","single1.bmp",150);
icePub_imgToSingleBmp("my.jpg","single2.bmp",150);
icePub_imgToSingleBmp("my.png","single3.bmp",150);
}

if(hDLLDrv)
FreeLibrary(hDLLDrv);

http://dl.icese.net/dev.php?f=icePubDll.rar 下载

Ⅳ c#验证码如何去除干扰点/干扰线

//随机输出噪点
for (int i = 0; i < 50; i++)
{
int x = rand.Next(image.Width);
int y = rand.Next(image.Height);
using (Pen _pen = new Pen(Color.LightGray, 0))
{
g.DrawRectangle(_pen, x, y, 1, 1);
}
}
//输出不同字体和颜色的验证码字符
for (int i = 0; i < checkCode.Length; i++)
{
int cindex = rand.Next(7);
int findex = rand.Next(5);

using (var f = new Font(font[findex], 12, FontStyle.Bold))
using (var b = new SolidBrush(c[cindex]))
{
int ii = 4;
if ((i + 1) % 2 == 0)
{
ii = 2;
}
g.DrawString(checkCode.Substring(i, 1), f, b, 3 + (i * 12), ii);
}
}

只要不输入噪点和干扰线就可以了呀

Ⅳ pythonchallenge 去除验证码干扰线用什么算法好

struct模块还提供了pack_into() 和 unpack_from()的方法用来解决这样的问题，也就是对一个已经提前分配好的buffer进行字节的填充，而不会每次都产生一个新对象对字节进行存储。

Ⅵ php 下面的验证码怎么做

干扰像素其实就是一定算法生成的随机点。这个不会每张图片都一样的，那样就有规律可循了，容易被破解。

Ⅶ android识别验证码图片的原理与思路

Ⅷ python pil 怎么去掉验证码线条

一、验证码识别的概念

机器识别图片主要的三个步骤为消去背景、切割字符、识别字符。而现有的字符验证码也针对这三个方面来设计强壮的验证码。

以下简图帮助大家理解验证码识别的流程：

二、处理流程

其中最为关键的就是好图像处理这一步了。图像处理功能模块包括图像的灰度化、二值化、离散噪声点的去除、倾斜度校正、字符的切割、图像的归一化等图像处理技术。

1、图像的灰度化
由于 256 色的位图的调色板内容比较复杂，使得图像处理的许多算法都没有办法展开，因此有必要对它进行灰度处理。所谓灰度图像就是图像的每一个像素的 R、G、B 分量的值是相等的。彩色图像的每个像素的 R、G、B 值是不相同的，所以显示出红绿蓝等各种颜色。灰度图像没有这些颜色差异，有的只是亮度上的不同。灰度值大的像素点比较亮（像素值最大为 255，为白色），反之比较暗（像素值最小为 0，为黑色）。图像灰度化有各种不同的算法，比较直接的一种就是给像素的 RGB 值各自一个加权系数，然后求和；同时还要对调色板表项进行相应的处理。

2、图像的二值化
要注意的是，最后得到的结果一定要归一到 0－255 之内。因为这是每个字节表示
图像数据的极限。

3、去噪
图像可能在生成、传输或者采集过程中夹带了噪声，去噪声是图像处理中常用的手法。通常去噪声用滤波的方法，比如中值滤波、均值滤波。但是那样的算法不适合用在处理字符这样目标狭长的图像中，因为在滤波的过程中很有可能会去掉字符本身的像素。

一个采用的是去除杂点的方法来进行去噪声处理的。具体算法如下：扫描整个图像，当发现一个黑色点的时候，就考察和该黑色点间接或者直接相连接的黑色点的个数有多少，如果大于一定的值，那就说明该点不是离散点，否则就是离散点，把它去掉。在考察相连的黑色点的时候用的是递归的方法。此处，我简单的用python实现了,大家可以参考以下。

#coding=utf-8"""
creat time:2015.09.14
"""import cv2import numpy as npfrom matplotlib import pyplot as pltfrom PIL import Image,ImageEnhance,ImageFilter

img_name = '2+.png'#去除干扰线im = Image.open(img_name)#图像二值化enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
data = im.getdata()
w,h = im.size#im.show()black_point = 0for x in xrange(1,w-1): for y in xrange(1,h-1):
mid_pixel = data[w*y+x] #中央像素点像素值
if mid_pixel == 0: #找出上下左右四个方向像素点像素值
top_pixel = data[w*(y-1)+x]
left_pixel = data[w*y+(x-1)]
down_pixel = data[w*(y+1)+x]
right_pixel = data[w*y+(x+1)] #判断上下左右的黑色像素点总个数
if top_pixel == 0:
black_point += 1
if left_pixel == 0:
black_point += 1
if down_pixel == 0:
black_point += 1
if right_pixel == 0:
black_point += 1
if black_point >= 3:
im.putpixel((x,y),0) #print black_point
black_point = 0im.show()041424344

原验证码：

4、分割
图像中一般会含有多个数字，识别的时候只能根据每个字符的特征来进行判断，所以还要进行字符切割的工作。这一步工作就是把图像中的字符独立的切割出来。

具体的算法如下：

第一步，先自下而上对图像进行逐行扫描直至遇到第一个黑色的像素点。记录下来。然后再自上而下对图像进行逐行扫描直至找到第一个黑色像素，这样就找到图像大致的高度范围。

第二步，在这个高度范围之内再自左向右逐列进行扫描，遇到第一个黑色像素时认为是字符切割的起始位置，然后继续扫描，直至遇到有一列中没有黑色像素，则认为这个字符切割结束，然后继续扫描，按照上述的方法一直扫描直至图像的最右端。这样就得到了每个字符的比较精确宽度范围。

第三步，在已知的每个字符比较精确的宽度范围内，按照第一步的方法，分别进行自上而下和自下而上的逐行扫描来获取每个字符精确的高度范围。

5、图像的归一化
因为采集的图像中字符大小有可能存在较大的差异，或者是经过切割后的字符尺寸不统一，而相对来说，统一尺寸的字符识别的标准性更强，准确率自然也更高，归一化图像就是要把原来各不相同的字符统一到同一尺寸，在系统实现中是统一到同一高度，然后根据高度来调整字符的宽度。具体算法如下：先得到原来字符的高度，跟系统要求的高度做比较，得出要变换的系数，然后根据得到的系数求得变换后应有得宽度。在得到宽度和高度之后，把新图像里面的点按照插值的方法映射到原图像中。

不少人认为把每个字符图像归一化为 5×9 像素的二值图像是最理想的，因为图像的尺寸越小，识别速度就越高，网络训练也越快。而实际上，相对于要识别的字符图像， 5×9 像素图太小了。归一化后，图像信息丢失了很多，这时进行图像识别，准确率不高。实验证明，将字符图像归一化为 10×18 像素的二值图像是现实中是比较理想的，达到了识别速度快和识别准确率高的较好的平衡点。

三、识别

图像识别包括特征提取、样本训练和识别三大块内容。

验证码识别其中最为关键的就是去噪和分割，这对你的训练和识别的精度都有着很大的影响。这里只讲了大致的流程，其中每个细节都有很多工作要做，这里码字也很难讲清楚，大家可以以这个流程为主线，一步步的实现，最终也就能完成你的需求。

Ⅸ 如何利用Python做简单的验证码识别

1摘要

验证码是目前互联网上非常常见也是非常重要的一个事物，充当着很多系统的防火墙功能，但是随时OCR技术的发展，验证码暴露出来的安全问题也越来越严峻。本文介绍了一套字符验证码识别的完整流程，对于验证码安全和OCR识别技术都有一定的借鉴意义。

然后经过了一年的时间，笔者又研究和get到了一种更强大的基于CNN卷积神经网络的直接端到端的验证识别技术（文章不是我的，然后我把源码整理了下，介绍和源码在这里面）：

基于python语言的tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)

2关键词

关键词：安全,字符图片,验证码识别,OCR,Python,SVM,PIL

3免责声明

本文研究所用素材来自于某旧Web框架的网站完全对外公开的公共图片资源。

本文只做了该网站对外公开的公共图片资源进行了爬取，并未越权做任何多余操作。

本文在书写相关报告的时候已经隐去漏洞网站的身份信息。

本文作者已经通知网站相关人员此系统漏洞，并积极向新系统转移。

本报告的主要目的也仅是用于OCR交流学习和引起大家对验证安全的警觉。

4引言

关于验证码的非技术部分的介绍，可以参考以前写的一篇科普类的文章：

互联网安全防火墙（1）--网络验证码的科普

里面对验证码的种类，使用场景，作用，主要的识别技术等等进行了讲解，然而并没有涉及到任何技术内容。本章内容则作为它的技术补充来给出相应的识别的解决方案，让读者对验证码的功能及安全性问题有更深刻的认识。

5基本工具

要达到本文的目的，只需要简单的编程知识即可，因为现在的机器学习领域的蓬勃发展，已经有很多封装好的开源解决方案来进行机器学习。普通程序员已经不需要了解复杂的数学原理，即可以实现对这些工具的应用了。

主要开发环境：

python3.5
python SDK版本
PIL
图片处理库
libsvm
开源的svm机器学习库

关于环境的安装，不是本文的重点，故略去。

6基本流程

一般情况下，对于字符型验证码的识别流程如下：

准备原始图片素材
图片预处理
图片字符切割
图片尺寸归一化
图片字符标记
字符图片特征提取
生成特征和标记对应的训练数据集
训练特征标记数据生成识别模型
使用识别模型预测新的未知图片集
达到根据“图片”就能返回识别正确的字符集的目标

7素材准备

7.1素材选择

由于本文是以初级的学习研究目的为主，要求“有代表性，但又不会太难”，所以就直接在网上找个比较有代表性的简单的字符型验证码（感觉像在找漏洞一样）。

最后在一个比较旧的网站（估计是几十年前的网站框架）找到了这个验证码图片。

原始图：

def get_feature(img): """

获取指定图片的特征值,

1. 按照每排的像素点,高度为10,则有10个维度,然后为6列,总共16个维度

:param img_path:

:return:一个维度为10（高度）的列表 """

width, height = img.size

pixel_cnt_list = []

height = 10 for y in range(height):

pix_cnt_x = 0 for x in range(width): if img.getpixel((x, y)) == 0: # 黑色点

pix_cnt_x += 1

pixel_cnt_list.append(pix_cnt_x) for x in range(width):

pix_cnt_y = 0 for y in range(height): if img.getpixel((x, y)) == 0: # 黑色点

pix_cnt_y += 1

pixel_cnt_list.append(pix_cnt_y) return pixel_cnt_list

然后就将图片素材特征化，按照libSVM指定的格式生成一组带特征值和标记值的向量文

Ⅹ 求易语言图片识别的方法或者源码谢谢有分瞎打的别来不给分

强大的识图识色模块个插件，精易论坛搜索大漠两个字，有一大堆你需要的模块和插件。

导航:首页 > 源码编译 > 干扰线去除算法

干扰线去除算法

与干扰线去除算法相关的资料