python自动识别图片头像_Python如何图像识别

① python如何图像识别

首先，先定位好问题是属于图像识别任务中的哪一类，最好上传一张植物叶子的图片。因为目前基于深度学习的卷积神经网络（CNN）确实在图像识别任务中取得很好的效果，深度学习属于机器学习，其研究的范式，或者说处理图像的步骤大体上是一致的。

1、第一步，准备好数据集，这里是指，需要知道输入、输出（视任务而定，针对你这个问题，建议使用有监督模型）是什么。你可以准备一个文件夹，里面存放好植物叶子的图像，而每张图像对应一个标签（有病/没病，或者是多类别标签，可能具体到哪一种病）。
具体实现中，会将数据集分为三个：训练集（计算模型参数）、验证集（调参，这个经常可以不需要实现划分，在python中可以用scikit-learn中的函数解决。测试集用于验证模型的效果，与前面两个的区别是，模型使用训练集和验证集时，是同时使用了输入数据和标签，而在测试阶段，模型是用输入+模型参数，得到的预测与真实标签进行对比，进而评估效果。
2、确定图像识别的任务是什么？

图像识别的任务可以分为四个：图像分类、目标检测、语义分割、实例分割，有时候是几个任务的结合。
图像分类是指以图像为输入，输出对该图像内容分类的描述，可以是多分类问题，比如猫狗识别。通过足够的训练数据（猫和狗的照片-标签，当然现在也有一系列的方法可以做小样本训练，这是细节了，这里并不敞开讲），让计算机/模型输出这张图片是猫或者狗，及其概率。当然，如果你的训练数据还有其它动物，也是可以的，那就是图像多分类问题。
目标检测指将图像或者视频中的目标与不感兴趣的部分区分开，判断是否存在目标，并确定目标的具体位置。比如，想要确定这只狗所佩戴的眼睛的位置，输入一张图片，输出眼睛的位置（可视化后可以讲目标区域框出来）。

看到这里，应该想想植物叶子诊断疾病的问题，只需要输入一整张植物叶子的图片，输出是哪种疾病，还是需要先提取叶子上某些感兴趣区域（可能是病变区域），在用病变区域的特征，对应到具体的疾病？
语义分割是当今计算机视觉领域的关键问题之一，宏观上看，语义分割是一项高层次的任务。其目的是以一些原始图像作为输入，输出具有突出显示的感兴趣的掩膜，其实质上是实现了像素级分类。对于输入图片，输出其舌头区域（注意可以是不规则的，甚至不连续的）。

而实例分割，可以说是在语义分割的基础上，在像素层面给出属于每个实例的像素。

看到这里，可以具体思考下自己的问题是对应其中的哪一类问题，或者是需要几种任务的结合。

3、实际操作
可以先通过一个简单的例子入手，先了解构建这一个框架需要准备什么。手写数字识别可以说是深度学习的入门数据集，其任务也经常作为该领域入门的案例，也可以自己在网上寻找。

② 识别图片的python代码

网址403权限错误。
如果是个人网站，建议检查；如果仅仅是为了测试，建议将图片上传到图床上测试。
提问时建议隐藏API_ID和API_KEY，保护自己的信息。

③ 如何使用Python，基于OpenCV与Face++实现人脸解锁的功能

近几天微软的发布会上讲到了不少认脸解锁的内容，经过探索，其实利用手头的资源我们完全自己也可以完成这样一个过程。

本文讲解了如何使用Python，基于OpenCV与Face++实现人脸解锁的功能。

本文基于Python 2.7.11，Windows 8.1 系统。

主要内容

Windows 8.1上配置OpenCV
OpenCV的人脸检测应用
使用Face++完成人脸辨识（如果你想自己实现这部分的功能，可以借鉴例如这个项目）

Windows 8.1上配置OpenCV

入门的时候配置环境总是一个非常麻烦的事情，在Windows上配置OpenCV更是如此。

既然写了这个推广的科普教程，总不能让读者卡在环境配置上吧。

下面用到的文件都可以在这里（提取码：b6ec）下载，但是注意，目前OpenCV仅支持Python2.7。

将cv2加入site-packages

将下载下来的cv2.pyd文件放入Python安装的文件夹下的Libsite-packages目录。

就我的电脑而言，这个目录就是C:/Python27/Lib/site-packages/。

记得不要直接使用pip安装，将文件拖过去即可。

安装numpy组件

在命令行下进入到下载下来的文件所在的目录（按住Shift右键有在该目录打开命令行的选项）

键入命令：

pip install numpy-1.11.0rc2-cp27-cp27m-win32.whl

如果你的系统或者Python不适配，可以在这里下载别的轮子。

测试OpenCV安装

在命令行键入命令：

python -c "import cv2"

如果没有出现错误提示，那么cv2就已经安装好了。

OpenCV的人脸检测应用

人脸检测应用，简而言之就是一个在照片里找到人脸，然后用方框框起来的过程（我们的相机经常做这件事情）

那么具体而言就是这样一个过程：

获取摄像头的图片
在图片中检测到人脸的区域
在人脸的区域周围绘制方框

获取摄像头的图片

这里简单的讲解一下OpenCV的基本操作。

以下操作是打开摄像头的基本操作：

#coding=utf8

import cv2

# 一般笔记本的默认摄像头都是0

capInput = cv2.VideoCapture(0)

# 我们可以用这条命令检测摄像头是否可以读取数据

if not capInput.isOpened(): print('Capture failed because of camera')

那么怎么从摄像头读取数据呢？

# 接上段程序

# 现在摄像头已经打开了，我们可以使用这条命令读取图像

# img就是我们读取到的图像，就和我们使用open('pic.jpg', 'rb').read()读取到的数据是一样的

ret, img = capInput.read()

# 你可以使用open的方式存储，也可以使用cv2提供的方式存储

cv2.imwrite('pic.jpg', img)

# 同样，你可以使用open的方式读取，也可以使用cv2提供的方式读取

img = cv2.imread('pic.jpg')

为了方便显示图片，cv2也提供了显示图片的方法：

# 接上段程序

# 定义一个窗口，当然也可以不定义

imgWindowName = 'ImageCaptured'

imgWindow = cv2.namedWindow(imgWindowName, cv2.WINDOW_NORMAL)

# 在窗口中显示图片

cv2.imshow(imgWindowName, img)

当然在完成所有操作以后需要把摄像头和窗口都做一个释放：

# 接上段程序

# 释放摄像头

capInput.release()

# 释放所有窗口

cv2.destroyAllWindows()

在图片中检测到人脸的区域

OpenCV给我们提供了已经训练好的人脸的xml模板，我们只需要载入然后比对即可。

# 接上段程序

# 载入xml模板

faceCascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

# 将图形存储的方式进行转换

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 使用模板匹配图形

faces = faceCascade.detectMultiScale(gray, 1.3, 5)

print(faces)

在人脸的区域周围绘制方框

在上一个步骤中，faces中的四个量分别为左上角的横坐标、纵坐标、宽度、长度。

所以我们根据这四个量很容易的就可以绘制出方框。

# 接上段程序

# 函数的参数分别为：图像，左上角坐标，右下角坐标，颜色，宽度

img = cv2.rectangle(img, (x, y), (x + w, y + h), (255, 0, 0), 2)

成果

根据上面讲述的内容，我们现在已经可以完成一个简单的人脸辨认了：

#coding=utf8

import cv2

print('Press Esc to exit')

faceCascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

imgWindow = cv2.namedWindow('FaceDetect', cv2.WINDOW_NORMAL)

def detect_face():

capInput = cv2.VideoCapture(0)

# 避免处理时间过长造成画面卡顿

nextCaptureTime = time.time()

faces = []

if not capInput.isOpened(): print('Capture failed because of camera')

while 1:

ret, img = capInput.read()

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

if nextCaptureTime < time.time():

nextCaptureTime = time.time() + 0.1

faces = faceCascade.detectMultiScale(gray, 1.3, 5)

if faces:

for x, y, w, h in faces:

img = cv2.rectangle(img, (x, y), (x + w, y + h), (255, 0, 0), 2)

cv2.imshow('FaceDetect', img)

# 这是简单的读取键盘输入，27即Esc的acsii码

if cv2.waitKey(1) & 0xFF == 27: break

capInput.release()

cv2.destroyAllWindows()

if __name__ == '__main__':

detect_face()

使用Face++完成人脸辨识

第一次认识Face++还是因为支付宝的人脸支付，响应速度还是非常让人满意的。

现在只需要免费注册一个账号然后新建一个应用就可以使用了，非常方便。

他的官方网址是这个，注册好之后在这里的我的应用中创建应用即可。

创建好应用之后你会获得API Key与API Secret。

Face++的API调用逻辑简单来说是这样的：

上传图片获取读取到的人的face_id
创建Person，获取person_id（Person中的图片可以增加、删除）
比较两个face_id，判断是否是一个人
比较face_id与person_id，判断是否是一个人

上传图片获取face_id

在将图片通过post方法上传到特定的地址后将返回一个json的值。

如果api_key, api_secret没有问题，且在上传的图片中有识别到人脸，那么会存储在json的face键值下。

#coding=utf8

import requests

# 这里填写你的应用的API Key与API Secret

API_KEY = ''

API_SECRET = ''

# 目前的API网址是这个，你可以在API文档里找到这些

BASE_URL = 'httlus.com/v2'

# 使用Requests上传图片

url = '%s/detection/detect?api_key=%s&api_secret=%s&attribute=none'%(

BASE_URL, API_KEY, API_SECRET)

files = {'img': (os.path.basename(fileDir), open(fileDir, 'rb'),

mimetypes.guess_type(fileDir)[0]), }

r = requests.post(url, files = files)

# 如果读取到图片中的头像则输出他们，其中的'face_id'就是我们所需要的值

faces = r.json().get('face')

print faces

创建Person

这个操作没有什么可以讲的内容，可以对照这段程序和官方的API介绍。

官方的API介绍可以见这里，相信看完这一段程序以后你就可以自己完成其余的API了。

# 上接上一段程序

# 读取face_id

if not faces is None: faceIdList = [face['face_id'] for face in faces]

# 使用Requests创建Person

url = '%s/person/create'%BASE_URL

params = {

'api_key': API_KEY,

'api_secret': API_SECRET,

'person_name': 'LittleCoder',

'face_id': ','.join(faceIdList), }

r = requests.get(url, params = params)

# 获取person_id

print r.json.()['person_id']

进度确认

到目前为止，你应该已经可以就给定的两张图片比对是否是同一个人了。

那么让我们来试着写一下这个程序吧，两张图片分别为’pic1.jpg’, ‘pic2.jpg’好了。

下面我给出了我的代码：

def upload_img(fileDir, oneface = True):

url = '%s/detection/detect?api_key=%s&api_secret=%s&attribute=none'%(

BASE_URL, API_KEY, API_SECRET)

if oneface: url += '&mode=oneface'

files = {'img': (os.path.basename(fileDir), open(fileDir, 'rb'),

mimetypes.guess_type(fileDir)[0]), }

r = requests.post(url, files = files)

faces = r.json().get('face')

if faces is None:

print('There is no face found in %s'%fileDir)

else:

return faces[0]['face_id']

def compare(faceId1, faceId2):

url = '%s/recognition/compare'%BASE_URL

params = BASE_PARAMS

params['face_id1'] = faceId1

params['face_id2'] = faceId2

r = requests.get(url, params)

return r.json()

faceId1 = upload_img('pic1.jpg')

faceId2 = upload_img('pic2.jpg')

if face_id1 and face_id2:

print(compare(faceId1, faceId2))

else:

print('Please change two pictures')

成品

到此，所有的知识介绍都结束了，相比大致如何完成这个项目各位读者也已经有想法了吧。

下面我们需要构思一下人脸解锁的思路，大致而言是这样的：

使用一个程序设置账户（包括向账户中存储解锁用的图片）
使用另一个程序登陆（根据输入的用户名测试解锁）

这里会有很多重复的代码，就不再赘述了，你可以在这里或者这里（提取码：c073）下载源代码测试使用。

这里是设置账户的截图：

登陆

结束语

希望读完这篇文章能对你有帮助，有什么不足之处万望指正（鞠躬）。

④ 如何利用python进行精准人脸识别

要调用api接口，建议用face++的，支付宝的人脸识别都是用的这个。可能需要一点费用，不贵，代码里把fece++的api接口放进代码就行，还可以可以检测情绪，年龄等等的。

当然也有其他公司人脸识别的api接口，自己发现吧，其实很多，但基本都不会免费，有的可以试用

⑤ python能做图像识别吗

可以，你可以用它做其余软件能实现的任何功能。大家长用他来处理数据，做深度学习。

⑥ 如何python pil开发图像识别

1. 简介。

图像处理是一门应用非常广的技术，而拥有非常丰富第三方扩展库的 Python 当然不会错过这一门盛宴。PIL （Python Imaging Library）是 Python 中最常用的图像处理库，目前版本为 1.1.7，我们可以在这里下载学习和查找资料。

Image 类是 PIL 库中一个非常重要的类，通过这个类来创建实例可以有直接载入图像文件，读取处理过的图像和通过抓取的方法得到的图像这三种方法。

2. 使用。

导入 Image 模块。然后通过 Image 类中的 open 方法即可载入一个图像文件。如果载入文件失败，则会引起一个 IOError ；若无返回错误，则 open 函数返回一个 Image 对象。现在，我们可以通过一些对象属性来检查文件内容，即：

1 >>> import Image
2 >>> im = Image.open("j.jpg")
3 >>> print im.format, im.size, im.mode
4 JPEG (440, 330) RGB

这里有三个属性，我们逐一了解。

format : 识别图像的源格式，如果该文件不是从文件中读取的，则被置为 None 值。

size : 返回的一个元组，有两个元素，其值为象素意义上的宽和高。

mode : RGB（true color image），此外还有，L（luminance），CMTK（pre-press image）。

现在，我们可以使用一些在 Image 类中定义的方法来操作已读取的图像实例。比如，显示最新载入的图像：

1 >>>im.show()
2 >>>

输出原图：

3.5 更多关于图像文件的读取。

最基本的方式：im = Image.open("filename")

类文件读取：fp = open("filename", "rb"); im = Image.open(fp)

字符串数据读取：import StringIO; im = Image.open(StringIO.StringIO(buffer))

从归档文件读取：import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)

基本的 PIL 目前就练习到这里。其他函数的功能可点击这里进一步阅读。

⑦ Python深度学习之图像识别

作者 | 周伟能

来源 | 小叮当讲SAS和Python

Python在机器学习（人工智能，AI）方面有着很大的优势。谈到人工智能，一般也会谈到其实现的语言Python。前面有几讲也是关于机器学习在图像识别中的应用。今天再来讲一个关于运用google的深度学习框架tensorflow和keras进行训练深度神经网络，并对未知图像进行预测。

导入python模块

导入图像数据

合并列表数据

将图片数据转化为数组

显示一张图片

训练神经网络

我们可以看到测试集的准确率达到99.67%

预测一个图像

预测为汽车的概率为100%。（括号内为真实标签）

预测为美女的概率为100%。（括号内为真实标签）

测试集中前15个图像预测完全正确。Nice!

最后我们来识别单张图片。

结果预测为汽车。Nice!

最后来预测一下外部随便下载的汽车或美女图片

预测为汽车，不错！

小编这里有10张图片，前5张为汽车图片，后五张为美女图片。

下面进行批量预测：

结果也是完全正确。

看到这里，感觉神经网络是不是很神奇，要想让神经网络预测得准确，我们就必须给予大量的数据进行训练模型，优化模型，以至于达到准确识别图像的目的，图像识别作为人工智能的一部分，现在已经慢慢走向成熟，虽然机器也有出错的时候，但是进过不断优化，错误率将会越来越小，相信机器智能或者人工智能时代能够创造出更多智能而美好的东西。为社会，为人类的自由做出更大的贡献。

⑧ 如何用Python实现简单人脸识别

你可以使用opencv库提供的人脸识别模块，这样子会比较快

⑨ 这种图片可以用Python自动识别吗

Python图片文本识别使用的工具是PIL和pytesser。因为他们使用到很多的python库文件，为了避免一个个工具的安装，建议使用pythonxy
pytesser是OCR开源项目的一个模块，在Python中导入这个模块即可将图片中的文字转换成文本。pytesser调用了tesseract。当在Python中调用pytesser模块时，pytesser又用tesseract识别图片中的文字。pytesser的使用步骤如下：

首先，安装Python2.7版本，这个版本比较稳定，建议使用这个版本。
其次，安装pythoncv。
然后，安装PIL工具，pytesser的使用需要PIL库的支持。
接着下载pytesser
最后，将pytesser解压，这个是免安装的，可以将解压后的文件cut到Python安装目录的Lib\site-packages下直接使用，比如我的安装目录是：C:\Python27\Lib\site-packages，同时把这个目录添加到环境变量之中。
完成以上步骤之后，就可以编写图片文本识别的Python脚本了。参考脚本如下：
from pytesser import *
import ImageEnhance
image = Image.open('D:\\workspace\\python\\5.png')
#使用ImageEnhance可以增强图片的识别率
enhancer = ImageEnhance.Contrast(image)
image_enhancer = enhancer.enhance(4)
print image_to_string(image_enhancer)

tesseract是谷歌的一个对图片进行识别的开源框架，免费使用，现在已经支持中文，而且识别率非常高，这里简要来个helloworld级别的认识
下载之后进行安装，不再演示。
在tesseract目录下，有个tesseract.exe文件，主要调用这个执行文件，用cmd运行到这个目录下，在这个目录下同时放置一张需要识别的图片，这里是123.jpg
然后运行:tesseract 123.jpg result
会把123.jpg自动识别并转换为txt文件到result.txt
但是此时中文识别不好
然后找到tessdata目录，把eng.traineddata替换为chi_sim.traineddata,并且把chi_sim.traineddata重命名为eng.traineddata
ok,现在中文识别基本达到90%以上了

⑩ 利用python做机器学习图像识别要怎么做

你需要的不只是分类算法，还要有 Object Detection，如果想采用深度学习方法的话，建议论文直接从 R-CNN 一直看到 Mask R-CNN，之后如果需要速度就看看 YOLO 和 SSD。
当然如果你看不懂上述论文的话，说明你还是要从头开始学习。

导航:首页 > 编程语言 > python自动识别图片头像

python自动识别图片头像

与python自动识别图片头像相关的资料