python圖像crop_Python如何圖像識別

A. 如何python pil開發圖像識別

1. 簡介。

圖像處理是一門應用非常廣的技術，而擁有非常豐富第三方擴展庫的 Python 當然不會錯過這一門盛宴。PIL （Python Imaging Library）是 Python 中最常用的圖像處理庫，目前版本為 1.1.7，我們可以在這里下載學習和查找資料。

Image 類是 PIL 庫中一個非常重要的類，通過這個類來創建實例可以有直接載入圖像文件，讀取處理過的圖像和通過抓取的方法得到的圖像這三種方法。

2. 使用。

導入 Image 模塊。然後通過 Image 類中的 open 方法即可載入一個圖像文件。如果載入文件失敗，則會引起一個 IOError ；若無返回錯誤，則 open 函數返回一個 Image 對象。現在，我們可以通過一些對象屬性來檢查文件內容，即：

1 >>> import Image
2 >>> im = Image.open("j.jpg")
3 >>> print im.format, im.size, im.mode
4 JPEG (440, 330) RGB

這里有三個屬性，我們逐一了解。

format : 識別圖像的源格式，如果該文件不是從文件中讀取的，則被置為 None 值。

size : 返回的一個元組，有兩個元素，其值為象素意義上的寬和高。

mode : RGB（true color image），此外還有，L（luminance），CMTK（pre-press image）。

現在，我們可以使用一些在 Image 類中定義的方法來操作已讀取的圖像實例。比如，顯示最新載入的圖像：

1 >>>im.show()
2 >>>

輸出原圖：

3.5 更多關於圖像文件的讀取。

最基本的方式：im = Image.open("filename")

類文件讀取：fp = open("filename", "rb"); im = Image.open(fp)

字元串數據讀取：import StringIO; im = Image.open(StringIO.StringIO(buffer))

從歸檔文件讀取：import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)

基本的 PIL 目前就練習到這里。其他函數的功能可點擊這里進一步閱讀。

B. 有沒有人用過Python的Image模塊關於crop方法的問題

http://www.cnblogs.com/way_testlife/archive/2011/04/17/2019013.html

box=(100,100,400,400)
region=im.crop(box)

區域由一個4元組定義，表示為坐標是 (left, upper, right, lower)。 Python Imaging Library 使用左上角為 (0, 0)的坐標系統。同時要注意，這些坐標指向像素之間的位置，因此上述例子中描述的區域的大小為300x300像素。

後兩個數字需要比前兩個大

C. python圖像處理初學者求助

Pillow是Python里的圖像處理庫（PIL：Python Image Library），提供了了廣泛的文件格式支持，強大的圖像處理能力，主要包括圖像儲存、圖像顯示、格式轉換以及基本的圖像處理操作等。
1）使用 Image 類
PIL最重要的類是 Image class, 你可以通過多種方法創建這個類的實例；你可以從文件載入圖像，或者處理其他圖像, 或者從 scratch 創建。
要從文件載入圖像，可以使用open( )函數，在Image模塊中：

1
2

>>> from PIL import Image
>>> im = Image.open("E:/photoshop/1.jpg")

載入成功後，將返回一個Image對象，可以通過使用示例屬性查看文件內容：

1
2
3

>>> print(im.format, im.size, im.mode)
('JPEG', (600, 351), 'RGB')
>>>

format 這個屬性標識了圖像來源。如果圖像不是從文件讀取它的值就是None。size屬性是一個二元tuple，包含width和height（寬度和高度，單位都是px）。 mode 屬性定義了圖像bands的數量和名稱，以及像素類型和深度。常見的modes 有「L」 (luminance) 表示灰度圖像, 「RGB」表示真彩色圖像, and 「CMYK」表示出版圖像。
如果文件打開錯誤，返回 IOError 錯誤。
只要你有了 Image 類的實例，你就可以通過類的方法處理圖像。比如，下列方法可以顯示圖像：

1

im.show()

2）讀寫圖像
PIL 模塊支持大量圖片格式。使用在 Image 模塊的 open() 函數從磁碟讀取文件。你不需要知道文件格式就能打開它，這個庫能夠根據文件內容自動確定文件格式。要保存文件，使用 Image 類的 save() 方法。保存文件的時候文件名變得重要了。除非你指定格式，否則這個庫將會以文件名的擴展名作為格式保存。
載入文件，並轉化為png格式：

1
2
3
4
5
6
7
8
9
10
11
12
13

"Python Image Library Test"
from PIL import Image
import os
import sys

for infile in sys.argv[1:]:
f,e = os.path.splitext(infile)
outfile = f +".png"
if infile != outfile:
try:
Image.open(infile).save(outfile)
except IOError:
print("Cannot convert", infile)

save() 方法的第二個參數可以指定文件格式。
3）創建縮略圖
縮略圖是網路開發或圖像軟體預覽常用的一種基本技術，使用Python的Pillow圖像庫可以很方便的建立縮略圖，如下：

1
2
3
4
5
6
7

# create thumbnail
size = (128,128)
for infile in glob.glob("E:/photoshop/*.jpg"):
f, ext = os.path.splitext(infile)
img = Image.open(infile)
img.thumbnail(size,Image.ANTIALIAS)
img.save(f+".thumbnail","JPEG")

上段代碼對photoshop下的jpg圖像文件全部創建縮略圖，並保存，glob模塊是一種智能化的文件名匹配技術，在批圖像處理中經常會用到。
注意：Pillow庫不會直接解碼或者載入圖像柵格數據。當你打開一個文件，只會讀取文件頭信息用來確定格式，顏色模式，大小等等，文件的剩餘部分不會主動處理。這意味著打開一個圖像文件的操作十分快速，跟圖片大小和壓縮方式無關。
4）圖像的剪切、粘貼與合並操作
Image 類包含的方法允許你操作圖像部分選區，PIL.Image.Image.crop 方法獲取圖像的一個子矩形選區，如：

1
2
3
4

# crop, paste and merge
im = Image.open("E:/photoshop/lena.jpg")
box = (100,100,300,300)
region = im.crop(box)

矩形選區有一個4元元組定義，分別表示左、上、右、下的坐標。這個庫以左上角為坐標原點，單位是px，所以上訴代碼復制了一個 200×200 pixels 的矩形選區。這個選區現在可以被處理並且粘貼到原圖。

1
2

region = region.transpose(Image.ROTATE_180)
im.paste(region, box)

當你粘貼矩形選區的時候必須保證尺寸一致。此外，矩形選區不能在圖像外。然而你不必保證矩形選區和原圖的顏色模式一致，因為矩形選區會被自動轉換顏色。
5）分離和合並顏色通道
對於多通道圖像，有時候在處理時希望能夠分別對每個通道處理，處理完成後重新合成多通道，在Pillow中，很簡單，如下：

1
2

r,g,b = im.split()
im = Image.merge("RGB", (r,g,b))

對於split（）函數，如果是單通道的，則返回其本身，否則，返回各個通道。
6）幾何變換
對圖像進行幾何變換是一種基本處理，在Pillow中包括resize( )和rotate( )，如用法如下：

1
2

out = im.resize((128,128))
out = im.rotate(45) # degree conter-clockwise

其中，resize( )函數的參數是一個新圖像大小的元祖，而rotate( )則需要輸入順時針的旋轉角度。在Pillow中，對於一些常見的旋轉作了專門的定義：

1
2
3
4
5

out = im.transpose(Image.FLIP_LEFT_RIGHT)
out = im.transpose(Image.FLIP_TOP_BOTTOM)
out = im.transpose(Image.ROTATE_90)
out = im.transpose(Image.ROTATE_180)
out = im.transpose(Image.ROTATE_270)

7）顏色空間變換
在處理圖像時，根據需要進行顏色空間的轉換，如將彩色轉換為灰度：

1
2

cmyk = im.convert("CMYK")
gray = im.convert("L")

8）圖像濾波

D. Cropman：識別人臉的圖片裁剪Python程序怎麼用

就那個頁面已經寫得非常清楚了。
把那些命令拿來執行，有錯就解決錯就可以了。
最大的問題可能是你根本沒寫過python程序，還沒入門，就暫時別折騰這個庫了，還有好多依賴項要安裝。

E. python怎樣改才能變為，正方形，不是長方形的螺旋線

如下圖所示，把代碼中對應部分代碼改成紅圏處樣式

運行結果展示

上圖為運行結果，不知是否符合需求

F. 怎麼樣在Python編程中使用Pillow來處理圖像

安裝
剛接觸Pillow的朋友先來看一下Pillow的安裝方法，在這里我們以Mac OS環境為例：（1）、使用 pip 安裝 Python 庫。pip 是 Python 的包管理工具，安裝後就可以直接在命令行一站式地安裝/管理各種庫了（pip 文檔）。

$ wget http://pypi.python.org/packages/source/p/pip/pip-0.7.2.tar.gz$ tar xzf pip-0.7.2.tar.gz$ cd pip-0.7.2$ python setup.py install

（2）、使用 pip 下載獲取 Pillow：

$ pip install pillow

（3）、安裝過程中命令行出現錯誤提示：」error: command 『clang' failed with exit status
1」。上網查閱，發現需要通過 Xcode 更新 Command Line Tool。於是打開
Xcode->Preferences->Downloads-Components選項卡。咦？竟然沒了 Command Line
Tools。再查，發現 Xcode 5 以上現在需要用命令行安裝：

$ xcode-select —install

系統會彈出安裝命令行工具的提示，點擊安裝即可。
此時再 pip install pillow，就安裝成功了。
pip freeze 命令查看已經安裝的 Python 包，Pillow 已經乖乖躺那兒了。
好了，下面開始進入教程~
Image類
Pillow中最重要的類就是Image，該類存在於同名的模塊中。可以通過以下幾種方式實例化：從文件中讀取圖片，處理其他圖片得到，或者直接創建一個圖片。
使用Image模塊中的open函數打開一張圖片：

>>> from PIL import Image>>> im = Image.open("lena.ppm")

如果打開成功，返回一個Image對象，可以通過對象屬性檢查文件內容

>>> from __future__ import print_function>>> print(im.format, im.size, im.mode)

PPM (512, 512) RGB

format屬性定義了圖像的格式，如果圖像不是從文件打開的，那麼該屬性值為None；size屬性是一個tuple，表示圖像的寬和高（單位為像素）；mode屬性為表示圖像的模式，常用的模式為：L為灰度圖，RGB為真彩色，CMYK為pre-press圖像。
如果文件不能打開，則拋出IOError異常。
當有一個Image對象時，可以用Image類的各個方法進行處理和操作圖像，例如顯示圖片：

>>> im.show()

ps：標准版本的show()方法不是很有效率，因為它先將圖像保存為一個臨時文件，然後使用xv進行顯示。如果沒有安裝xv，該函數甚至不能工作。但是該方法非常便於debug和test。（windows中應該調用默認圖片查看器打開）
讀寫圖片
Pillow庫支持相當多的圖片格式。直接使用Image模塊中的open()函數讀取圖片，而不必先處理圖片的格式，Pillow庫自動根據文件決定格式。
Image模塊中的save()函數可以保存圖片，除非你指定文件格式，那麼文件名中的擴展名用來指定文件格式。
圖片轉成jpg格式

from __future__ import print_functionimport os, sysfrom PIL import Imagefor infile in sys.argv[1:]: f, e = os.path.splitext(infile) outfile = f + ".jpg" if infile != outfile: try: Image.open(infile).save(outfile) except IOError: print("cannot convert", infile)

save函數的第二個參數可以用來指定圖片格式，如果文件名中沒有給出一個標準的圖像格式，那麼第二個參數是必須的。
創建縮略圖

from __future__ import print_functionimport os, sysfrom PIL import Imagesize = (128, 128)for infile in sys.argv[1:]: outfile = os.path.splitext(infile)[0] + ".thumbnail" if infile != outfile: try: im = Image.open(infile) im.thumbnail(size) im.save(outfile, "JPEG") except IOError: print("cannot create thumbnail for", infile)

必須指出的是除非必須，Pillow不會解碼或raster數據。當你打開一個文件，Pillow通過文件頭確定文件格式，大小，mode等數據，餘下數據直到需要時才處理。
這意味著打開文件非常快，與文件大小和壓縮格式無關。下面的程序用來快速確定圖片屬性：
確定圖片屬性

from __future__ import print_functionimport sysfrom PIL import Imagefor infile in sys.argv[1:]: try: with Image.open(infile) as im: print(infile, im.format, "%dx%d" % im.size, im.mode) except IOError: pass

裁剪、粘貼、與合並圖片
Image類包含還多操作圖片區域的方法。如crop()方法可以從圖片中提取一個子矩形
從圖片中復制子圖像

box = im.() #直接復制圖像box = (100, 100, 400, 400)region = im.crop(box)

區域由4-tuple決定，該tuple中信息為(left, upper, right, lower)。 Pillow左邊系統的原點（0，0）為圖片的左上角。坐標中的數字單位為像素點，所以上例中截取的圖片大小為300*300像素^2。
處理子圖，粘貼回原圖

region = region.transpose(Image.ROTATE_180)im.paste(region, box)

將子圖paste回原圖時，子圖的region必須和給定box的region吻合。該region不能超過原圖。而原圖和region的mode不需要匹配，Pillow會自動處理。
另一個例子

Rolling an imagedef roll(image, delta): "Roll an image sideways" image = image.() #復制圖像 xsize, ysize = image.size delta = delta % xsize if delta == 0: return image part1 = image.crop((0, 0, delta, ysize)) part2 = image.crop((delta, 0, xsize, ysize)) image.paste(part2, (0, 0, xsize-delta, ysize)) image.paste(part1, (xsize-delta, 0, xsize, ysize)) return image

分離和合並通道

r, g, b = im.split()im = Image.merge("RGB", (b, g, r))

對於單通道圖片，split()返回圖像本身。為了處理單通道圖片，必須先將圖片轉成RGB。
幾何變換
Image類有resize()、rotate()和transpose()、transform()方法進行幾何變換。
簡單幾何變換

out = im.resize((128, 128))out = im.rotate(45) # 順時針角度表示

置換圖像

out = im.transpose(Image.FLIP_LEFT_RIGHT)out = im.transpose(Image.FLIP_TOP_BOTTOM)out = im.transpose(Image.ROTATE_90)out = im.transpose(Image.ROTATE_180)out = im.transpose(Image.ROTATE_270)

transpose()和象的rotate()沒有性能差別。
更通用的圖像變換方法可以使用transform()
模式轉換
convert()方法
模式轉換

im = Image.open('lena.ppm').convert('L')

圖像增強
Filter ImageFilter模塊包含很多預定義的增強filters，通過filter()方法使用
應用filters

from PIL import ImageFilterout = im.filter(ImageFilter.DETAIL)

像素點處理
point()方法通過一個函數或者查詢表對圖像中的像素點進行處理（例如對比度操作）。
像素點變換

# multiply each pixel by 1.2out = im.point(lambda i: i * 1.2)

上述方法可以利用簡單的表達式進行圖像處理，通過組合point()和paste()還能選擇性地處理圖片的某一區域。
處理單獨通道

# split the image into indivial bandssource = im.split()R, G, B = 0, 1, 2# select regions where red is less than 100mask = source[R].point(lambda i: i < 100 and 255)# process the green bandout = source[G].point(lambda i: i * 0.7)# paste the processed band back, but only where red was < 100source[G].paste(out, None, mask)# build a new multiband imageim = Image.merge(im.mode, source)

注意到創建mask的語句：

mask = source[R].point(lambda i: i < 100 and 255)

該句可以用下句表示

imout = im.point(lambda i: expression and 255)

如果expression為假則返回expression的值為0（因為and語句已經可以得出結果了），否則返回255。（mask參數用法：當為0時，保留當前值，255為使用paste進來的值，中間則用於transparency效果）
高級圖片增強
對其他高級圖片增強，應該使用ImageEnhance模塊。一旦有一個Image對象，應用ImageEnhance對象就能快速地進行設置。可以使用以下方法調整對比度、亮度、色平衡和銳利度。
圖像增強

from PIL import ImageEnhanceenh = ImageEnhance.Contrast(im)enh.enhance(1.3).show("30% more contrast")

動態圖
Pillow支持一些動態圖片的格式如FLI/FLC，GIF和其他一些處於實驗階段的格式。TIFF文件同樣可以包含數幀圖像。
當讀取動態圖時，PIL自動讀取動態圖的第一幀，可以使用seek和tell方法讀取不同鄭

from PIL import Imageim = Image.open("animation.gif")im.seek(1) # skip to the second frametry: while 1: im.seek(im.tell()+1) # do something to imexcept EOFError: pass # end of sequence

當讀取到最後一幀時，Pillow拋出EOFError異常。
當前版本只允許seek到下一鄭為了倒回之前，必須重新打開文件。
或者可以使用下述迭代器類
動態圖迭代器類

class ImageSequence: def __init__(self, im): self.im = im def __getitem__(self, ix): try: if ix: self.im.seek(ix) return self.im except EOFError: raise IndexError # end of sequencefor frame in ImageSequence(im): # ...do something to frame...Postscript Printing

Pillow允許通過Postscript Printer在圖片上添加images、text、graphics。

Drawing Postscriptfrom PIL import Imagefrom PIL import PSDrawim = Image.open("lena.ppm")title = "lena"box = (1*72, 2*72, 7*72, 10*72) # in pointsps = PSDraw.PSDraw() # default is sys.stdoutps.begin_document(title)# draw the image (75 dpi)ps.image(box, im, 75)ps.rectangle(box)# draw centered titleps.setfont("HelveticaNarrow-Bold", 36)w, h, b = ps.textsize(title)ps.text((4*72-w/2, 1*72-h), title)ps.end_document()

更多讀取圖片方法
之前說到Image模塊的open()函數已經足夠日常使用。該函數的參數也可以是一個文件對象。
從string中讀取

import StringIOim = Image.open(StringIO.StringIO(buffer))

從tar文件中讀取

from PIL import TarIOfp = TarIO.TarIO("Imaging.tar", "Imaging/test/lena.ppm")im = Image.open(fp)

草稿模式
draft()方法允許在不讀取文件內容的情況下盡可能（可能不會完全等於給定的參數）地將圖片轉成給定模式和大小，這在生成縮略圖的時候非常有效（速度要求比質量高的場合）。
draft模式

from __future__ import print_functionim = Image.open(file)print("original =", im.mode, im.size)im.draft("L", (100, 100))print("draft =", im.mode, im.size)

G. python的pillow庫怎麼處理灰度圖像

Pillow是Python里的圖像處理庫（PIL：Python Image Library），提供了了廣泛的文件格式支持，強大的圖像處理能力，主要包括圖像儲存、圖像顯示、格式轉換以及基本的圖像處理操作等。
1）使用 Image 類
PIL最重要的類是 Image class, 你可以通過多種方法創建這個類的實例；你可以從文件載入圖像，或者處理其他圖像, 或者從 scratch 創建。
要從文件載入圖像，可以使用open( )函數，在Image模塊中：
>>> from PIL import Image
>>> im = Image.open("E:/photoshop/1.jpg")

載入成功後，將返回一個Image對象，可以通過使用示例屬性查看文件內容：

>>> print(im.format, im.size, im.mode)
('JPEG', (600, 351), 'RGB')
>>>

format 這個屬性標識了圖像來源。如果圖像不是從文件讀取它的值就是None。size屬性是一個二元tuple，包含width和height（寬度和高度，單位都是px）。 mode 屬性定義了圖像bands的數量和名稱，以及像素類型和深度。常見的modes 有「L」 (luminance) 表示灰度圖像, 「RGB」表示真彩色圖像, and 「CMYK」表示出版圖像。
如果文件打開錯誤，返回 IOError 錯誤。
只要你有了 Image 類的實例，你就可以通過類的方法處理圖像。比如，下列方法可以顯示圖像：
im.show()

2）讀寫圖像
PIL 模塊支持大量圖片格式。使用在 Image 模塊的 open() 函數從磁碟讀取文件。你不需要知道文件格式就能打開它，這個庫能夠根據文件內容自動確定文件格式。要保存文件，使用 Image 類的 save() 方法。保存文件的時候文件名變得重要了。除非你指定格式，否則這個庫將會以文件名的擴展名作為格式保存。
載入文件，並轉化為png格式：

"Python Image Library Test"
from PIL import Image
import os
import sys

for infile in sys.argv[1:]:
f,e = os.path.splitext(infile)
outfile = f +".png"
if infile != outfile:
try:
Image.open(infile).save(outfile)
except IOError:
print("Cannot convert", infile)

save() 方法的第二個參數可以指定文件格式。
3）創建縮略圖
縮略圖是網路開發或圖像軟體預覽常用的一種基本技術，使用Python的Pillow圖像庫可以很方便的建立縮略圖，如下：
# create thumbnail
size = (128,128)
for infile in glob.glob("E:/photoshop/*.jpg"):
f, ext = os.path.splitext(infile)
img = Image.open(infile)
img.thumbnail(size,Image.ANTIALIAS)
img.save(f+".thumbnail","JPEG")

上段代碼對photoshop下的jpg圖像文件全部創建縮略圖，並保存，glob模塊是一種智能化的文件名匹配技術，在批圖像處理中經常會用到。
注意：Pillow庫不會直接解碼或者載入圖像柵格數據。當你打開一個文件，只會讀取文件頭信息用來確定格式，顏色模式，大小等等，文件的剩餘部分不會主動處理。這意味著打開一個圖像文件的操作十分快速，跟圖片大小和壓縮方式無關。
4）圖像的剪切、粘貼與合並操作
Image 類包含的方法允許你操作圖像部分選區，PIL.Image.Image.crop 方法獲取圖像的一個子矩形選區，如：

# crop, paste and merge
im = Image.open("E:/photoshop/lena.jpg")
box = (100,100,300,300)
region = im.crop(box)

矩形選區有一個4元元組定義，分別表示左、上、右、下的坐標。這個庫以左上角為坐標原點，單位是px，所以上訴代碼復制了一個 200×200 pixels 的矩形選區。這個選區現在可以被處理並且粘貼到原圖。

region = region.transpose(Image.ROTATE_180)
im.paste(region, box)

當你粘貼矩形選區的時候必須保證尺寸一致。此外，矩形選區不能在圖像外。然而你不必保證矩形選區和原圖的顏色模式一致，因為矩形選區會被自動轉換顏色。
5）分離和合並顏色通道
對於多通道圖像，有時候在處理時希望能夠分別對每個通道處理，處理完成後重新合成多通道，在Pillow中，很簡單，如下：

r,g,b = im.split()
im = Image.merge("RGB", (r,g,b))

對於split（）函數，如果是單通道的，則返回其本身，否則，返回各個通道。
6）幾何變換
對圖像進行幾何變換是一種基本處理，在Pillow中包括resize( )和rotate( )，如用法如下：

out = im.resize((128,128))
out = im.rotate(45) # degree conter-clockwise

其中，resize( )函數的參數是一個新圖像大小的元祖，而rotate( )則需要輸入順時針的旋轉角度。在Pillow中，對於一些常見的旋轉作了專門的定義：

out = im.transpose(Image.FLIP_LEFT_RIGHT)
out = im.transpose(Image.FLIP_TOP_BOTTOM)
out = im.transpose(Image.ROTATE_90)
out = im.transpose(Image.ROTATE_180)
out = im.transpose(Image.ROTATE_270)

7）顏色空間變換
在處理圖像時，根據需要進行顏色空間的轉換，如將彩色轉換為灰度：

cmyk = im.convert("CMYK")
gray = im.convert("L")

8）圖像濾波
圖像濾波在ImageFilter 模塊中，在該模塊中，預先定義了很多增強濾波器，可以通過filter( )函數使用，預定義濾波器包括：
BLUR、CONTOUR、DETAIL、EDGE_ENHANCE、EDGE_ENHANCE_MORE、EMBOSS、FIND_EDGES、SMOOTH、SMOOTH_MORE、SHARPEN。其中BLUR就是均值濾波，CONTOUR找輪廓，FIND_EDGES邊緣檢測，使用該模塊時，需先導入，使用方法如下：

from PIL import ImageFilter

imgF = Image.open("E:/photoshop/lena.jpg")
outF = imgF.filter(ImageFilter.DETAIL)
conF = imgF.filter(ImageFilter.CONTOUR)
edgeF = imgF.filter(ImageFilter.FIND_EDGES)
imgF.show()
outF.show()
conF.show()
edgeF.show()

除此以外，ImageFilter模塊還包括一些擴展性強的濾波器：
class PIL.ImageFilter.GaussianBlur(radius=2)

H. Python如何圖像識別

首先，先定位好問題是屬於圖像識別任務中的哪一類，最好上傳一張植物葉子的圖片。因為目前基於深度學習的卷積神經網路（CNN）確實在圖像識別任務中取得很好的效果，深度學習屬於機器學習，其研究的範式，或者說處理圖像的步驟大體上是一致的。

1、第一步，准備好數據集，這里是指，需要知道輸入、輸出（視任務而定，針對你這個問題，建議使用有監督模型）是什麼。你可以准備一個文件夾，裡面存放好植物葉子的圖像，而每張圖像對應一個標簽（有病/沒病，或者是多類別標簽，可能具體到哪一種病）。
具體實現中，會將數據集分為三個：訓練集（計算模型參數）、驗證集（調參，這個經常可以不需要實現劃分，在python中可以用scikit-learn中的函數解決。測試集用於驗證模型的效果，與前面兩個的區別是，模型使用訓練集和驗證集時，是同時使用了輸入數據和標簽，而在測試階段，模型是用輸入+模型參數，得到的預測與真實標簽進行對比，進而評估效果。
2、確定圖像識別的任務是什麼？

圖像識別的任務可以分為四個：圖像分類、目標檢測、語義分割、實例分割，有時候是幾個任務的結合。
圖像分類是指以圖像為輸入，輸出對該圖像內容分類的描述，可以是多分類問題，比如貓狗識別。通過足夠的訓練數據（貓和狗的照片-標簽，當然現在也有一系列的方法可以做小樣本訓練，這是細節了，這里並不敞開講），讓計算機/模型輸出這張圖片是貓或者狗，及其概率。當然，如果你的訓練數據還有其它動物，也是可以的，那就是圖像多分類問題。
目標檢測指將圖像或者視頻中的目標與不感興趣的部分區分開，判斷是否存在目標，並確定目標的具體位置。比如，想要確定這只狗所佩戴的眼睛的位置，輸入一張圖片，輸出眼睛的位置（可視化後可以講目標區域框出來）。

看到這里，應該想想植物葉子診斷疾病的問題，只需要輸入一整張植物葉子的圖片，輸出是哪種疾病，還是需要先提取葉子上某些感興趣區域（可能是病變區域），在用病變區域的特徵，對應到具體的疾病？
語義分割是當今計算機視覺領域的關鍵問題之一，宏觀上看，語義分割是一項高層次的任務。其目的是以一些原始圖像作為輸入，輸出具有突出顯示的感興趣的掩膜，其實質上是實現了像素級分類。對於輸入圖片，輸出其舌頭區域（注意可以是不規則的，甚至不連續的）。

而實例分割，可以說是在語義分割的基礎上，在像素層面給出屬於每個實例的像素。

看到這里，可以具體思考下自己的問題是對應其中的哪一類問題，或者是需要幾種任務的結合。

3、實際操作
可以先通過一個簡單的例子入手，先了解構建這一個框架需要准備什麼。手寫數字識別可以說是深度學習的入門數據集，其任務也經常作為該領域入門的案例，也可以自己在網上尋找。

I. python PIL如何才能把圖片修改成正方形或者任意尺寸而不產生擠壓

使用裁剪(crop)

img.crop(0,0,w,h)

J. python中PLE調整圖片大小,等比例壓縮文件，怎麼寫代碼

How do I read image data from a URL in Python?

importosimportImagefileName='c:/py/jb51.jpg'fp=open(fileName,'rb')im=Image.open(fp)fp.close()x,y=im.sizeifx <300or y <300:os.remove(fileName)

from PIL import Imageimport requestsimport numpy as npfrom StringIO import StringIOresponse = requests.get(url)img = np.array(Image.open(StringIO(response.content)))

from PIL import Imageimport urllib2

im = Image.open(urllib2.urlopen(url))

or if you userequests:

from PIL import Imageimport requests

im = Image.open(requests.get(url, stream=True).raw)

[python] view plain

[html] view plain

#coding:utf-8
'''
python圖片處理
'''
importImageasimage
#等比例壓縮圖片
defresizeImg(**args):
args_key={'ori_img':'','dst_img':'','dst_w':'','dst_h':'','save_q':75}
arg={}
forkeyinargs_key:
ifkeyinargs:
arg[key]=args[key]
im=image.open(arg['ori_img'])
ori_w,ori_h=im.size
widthRatio=heightRatio=None
ratio=1
if(ori_wandori_w>arg['dst_w'])or(ori_handori_h>arg['dst_h']):
ifarg['dst_w']andori_w>arg['dst_w']:
widthRatio=float(arg['dst_w'])/ori_w#正確獲取小數的方式
ifarg['dst_h']andori_h>arg['dst_h']:
heightRatio=float(arg['dst_h'])/ori_h
ifwidthRatioandheightRatio:
ifwidthRatio<heightRatio:
ratio=widthRatio
else:
ratio=heightRatio
ifwidthRatioandnotheightRatio:
ratio=widthRatio
ifheightRatioandnotwidthRatio:
ratio=heightRatio
newWidth=int(ori_w*ratio)
newHeight=int(ori_h*ratio)
else:
newWidth=ori_w
newHeight=ori_h
im.resize((newWidth,newHeight),image.ANTIALIAS).save(arg['dst_img'],quality=arg['save_q'])
'''
image.ANTIALIAS還有如下值：
NEAREST:usenearestneighbour
BILINEAR:
BICUBIC:
ANTIALIAS:bestdown-sizingfilter
'''
#裁剪壓縮圖片
defclipResizeImg(**args):
args_key={'ori_img':'','dst_img':'','dst_w':'','dst_h':'','save_q':75}
arg={}
forkeyinargs_key:
ifkeyinargs:
arg[key]=args[key]
im=image.open(arg['ori_img'])
ori_w,ori_h=im.size
dst_scale=float(arg['dst_h'])/arg['dst_w']#目標高寬比
ori_scale=float(ori_h)/ori_w#原高寬比
ifori_scale>=dst_scale:
#過高
width=ori_w
height=int(width*dst_scale)
x=0
y=(ori_h-height)/3
else:
#過寬
height=ori_h
width=int(height*dst_scale)
x=(ori_w-width)/2
y=0
#裁剪
box=(x,y,width+x,height+y)
#這里的參數可以這么認為：從某圖的(x,y)坐標開始截，截到(width+x,height+y)坐標
#所包圍的圖像，crop方法與php中的image方法大為不一樣
newIm=im.crop(box)
im=None
#壓縮
ratio=float(arg['dst_w'])/width
newWidth=int(width*ratio)
newHeight=int(height*ratio)
newIm.resize((newWidth,newHeight),image.ANTIALIAS).save(arg['dst_img'],quality=arg['save_q'])
#水印(這里僅為圖片水印)
defwaterMark(**args):
args_key={'ori_img':'','dst_img':'','mark_img':'','water_opt':''}
arg={}
forkeyinargs_key:
ifkeyinargs:
arg[key]=args[key]
im=image.open(arg['ori_img'])
ori_w,ori_h=im.size
mark_im=image.open(arg['mark_img'])
mark_w,mark_h=mark_im.size
option={'leftup':(0,0),'rightup':(ori_w-mark_w,0),'leftlow':(0,ori_h-mark_h),
'rightlow':(ori_w-mark_w,ori_h-mark_h)
}
im.paste(mark_im,option[arg['water_opt']],mark_im.convert('RGBA'))
im.save(arg['dst_img'])
#Demon
#源圖片
ori_img='D:/tt.jpg'
#水印標
mark_img='D:/mark.png'
#水印位置(右下)
water_opt='rightlow'
#目標圖片
dst_img='D:/python_2.jpg'
#目標圖片大小
dst_w=94
dst_h=94
#保存的圖片質量
save_q=35
#裁剪壓縮
clipResizeImg(ori_img=ori_img,dst_img=dst_img,dst_w=dst_w,dst_h=dst_h,save_q=save_q)
#等比例壓縮
#resizeImg(ori_img=ori_img,dst_img=dst_img,dst_w=dst_w,dst_h=dst_h,save_q=save_q)
#水印
#waterMark(ori_img=ori_img,dst_img=dst_img,mark_img=mark_img,water_opt=water_opt)

導航:首頁 > 編程語言 > python圖像crop

python圖像crop

與python圖像crop相關的資料