概率加密問題_MD5加密問題

㈠ MD5加密問題

MD5隻是個散列演算法，不是加密演算法，MD5是無法復原的。
不同的值，經MD5運算過後，產生的結果可能是一樣的。最簡單的散列演算法，就是取除以10的余數，1、11、21、31運算過後都等於1。
MD5值重復的概率是很小的，所以普遍用來檢驗文件是否被更改，所謂的加密也只能用來驗證密碼是否一致，是不可逆的，不可能將內容加密又解密出來的。

㈡加密演算法問題

MD5的全稱是Message-Digest Algorithm 5（信息-摘要演算法），在90年代初由MIT Laboratory for Computer Science和RSA Data Security Inc的Ronald L. Rivest開發出來，經MD2、MD3和MD4發展而來。它的作用是讓大容量信息在用數字簽名軟體簽署私人密匙前被"壓縮"成一種保密的格式（就是把一個任意長度的位元組串變換成一定長的大整數）。不管是MD2、MD4還是MD5，它們都需要獲得一個隨機長度的信息並產生一個128位的信息摘要。雖然這些演算法的結構或多或少有些相似，但MD2的設計與MD4和MD5完全不同，那是因為MD2是為8位機器做過設計優化的，而MD4和MD5卻是面向32位的電腦。這三個演算法的描述和C語言源代碼在Internet RFCs 1321中有詳細的描述（http://www.ietf.org/rfc/rfc1321.txt），這是一份最權威的文檔，由Ronald L. Rivest在1992年8月向IEFT提交。

Van Oorschot和Wiener曾經考慮過一個在散列中暴力搜尋沖突的函數（Brute-Force Hash Function），而且他們猜測一個被設計專門用來搜索MD5沖突的機器（這台機器在1994年的製造成本大約是一百萬美元）可以平均每24天就找到一個沖突。但單從1991年到2001年這10年間，竟沒有出現替代MD5演算法的MD6或被叫做其他什麼名字的新演算法這一點，我們就可以看出這個瑕疵並沒有太多的影響MD5的安全性。上面所有這些都不足以成為MD5的在實際應用中的問題。並且，由於MD5演算法的使用不需要支付任何版權費用的，所以在一般的情況下（非絕密應用領域。但即便是應用在絕密領域內，MD5也不失為一種非常優秀的中間技術），MD5怎麼都應該算得上是非常安全的了。

演算法的應用

MD5的典型應用是對一段信息（Message）產生信息摘要（Message-Digest），以防止被篡改。比如，在UNIX下有很多軟體在下載的時候都有一個文件名相同，文件擴展名為.md5的文件，在這個文件中通常只有一行文本，大致結構如：

MD5 (tanajiya.tar.gz) =

這就是tanajiya.tar.gz文件的數字簽名。MD5將整個文件當作一個大文本信息，通過其不可逆的字元串變換演算法，產生了這個唯一的MD5信息摘要。如果在以後傳播這個文件的過程中，無論文件的內容發生了任何形式的改變（包括人為修改或者下載過程中線路不穩定引起的傳輸錯誤等），只要你對這個文件重新計算MD5時就會發現信息摘要不相同，由此可以確定你得到的只是一個不正確的文件。如果再有一個第三方的認證機構，用MD5還可以防止文件作者的"抵賴"，這就是所謂的數字簽名應用。

MD5還廣泛用於加密和解密技術上。比如在UNIX系統中用戶的密碼就是以MD5（或其它類似的演算法）經加密後存儲在文件系統中。當用戶登錄的時候，系統把用戶輸入的密碼計算成MD5值，然後再去和保存在文件系統中的MD5值進行比較，進而確定輸入的密碼是否正確。通過這樣的步驟，系統在並不知道用戶密碼的明碼的情況下就可以確定用戶登錄系統的合法性。這不但可以避免用戶的密碼被具有系統管理員許可權的用戶知道，而且還在一定程度上增加了密碼被破解的難度。

正是因為這個原因，現在被黑客使用最多的一種破譯密碼的方法就是一種被稱為"跑字典"的方法。有兩種方法得到字典，一種是日常搜集的用做密碼的字元串表，另一種是用排列組合方法生成的，先用MD5程序計算出這些字典項的MD5值，然後再用目標的MD5值在這個字典中檢索。我們假設密碼的最大長度為8位位元組（8 Bytes），同時密碼只能是字母和數字，共26+26+10=62個字元，排列組合出的字典的項數則是P(62,1)+P(62,2)….+P(62,8)，那也已經是一個很天文的數字了，存儲這個字典就需要TB級的磁碟陣列，而且這種方法還有一個前提，就是能獲得目標賬戶的密碼MD5值的情況下才可以。這種加密技術被廣泛的應用於UNIX系統中，這也是為什麼UNIX系統比一般操作系統更為堅固一個重要原因。

演算法描述

對MD5演算法簡要的敘述可以為：MD5以512位分組來處理輸入的信息，且每一分組又被劃分為16個32位子分組，經過了一系列的處理後，演算法的輸出由四個32位分組組成，將這四個32位分組級聯後將生成一個128位散列值。

在MD5演算法中，首先需要對信息進行填充，使其位元組長度對512求余的結果等於448。因此，信息的位元組長度（Bits Length）將被擴展至N*512+448，即N*64+56個位元組（Bytes），N為一個正整數。填充的方法如下，在信息的後面填充一個1和無數個0，直到滿足上面的條件時才停止用0對信息的填充。然後，在在這個結果後面附加一個以64位二進製表示的填充前信息長度。經過這兩步的處理，現在的信息位元組長度=N*512+448+64=(N+1)*512，即長度恰好是512的整數倍。這樣做的原因是為滿足後面處理中對信息長度的要求。

MD5中有四個32位被稱作鏈接變數（Chaining Variable）的整數參數，他們分別為：A=0x01234567，B=0x89abcdef，C=0xfedcba98，D=0x76543210。

當設置好這四個鏈接變數後，就開始進入演算法的四輪循環運算。循環的次數是信息中512位信息分組的數目。

將上面四個鏈接變數復制到另外四個變數中：A到a，B到b，C到c，D到d。

主循環有四輪（MD4隻有三輪），每輪循環都很相似。第一輪進行16次操作。每次操作對a、b、c和d中的其中三個作一次非線性函數運算，然後將所得結果加上第四個變數，文本的一個子分組和一個常數。再將所得結果向右環移一個不定的數，並加上a、b、c或d中之一。最後用該結果取代a、b、c或d中之一。
以一下是每次操作中用到的四個非線性函數（每輪一個）。

F(X,Y,Z) =(X&Y)|((~X)&Z)
G(X,Y,Z) =(X&Z)|(Y&(~Z))
H(X,Y,Z) =X^Y^Z
I(X,Y,Z)=Y^(X|(~Z))
（&是與，|是或，~是非，^是異或）

這四個函數的說明：如果X、Y和Z的對應位是獨立和均勻的，那麼結果的每一位也應是獨立和均勻的。F是一個逐位運算的函數。即，如果X，那麼Y，否則Z。函數H是逐位奇偶操作符。

假設Mj表示消息的第j個子分組（從0到15），<<
FF(a,b,c,d,Mj,s,ti)表示a=b+((a+(F(b,c,d)+Mj+ti)<< GG(a,b,c,d,Mj,s,ti)表示a=b+((a+(G(b,c,d)+Mj+ti)<< HH(a,b,c,d,Mj,s,ti)表示a=b+((a+(H(b,c,d)+Mj+ti)<< II(a,b,c,d,Mj,s,ti)表示a=b+((a+(I(b,c,d)+Mj+ti)<<
這四輪（64步）是：

第一輪

FF(a,b,c,d,M0,7,0xd76aa478)
FF(d,a,b,c,M1,12,0xe8c7b756)
FF(c,d,a,b,M2,17,0x242070db)
FF(b,c,d,a,M3,22,0xc1bdceee)
FF(a,b,c,d,M4,7,0xf57c0faf)
FF(d,a,b,c,M5,12,0x4787c62a)
FF(c,d,a,b,M6,17,0xa8304613)
FF(b,c,d,a,M7,22,0xfd469501)
FF(a,b,c,d,M8,7,0x698098d8)
FF(d,a,b,c,M9,12,0x8b44f7af)
FF(c,d,a,b,M10,17,0xffff5bb1)
FF(b,c,d,a,M11,22,0x895cd7be)
FF(a,b,c,d,M12,7,0x6b901122)
FF(d,a,b,c,M13,12,0xfd987193)
FF(c,d,a,b,M14,17,0xa679438e)
FF(b,c,d,a,M15,22,0x49b40821)
第二輪

GG(a,b,c,d,M1,5,0xf61e2562)
GG(d,a,b,c,M6,9,0xc040b340)
GG(c,d,a,b,M11,14,0x265e5a51)
GG(b,c,d,a,M0,20,0xe9b6c7aa)
GG(a,b,c,d,M5,5,0xd62f105d)
GG(d,a,b,c,M10,9,0x02441453)
GG(c,d,a,b,M15,14,0xd8a1e681)
GG(b,c,d,a,M4,20,0xe7d3fbc8)
GG(a,b,c,d,M9,5,0x21e1cde6)
GG(d,a,b,c,M14,9,0xc33707d6)
GG(c,d,a,b,M3,14,0xf4d50d87)
GG(b,c,d,a,M8,20,0x455a14ed)
GG(a,b,c,d,M13,5,0xa9e3e905)
GG(d,a,b,c,M2,9,0xfcefa3f8)
GG(c,d,a,b,M7,14,0x676f02d9)
GG(b,c,d,a,M12,20,0x8d2a4c8a)

第三輪

HH(a,b,c,d,M5,4,0xfffa3942)
HH(d,a,b,c,M8,11,0x8771f681)
HH(c,d,a,b,M11,16,0x6d9d6122)
HH(b,c,d,a,M14,23,0xfde5380c)
HH(a,b,c,d,M1,4,0xa4beea44)
HH(d,a,b,c,M4,11,0x4bdecfa9)
HH(c,d,a,b,M7,16,0xf6bb4b60)
HH(b,c,d,a,M10,23,0xbebfbc70)
HH(a,b,c,d,M13,4,0x289b7ec6)
HH(d,a,b,c,M0,11,0xeaa127fa)
HH(c,d,a,b,M3,16,0xd4ef3085)
HH(b,c,d,a,M6,23,0x04881d05)
HH(a,b,c,d,M9,4,0xd9d4d039)
HH(d,a,b,c,M12,11,0xe6db99e5)
HH(c,d,a,b,M15,16,0x1fa27cf8)
HH(b,c,d,a,M2,23,0xc4ac5665)

第四輪

II(a,b,c,d,M0,6,0xf4292244)
II(d,a,b,c,M7,10,0x432aff97)
II(c,d,a,b,M14,15,0xab9423a7)
II(b,c,d,a,M5,21,0xfc93a039)
II(a,b,c,d,M12,6,0x655b59c3)
II(d,a,b,c,M3,10,0x8f0ccc92)
II(c,d,a,b,M10,15,0xffeff47d)
II(b,c,d,a,M1,21,0x85845dd1)
II(a,b,c,d,M8,6,0x6fa87e4f)
II(d,a,b,c,M15,10,0xfe2ce6e0)
II(c,d,a,b,M6,15,0xa3014314)
II(b,c,d,a,M13,21,0x4e0811a1)
II(a,b,c,d,M4,6,0xf7537e82)
II(d,a,b,c,M11,10,0xbd3af235)
II(c,d,a,b,M2,15,0x2ad7d2bb)
II(b,c,d,a,M9,21,0xeb86d391)

常數ti可以如下選擇：

在第i步中，ti是4294967296*abs(sin(i))的整數部分，i的單位是弧度。(4294967296等於2的32次方)
所有這些完成之後，將A、B、C、D分別加上a、b、c、d。然後用下一分組數據繼續運行演算法，最後的輸出是A、B、C和D的級聯。

當你按照我上面所說的方法實現MD5演算法以後，你可以用以下幾個信息對你做出來的程序作一個簡單的測試，看看程序有沒有錯誤。

MD5 ("") =
MD5 ("a") =
MD5 ("abc") =
MD5 ("message digest") =
MD5 ("abcdefghijklmnopqrstuvwxyz") =
MD5 ("") =

MD5 ("
01234567890") =

MD5的安全性

MD5相對MD4所作的改進：

1. 增加了第四輪；

2. 每一步均有唯一的加法常數；

3. 為減弱第二輪中函數G的對稱性從(X&Y)|(X&Z)|(Y&Z)變為(X&Z)|(Y&(~Z))；

4. 第一步加上了上一步的結果，這將引起更快的雪崩效應；

5. 改變了第二輪和第三輪中訪問消息子分組的次序，使其更不相似；

6. 近似優化了每一輪中的循環左移位移量以實現更快的雪崩效應。各輪的位移量互不相同。

㈢如何對加密演算法進行安全性證明

電子工業出版社《密碼學原理與實踐》，Douglas.Stinson著

㈣在RSA演算法中，有多少概率，一個信息不會被加密成互質素n

N個用戶需要N對，也就是2N個

㈤分組密碼加密模式選擇有哪些

分組密碼工作模式的應用背景：多次使用相同的密鑰對多個分組加密，會引發許多安全問題。為了應對不同場合，因而需要開發出不同的工作模式來增強密碼演算法的安全性。ECB特別適合數據較少的情況，對於很長的信息或者具有特定結構的信息，其大量重復的信息或固定的字元開頭將給密碼分析者提供大量的已知明密文對。若明文不是完整的分組，ECB需要進行填充。CBC（Cipher Block Chaining）由於加密演算法的每次輸入和本明文組沒有固定的關系，因此就算有重復的明文組，加密後也看不出來了。為了配合演算法的需要，有一個初始向量（IV）。與ECB一樣有填充機制以保證完整的分組。CFB（Cipher Feedback）和OFB，CTR模式一樣，均可將分組密碼當做流密碼（實際是將分組大小任意縮減）使用。

㈥兩個不同的字元串用MD5加密後有沒有可能相同

1 你說的兩個不同的字元串用MD5計算產生相同結果（散列沖突）是極小概率事件，基本上可以認為不會發生。除非你是研究MD5破解的科學家。
我不認為你的情況是極小概率的散列沖突，更有可能是你的MD5演算法有問題。

2 MD5將任意長度的字元串映射為一個128位散列值。
所以輸入可以是任意長度的，不存在你說的「自動截斷」

導航:首頁 > 文檔加密 > 概率加密問題

概率加密問題

與概率加密問題相關的資料