正则散列算法_散列法的散列算法

① 什么是安全散列算法SHA256

安全散列算法SHA（Secure Hash Algorithm）是美国国家安全局（NSA）设计，美国国家标准与技术研究院（NIST）发布的一系列密码散列函数，包括 SHA-1、SHA-224、SHA-256、SHA-384 和 SHA-512 等变体。主要适用于数字签名标准（DigitalSignature Standard DSS）里面定义的数字签名算法（Digital Signature Algorithm DSA）。下面以 SHA-1为例，介绍该算法计算消息摘要的原理。
对于长度小于2^64位的消息，SHA1会产生一个160位的消息摘要。当接收到消息的时候，这个消息摘要可以用来验证数据的完整性。在传输的过程中，数据很可能会发生变化，那么这时候就会产生不同的消息摘要。
SHA1有如下特性：不可以从消息摘要中复原信息；两个不同的消息不会产生同样的消息摘要。
一、术语和概念
（一）位(Bit)，字节（Byte）和字（Word）
SHA1始终把消息当成一个位（bit）字符串来处理。本文中，一个“字”（Word）是32位，而一个“字节”（Byte）是8位。比如，字符串“abc”可以被转换成一个位字符串：01100001 01100010 01100011。它也可以被表示成16进制字符串:0x616263.
（二）运算符和符号
下面的逻辑运算符都被运用于“字”（Word）
X^Y = X，Y逻辑与
X \/ Y = X，Y逻辑或
X XOR Y= X，Y逻辑异或
~X = X逻辑取反
X+Y定义如下：
字 X 和Y 代表两个整数 x 和y, 其中0 <= x < 2^32 且 0 <= y < 2^32. 令整数z= (x + y) mod 2^32. 这时候 0 <= z < 2^32. 将z转换成字Z,那么就是 Z = X + Y.
循环左移位操作符Sn(X)。X是一个字，n是一个整数，0<=n<=32。Sn(X)= (X<>32-n)
X<定义如下：抛弃最左边的n位数字，将各个位依次向左移动n位，然后用0填补右边的n位（最后结果还是32位）。X>>n是抛弃右边的n位，将各个位依次向右移动n位，然后在左边的n位填0。因此可以叫Sn(X)位循环移位运算
二、SHA1算法描述
在SHA1算法中，我们必须把原始消息（字符串，文件等）转换成位字符串。SHA1算法只接受位作为输入。假设我们对字符串“abc”产生消息摘要。首先，我们将它转换成位字符串如下：
01100001 0110001001100011
―――――――――――――
‘a’=97 ‘b’=98‘c’=99
这个位字符串的长度为24。下面我们需要5个步骤来计算MD5。
（一）补位
消息必须进行补位，以使其长度在对512取模以后的余数是448。也就是说，（补位后的消息长度）%512 = 448。即使长度已经满足对512取模后余数是448，补位也必须要进行。
补位是这样进行的：先补一个1，然后再补0，直到长度满足对512取模后余数是448。总而言之，补位是至少补一位，最多补512位。还是以前面的“abc”为例显示补位的过程。
原始信息：01100001 01100010 01100011
补位第一步：0110000101100010 01100011 1
首先补一个“1”
补位第二步：0110000101100010 01100011 10…..0
然后补423个“0”
我们可以把最后补位完成后的数据用16进制写成下面的样子
61626380 0000000000000000 00000000
00000000 0000000000000000 00000000
00000000 0000000000000000 00000000
00000000 00000000
现在，数据的长度是448了，我们可以进行下一步操作。
（二）补长度
所谓的补长度是将原始数据的长度补到已经进行了补位操作的消息后面。通常用一个64位的数据来表示原始消息的长度。如果消息长度不大于2^64，那么第一个字就是0。在进行了补长度的操作以后，整个消息就变成下面这样了（16进制格式）
61626380 0000000000000000 00000000
00000000 0000000000000000 00000000
00000000 0000000000000000 00000000
00000000 0000000000000000 00000018
如果原始的消息长度超过了512，我们需要将它补成512的倍数。然后我们把整个消息分成一个一个512位的数据块，分别处理每一个数据块，从而得到消息摘要。
（三）使用的常量
一系列的常量字K(0),K(1), ... , K(79)，如果以16进制给出。它们如下：
Kt = 0x5A827999 (0<= t <= 19)
Kt = 0x6ED9EBA1 (20<= t <= 39)
Kt = 0x8F1BBCDC (40<= t <= 59)
Kt = 0xCA62C1D6 (60<= t <= 79).
（四）需要使用的函数
在SHA1中我们需要一系列的函数。每个函数ft (0 <= t <= 79)都操作32位字B，C，D并且产生32位字作为输出。ft(B,C,D)可以如下定义
ft(B,C,D) = (B ANDC) or ((NOT B) AND D) ( 0 <= t <= 19)
ft(B,C,D) = B XOR CXOR D (20 <= t <= 39)
ft(B,C,D) = (B ANDC) or (B AND D) or (C AND D) (40 <= t <= 59)
ft(B,C,D) = B XOR CXOR D (60 <= t <= 79).
（五）计算消息摘要
必须使用进行了补位和补长度后的消息来计算消息摘要。计算需要两个缓冲区，每个都由5个32位的字组成，还需要一个80个32位字的缓冲区。第一个5个字的缓冲区被标识为A，B，C，D，E。第二个5个字的缓冲区被标识为H0,H1, H2, H3, H4。80个字的缓冲区被标识为W0,W1,..., W79
另外还需要一个一个字的TEMP缓冲区。
为了产生消息摘要，在第4部分中定义的16个字的数据块M1,M2,..., Mn
会依次进行处理，处理每个数据块Mi 包含80个步骤。
在处理每个数据块之前，缓冲区{Hi} 被初始化为下面的值（16进制）
H0 = 0x67452301
H1 = 0xEFCDAB89
H2 = 0x98BADCFE
H3 = 0x10325476
H4 = 0xC3D2E1F0.
现在开始处理M1, M2,... , Mn。为了处理 Mi,需要进行下面的步骤
(1). 将Mi 分成 16 个字 W0, W1, ... , W15,W0 是最左边的字
(2). 对于t = 16 到 79 令 Wt = S1(Wt-3 XOR Wt-8XOR Wt- 14 XOR Wt-16).
(3). 令A = H0, B = H1, C = H2, D = H3, E = H4.
(4) 对于t = 0 到 79，执行下面的循环
TEMP = S5(A) +ft(B,C,D) + E + Wt + Kt;
E = D; D = C; C =S30(B); B = A; A = TEMP;
(5). 令H0 = H0 + A, H1 = H1 + B, H2 = H2 + C, H3 = H3 + D, H4 = H4 + E.
在处理完所有的 Mn, 后，消息摘要是一个160位的字符串，以下面的顺序标识
H0 H1 H2 H3 H4.
对于SHA256、SHA384、SHA512。你也可以用相似的办法来计算消息摘要。对消息进行补位的算法完全是一样的。
三、SHA算法被破解了吗？
2013年9月10日美国约翰霍普金斯大学的计算机科学教授，知名的加密算法专家，Matthew Green被NSA要求删除他的一份关于破解加密算法的与NSA有关的博客。同时约翰霍普金斯大学服务器上的该博客镜像也被要求删除。

加密算法专家，美国约翰霍普金斯大学教授Matthew Green
但当记者向该大学求证时，该校称从未收到来自NSA的要求要删除博客或镜像的资料，但记者却无法在原网址再找到该博客。幸运的是，从谷歌的缓存可以找到该博客。该博客提到NSA每年花费2.5亿美元来为自己在解密信息方面获取优势，并列举了NSA的一系列见不得人的做法。

在BitcoinTalk上，已经掀起了一轮争论：到底SHA-2是否安全？
部分认为不安全的观点包括：
NSA制造了sha-2, 我们不相信NSA，他们不可能不留后门。
棱镜事件已经明白的告诉我们，政府会用一切可能的手段来监视与解密。
虽然有很多人会研究SHA-2，且目前没有公开的证据表明有漏洞。但没有公开这并不能代表就没有，因为发现漏洞的人一定更倾向于保留这个秘密来自己利用，而不是公布。
部分认为安全的观点包括：
SHA-2是应用广泛的算法，应该已经经历了实践的检验。
美国的对头中国和俄国都有很多杰出的数学家，如果有问题的话，他们肯定已经发现了。
如果真的不安全，世界上安全的东西就太少了，我不能生活在提心吊胆里，所以我选择相信安全。

② 散列算法的算法思想

我也只能说说思想

散列算法的算法就是争取一个萝卜一个坑的原则

比如说有5个数 12,25,30,45,50,这几个数有个规律,就是十位数都不相同,

如果我设置一个散列函数f(value)=value/10;平常的时候,我们查找50，要比较

5次(其他算法可能不同),这里用散列算法只需要1次,就是解散列函数,key=50/10

=5,要找的数就在第5个位子.但是上面问题还是很多的,比如说查找55呢?就会出

错<因为55解散列函数之后,也是在第5个位子>,还有等等等问题,很显然这个是我

散列函数没设置好,当你把散列函数设置好了后,由于数据的庞大,冲突很有可能

产生,那么就需要我们来处理冲突了,所以写散列算法就是设置好的散列函数和

处理冲突的过程.这里散列算法涉及的查找就跟查找的数量无关,跟冲突率有直接

的关系

③ 常用的散列函数有哪些

常用的哈希函数

通用的哈希函数库有下面这些混合了加法和一位操作的字符串哈希算法。下面的这些算法在用法和功能方面各有不同，但是都可以作为学习哈希算法的实现的例子。(其他版本代码实现见下载）

1.RS

从RobertSedgwicks的Algorithms in C一书中得到了。我(原文作者)已经添加了一些简单的优化的算法，以加快其散列过程。

[java]view plainprint?

publiclongRSHash(Stringstr)
{
intb=378551;
inta=63689;
longhash=0;
for(inti=0;i<str.length();i++)
{
hash=hash*a+str.charAt(i);
a=a*b;
}
returnhash;
}

2.JS

Justin Sobel写的一个位操作的哈希函数。

[c-sharp]view plainprint?

publiclongJSHash(Stringstr)
{
longhash=1315423911;
for(inti=0;i<str.length();i++)
{
hash^=((hash<<5)+str.charAt(i)+(hash>>2));
}
returnhash;
}

3.PJW

该散列算法是基于贝尔实验室的彼得J温伯格的的研究。在Compilers一书中（原则，技术和工具），建议采用这个算法的散列函数的哈希方法。

[java]view plainprint?

publiclongPJWHash(Stringstr)
{
longBitsInUnsignedInt=(long)(4*8);
longThreeQuarters=(long)((BitsInUnsignedInt*3)/4);
longOneEighth=(long)(BitsInUnsignedInt/8);
longHighBits=(long)(0xFFFFFFFF)<<(BitsInUnsignedInt-OneEighth);
longhash=0;
longtest=0;
for(inti=0;i<str.length();i++)
{
hash=(hash<<OneEighth)+str.charAt(i);
if((test=hash&HighBits)!=

④ 散列算法可以做哪些事

查找并判断状态是否出现过，出现过几次
比如说一个物品a有四个特征,为a[1],a[2],a[3],a[4]
那么令f(a)=a[1]*(p^1)+a[2]*(p^2)+a[3]*(p^3)+a[4]*(p^4)
hash[f(a)]=a;
若又有一个物品b，特征b[1],b[2],b[3],b[4]
f(b)=b[1]*(p^1)+b[2]*(p^2)+b[3]*(p^3)+b[4]*(p^4)
那么a=b时，f(a)=f(b)
反过来f(a)=f(b)时，a很有可能等于b （只要p设定的足够大，a不等于b的几率也很小）
为了节省内存，我们可以让f(a)=f(a)%q;
这样hash数组只需要开q的大小
就算在mod了之后a不等于b的概率也是非常小的（所以出题人一般不怎么能卡Hash，反而还天天考Hash）
像这样一个题：
有n个图，每个图都有m个点，有一些带权的边，询问每个图中的u点能否都不经过权值小于w的边到达v点（n*m<=200000，边数<=300000）
首先，你可以dfs，O（n*m）可以过，
但是如果改成q<=200000次询问，你就不能dfs了
实际上对于一个询问，当权值大于等于w的边全部放完之后就转化为判断此时uv是否都联通，
所以我们考虑离线，将询问按w从大到小，边也是按权值从大到小，边放边，边判断联通，
动态判断联通可以用并查集的按大小启发式合并，id[i][k]表示在第i个图中k所在并查集的头，
i图中u，v联通等价于id[i][u]==id[i][v](表示第i个图，需要枚举n次)。所以可以枚举i判断是不是都联通，总复杂度=O（边数 * log2(n*m) +边数 * n）log2（n*m）为启发式合并的时间复杂度。最后一个n为枚举i的耗费，如果n>500这方法就炸了，想办法优化，这时候就可以用哈希。
设f(u)=id[1][u]*(p^1)+id[2][u]*(p^2)+...+id[n][u]*(p^n) % q
如果id[i][u]=id[i][v](i=1~n) 则f(u)==f(v)
如果f(u)==f(v)则很大可能 id[i][u]=id[i][v](i=1~n)
令Hash[u]=f(u)
则在每次修改id[i][u]时顺便O(1)修改Hash(u)即可O（1）查询,判断Hash[u]是否等于Hash[v].
这样时间复杂度优化为O(边数*log2(n*m)+边数)是一个非常优秀的算法，散列的魅力就在于此，空间换时间，效率高，比赛时只要p和q设的大一些，一些考算法的题可以水个八九十分，还特别好写，不会写炸。

⑤ 哈希的算法是什么

哈希算法是一个广义的算法，也可以认为是一种思想，使用Hash算法可以提高存储空间的利用率，可以提高数据的查询效率，也可以做数字签名来保障数据传递的安全性。所以Hash算法被广泛地应用在互联网应用中。

哈希算法也被称为散列算法，Hash算法虽然被称为算法，但实际上它更像是一种思想。Hash算法没有一个固定的公式，只要符合散列思想的算法都可以被称为是Hash算法。

特点：

加密哈希跟普通哈希的区别就是安全性，一般原则是只要一种哈希算法出现过碰撞，就会不被推荐成为加密哈希了，只有安全度高的哈希算法才能用作加密哈希。

同时加密哈希其实也能当普通哈希来用，Git 版本控制工具就是用 SHA-1 这个加密哈希算法来做完整性校验的。一般来讲越安全的哈希算法，处理速度也就越慢，所以并不是所有的场合都适合用加密哈希来替代普通哈希。

⑥ 一个安全的散列算法需要具备哪些属性

一个安全的散列算法需要具备的属性：
1、能对抗野蛮的攻击，能够抵御穷举法的攻势。
2、具有无限定义域，如任意长度的字节字符串和有限的值域或者固定长度的比特串。
3、具备应用的多样性，对于给定的散列值，没有实用的方法可以计算出一个原始输入，也就是说很难伪造。
4、能够因为环境因素的变化，如机器配置或者IP地址的改变而有变动。以保证源文件的安全性。
5、方便错误监测和修复函数。当散列函数被用于校验和的时候可以用相对较短的散列值来验证任意长度的数据是否被更改过。
6、安全散列算法接受的输入文档小于2的64次方位，产生160位的报文摘要。该算法实际的目标使得找出一个能够匹配给定的散列值的文本是不可能的计算。

⑦ 散列算法的概念

在信息安全技术中，经常需要验证消息的完整性，散列（Hash）函数提供了这一服务，它对不同长度的输入消息，产生固定长度的输出。这个固定长度的输出称为原输入消息的“散列”或“消息摘要”（Message digest）。一个安全的哈希函数H必须具有以下属性：
l）H能够应用到大小不一的数据上。
2）H能够生成大小固定的输出。
3）对于任意给定的x，H（x）的计算相对简单。
4）对于任意给定的代码h，要发现满足H（x）=h的x在计算上是不可行的。
5) 对于任意给定的块x，要发现满足H（y）=H（x）而y=x在计算上是不可行的。
6）要发现满足H（X）=H（y）的（X，y）对在计算上是不可行的

⑧ 单向散列算法的介绍

单向散列算法，又称hash函数，Hash函数（也称杂凑函数或杂凑算法）就是把任意长的输入消息串变化成固定长的输出串的一种函数。这个输出串称为该消息的杂凑值。一般用于产生消息摘要，密钥加密等。

⑨ 什么是散列法

散列法（Hashing）或哈希法是一种将字符组成的字符串转换为固定长度（一般是更短长度）的数值或索引值的方法，称为散列法，也叫哈希法。由于通过更短的哈希值比用原始值进行数据库搜索更快，这种方法一般用来在数据库中建立索引并进行搜索，同时还用在各种解密算法中。

⑩ 散列法的散列算法

也称为哈希函数——哈希的英文意思为“无用信息”，因此哈希函数一词的由来可能是因为最终形成的哈希表里面是各种看起来毫无意义的描述值的混合。除用来快速搜索数据外，散列法还用来完成签名的加密解密工作，这种签名可以用来对收发消息时的用户签名进行鉴权。先用哈希函数对数据签名进行转换，然后将数字签名本身和转换后的信息摘要分别独立的发送给接收人。通过利用和发送人一样的哈希函数，接收人可以从数字签名获得一个信息摘要，然后将此摘要同传送过来的摘要进行比较，这两个值相等则表示数字签名有效。
利用哈希函数对数据库中的原始值建立索引，以后每获取一次数据时都要利用哈希函数进行重新转换。因此，哈希函数始终是单向操作。没有必要通过分析哈希值来试图逆推哈希函数。实际上，一个典型的哈希函数是不可能逆推出来的。好的哈希函数还应该避免对于不同输入产生相同的哈希值的情况发生。如果产生了哈希值相同的情况，称为冲突。可接受的哈希函数应该将冲突情况的可能性降到非常小。

导航:首页 > 源码编译 > 正则散列算法

正则散列算法

与正则散列算法相关的资料