SQL Server2014 哈希索引原理

发表: 2015-09-28 浏览: 2070

翻译自：http://www.sqlservercentral.com/blogs/sql-and-sql-only/2015/09/08/hekaton-part-6-hash-indexes-intro/

跟哈希 join，哈希聚合的原理一样，了解哈希索引的原理也会同时明白哈希 join和哈希聚合的原理

SQL Server 2014推出的的新索引类型叫做 hash index。介绍hash index之前一定要介绍哈希函数这样会让大家更明白哈希索引的原理

当一个key-value键值对传递给一个哈希函数的时候，经过哈希函数的计算之后，根据结果会把key-value键值对放在合适的hash buckets（哈希存储桶）里

举个栗子

我们假设对10取模（ % 10 ）就是哈希函数。如果key-value键值对的key是1525 ，传递到哈希函数，那么1525 会存放在第五个bucket里

因为5 as 1525 % 10 = 5。

同样，537 会存放在第七个bucket ，2982 会存放在第二个bucket ，依次类推

同样，在hash index里面，哈希索引列会被传递给哈希函数做匹配（类似于java里面的HashMap的Map操作），匹配成功之后，

索引列会被存储在匹配到的hash bucket里面的表里，这个表里会有实际的数据行指针，再根据实际的数据行指针查找对应的数据行。

概括来说，要查找一行数据或者处理一个where子句，SQL Server引擎需要做下面几件事

1、根据where条件里面的参数生成合适的哈希函数

2、索引列进行匹配，匹配到对应hash bucket，找到对应hash bucket意味着也找到了对应的数据行指针（row pointer）

3、读取数据

哈希索引比起B树索引简单，因为它不需要遍历B树，所以访问速度会更快

哈希函数和相应语法的例子

CREATE TABLE dbo.HK_tbl

    (

      [ID] INT IDENTITY(1, 1)

               NOT NULL

               PRIMARY KEY NONCLUSTERED HASH WITH ( BUCKET_COUNT = 100000 ) ,

      [Data] char(32) COLLATE Latin1_General_100_BIN2

                      NULL ,

      [dt] datetime NOT NULL,

    )

    WITH (

         MEMORY_OPTIMIZED =

         ON,

         DURABILITY =

         SCHEMA_AND_DATA);