博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
SQL Server 非聚集索引(如何预先估算其大小空间) (转载)
阅读量:5732 次
发布时间:2019-06-18

本文共 12463 字,大约阅读时间需要 41 分钟。

  假如有一张大表,现在需要增加一个非聚集索引,对于DBA来说,要有预估其大小以及执行时间的估算能力,尤其对一些企业使用SSD硬盘,其硬盘空间很是宝贵,增加索引如果错误预估其大小,很有可能导致硬盘资源超出预期使用量,造成没必要的麻烦,这里只针对其预估硬盘占用空间展开讨论,行为标准8060 in_row_data,不涉及行溢出,大对象等情况。

  举个例子给大家

  

create table Index_test (id int,a char(10))goinsert into Index_test select 100,'aaaaa'go 4000create nonclustered index ix_id_a on Index_test (id,a)go

 

      如果认为索引行的单行大小为4 + 10 = 14字节,那么最后的计算结果应该是

索引占用了(4000/(8096/14))*8192/1024 = 48KB。实际呢?

 Paddy

索引占用了(14+1)*8192/1024 = 120KB

 

与预期的值相差了2倍以上,设想一下,如果你的某张大表的索引错误的预测为50G,实际则会占用100G以上。

 

网络上很多资料给出了非聚集索引的存储格式,这里我简单明了的说明下非聚集索引的内部结构和预测其大小的方法。:

 

(非聚集索引分为 根叶,中间级页面,叶级页面,实际在物理存储上,我们可以将根叶和中间级页面合并看成中间级页面,因为两者的存储格式是相同的。我后面的讨论也都是分为叶级页面和中间级页面)

 

非聚集索引叶级页面单行:存储格式

  1. 状态位(1字节),标识此行是否有变长,空值,以及此行是否为索引行等等

  2. 非聚集索引(定长列)键值大小

  3. 如果是堆表,则是Rowid(8字节),如果是聚集索引,则是聚集索引键值(定长部分)大小。

  4. 包行列(定长列)长度

  5. 索引列数(2字节)

  6. Null位(1字节)用来标识哪列值为null

  7. 变长列数量(2字节)

  8. 变长列1偏移长度(2字节)+变长列2偏移长度(2字节).. 变长列n偏移长度(2字节)

  9. 包行列(变长列)长度 2字节  

  10. 非聚集索引(变长列)键值大小 + 聚集索引(变长列)键值大小 +包行列(变长列)键值大小 

  11. 行偏移量(2字节)

非聚集索引中间级页面单行:存储格式

  1. 状态位(1字节),标识此行是否有变长,空值,以及此行是否为索引行等等

  2. 非聚集索引(定长列)键值大小

  3. 如果是堆表,则是Rowid(8字节),如果是聚集索引,则是聚集索引键值(定长部分)大小。

  4. 非聚集索引键值所在的pageid(4字节) + 非聚集索引键值所在的页面的文件id(2字节)

  5. 索引列数(2字节)

  6. Null位(1字节)用来标识哪列值为null

  7. 变长列数量(2字节)

  8. 变长列1偏移长度(2字节)+变长列2偏移长度(2字节).. 变长列n偏移长度(2字节)

  9. 包行列(变长列)长度

  10. 非聚集索引(变长列)键值大小 + 聚集索引(变长列)键值大小 +包行列(变长列)键值大小

  11. 行偏移量(2字节)

 

下面总结了几条规律,方便理解上面的结构:

  1. 如果索引涉及的列有一个允许null,则索引行会包含索引列数(2字节)和Null位(1字节)

  2. 如果索引包含聚集索引,则需将rowid替换为聚集索引键值

  3. 如果索引包含唯一约束,则中间层页面不会包含rowid或者聚集索引键值

  4. 如果聚集索引不是唯一索引,而且存在重复值,则重复的聚集键值为(指定列 + 内部4字节整数列)来标识唯一性,要点:内部4字节整数列也属于聚集索引键值,并且是变长列类型

  5. 如果没有变长列,则在叶子页面和中间层页面不会包含:变长列数(2字节) +变长列长度(2字节)*变长列数 + 变长列键值

 

结论

   所以,对于一个非聚集索引来说,如果想确保内部系统开销最小,索引行最节省空间,除了限制索引引用没必要的列以外,还要考虑所有引用列均为not null,并且设置为unique唯一约束,同时最好具有聚集索引。 

 

预估非聚集索引行大小

  我根据以上规律总结了一个预估非聚集索引大小的脚本,因为索引填充率、变长列需要预先用最大值考虑等关系,最终结果会有稍微的误差,只能当做最小预估空间的参考值。脚本并不能保证很完善,大家可以自行改良。

 文章开头的例子,如果使用这个脚本,结果为:

和DMV输出结果一样

declare @fix_length                int    --定长字段长度(byte)declare @columns_count                int    --字段数量declare @variable_length            int    --变长字段长度(byte)declare @variable_count            int    --变长字段数量declare @Pri_Key_Length    int --聚集索引长度(byte)declare @is_primarykey bit    --是否存在聚集索引,0不存在,1存在declare @is_unique        bit    --是否指定唯一约束,0没有指定,1为指定declare @is_Null                bit    --是否允许为null,0为允许,1为不允许declare @Num_Rows     int    --记录数declare @fillfactor            float    --填充因子,默认为100set @fillfactor = 100set @fix_length = 14set @columns_count = 2set @variable_length =0set @variable_count = 0set @Pri_Key_Length = 0set @is_primarykey =0set @is_unique =0set @is_Null =0set @Num_Rows  = 4000declare @yezi                        intdeclare @zhongjian            intdeclare @ye_r_length            intdeclare @ye_r_count            int declare @zhong_r_length    intdeclare @zhong_r_count    int--1.    无聚集索引,无唯一约束,允许null if @is_primarykey = 0 and @is_unique = 0 and @is_Null = 0begin    if @variable_count =0     begin        set @ye_r_length= @fix_length + CEILING(@columns_count/8.0) + (1 + 8 + 2+2)         set @ye_r_count = (8192-96)*(@fillfactor/100.00) / @ye_r_length         set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))        set @zhong_r_length = @fix_length + CEILING(@columns_count/8.0) + (1 + 8 + 6 + 2 + 2)        set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)        set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    end    else    begin        set @ye_r_length= @fix_length + CEILING(@columns_count/8.0) + (1 + 8 + 2 + 2 + 2*@variable_count + @variable_length + 2)         set @ye_r_count = (8192-96) *(@fillfactor/100.00)/ @ye_r_length         set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))        set @zhong_r_length = @fix_length + CEILING(@columns_count/8.0) + (1 + 8 + 6 + 2+2 + 2*@variable_count + @variable_length + 2)        set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)        set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    endend--2.    无聚集索引,无唯一约束,不允许nullif @is_primarykey = 0 and @is_unique = 0 and @is_Null = 1begin    if @variable_count = 0    begin            set @ye_r_length= @fix_length + (1 + 8 +2)             set @ye_r_count = (8192-96) *(@fillfactor/100.00) / @ye_r_length             set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))            set @zhong_r_length = @fix_length +   (1 + 8 + 6   + 2)            set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)            set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    end    else    begin            set @ye_r_length= @fix_length + (1 + 8 + 2 + 2*@variable_count + @variable_length + 2)             set @ye_r_count = (8192-96)*(@fillfactor/100.00) / @ye_r_length             set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))            set @zhong_r_length = @fix_length +   (1 + 8 + 6 + 2*@variable_count + @variable_length    + 2)            set @zhong_r_count =  (8192-96) /convert(int,@zhong_r_length)            set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    endend--3.    无聚集索引,有唯一约束,允许null if @is_primarykey = 0 and @is_unique = 1 and @is_Null = 0begin    if @variable_count  = 0    begin        set @ye_r_length= @fix_length + CEILING(@columns_count/8.0) + (1 + 8 + 2+2)         set @ye_r_count = (8192-96) *(@fillfactor/100.00)/ @ye_r_length         set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))        set @zhong_r_length = @fix_length + CEILING(@columns_count/8.0) + (1 + 6 + 2 + 2)        set @zhong_r_count =  (8192-96)*0.97/convert(int,@zhong_r_length)        set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    end    else    begin        set @ye_r_length= @fix_length + CEILING(@columns_count/8.0) + (1 + 8 + 2 + 2 + 2*@variable_count + @variable_length +2)         set @ye_r_count = (8192-96) *(@fillfactor/100.00)/ @ye_r_length         set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))        set @zhong_r_length = @fix_length + CEILING(@columns_count/8.0) + (1 + 6 + 2 +2 + 2*@variable_count + @variable_length + 2)        set @zhong_r_count =  (8192-96)*0.86/convert(int,@zhong_r_length)        set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    endend--4.    无聚集索引,有唯一约束,不允许null if @is_primarykey = 0 and @is_unique = 1 and @is_Null = 1begin    if @variable_count = 0    begin        set @ye_r_length= @fix_length + (1 + 8 +2)         set @ye_r_count = (8192-96*(@fillfactor/100.00)) / @ye_r_length         set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))        set @zhong_r_length = @fix_length +   (1 + 6   + 2)        set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)        set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    end    else    begin        set @ye_r_length= @fix_length + (1 + 8 + 2 + 2*@variable_count  + @variable_length + 2)         set @ye_r_count = (8192-96)*(@fillfactor/100.00) / @ye_r_length         set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))        set @zhong_r_length = @fix_length +   (1 + 6  + 2 + 2*@variable_count  + @variable_length  + 2)        set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)        set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    endend--5.    有聚集索引,无唯一约束,允许null if @is_primarykey = 1 and @is_unique = 0 and @is_Null = 0begin    if @variable_count = 0    begin            set @ye_r_length= @fix_length + @Pri_Key_Length+CEILING(@columns_count/8.0) + (1 + 2+2)             set @ye_r_count = (8192-96)*(@fillfactor/100.00) / @ye_r_length             set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))            set @zhong_r_length = @fix_length +@Pri_Key_Length+ CEILING(@columns_count/8.0) + (1  + 6 + 2  + 2)            set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)            set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    end    else    begin            set @ye_r_length= @fix_length + @Pri_Key_Length+CEILING(@columns_count/8.0) + (1 + 2+ 2 + 2*@variable_count +@variable_length +2)             set @ye_r_count = (8192-96)*(@fillfactor/100.00) / @ye_r_length             set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))            set @zhong_r_length = @fix_length +@Pri_Key_Length+ CEILING(@columns_count/8.0) + (1  + 6 + 2 + 2 + 2*@variable_count +@fix_length + 2)            set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)            set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    endend--6.    有聚集索引,无唯一约束,不允许null if @is_primarykey = 1 and @is_unique = 0 and @is_Null = 1begin    if @variable_count = 0    begin        set @ye_r_length= @fix_length +@Pri_Key_Length+ (1 +2)         set @ye_r_count = (8192-96)*(@fillfactor/100.00) / @ye_r_length         set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))        set @zhong_r_length = @fix_length +@Pri_Key_Length+   (1 + 6   + 2)        set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)        set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    end    else    begin        set @ye_r_length= @fix_length +@Pri_Key_Length+ (1 + 2 + 2*@variable_count  + @variable_length  +2)         set @ye_r_count = (8192-96)*(@fillfactor/100.00) / @ye_r_length         set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))        set @zhong_r_length = @fix_length +@Pri_Key_Length+   (1 + 6+ 2 + 2*@variable_count  + @variable_length    + 2)        set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)        set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    endend--7.    有聚集索引,有唯一约束,允许null if @is_primarykey = 1 and @is_unique = 1 and @is_Null = 0begin    if  @variable_count = 0    begin        set @ye_r_length= @fix_length +@Pri_Key_Length+ CEILING(@columns_count/8.0) + (1 + 2+2)         set @ye_r_count = (8192-96)*(@fillfactor/100.00) / @ye_r_length         set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))        set @zhong_r_length = @fix_length + CEILING(@columns_count/8.0) + (1  + 6 + 2 + 2)        set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)        set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    end    else    begin        set @ye_r_length= @fix_length +@Pri_Key_Length+ CEILING(@columns_count/8.0) + (1 + 2+ 2 + 2 *@variable_count + @variable_length +2)         set @ye_r_count = (8192-96) *(@fillfactor/100.00)/ @ye_r_length         set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))        set @zhong_r_length = @fix_length + CEILING(@columns_count/8.0) + (1  + 6 + 2+ 2 + 2 *@variable_count + @variable_length  + 2)        set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)        set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))        endend--8.    有聚集索引,无唯一约束,不允许null if @is_primarykey = 1 and @is_unique = 1 and @is_Null = 1begin    --计算叶级页面数量    if @variable_count  = 0    begin        set @ye_r_length= @fix_length +@Pri_Key_Length+ (1 +2)         set @ye_r_count = (8192-96)*(@fillfactor/100.00) / @ye_r_length         set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))        set @zhong_r_length = @fix_length +   (1 + 6   + 2)        set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)        set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    end    else    begin        set @ye_r_length= @fix_length +@Pri_Key_Length+ (1 +2 + 2 *@variable_count + @variable_length+2)         set @ye_r_count = (8192-96 )*(@fillfactor/100.00)/ @ye_r_length         set @yezi =  ceiling(@Num_Rows  / convert(float,convert(int,@ye_r_count)))        set @zhong_r_length = @fix_length +   (1 + 6 +  2 + 2 *@variable_count + @variable_length+ 2)        set @zhong_r_count =  (8192-96)/convert(int,@zhong_r_length)        set @zhongjian = ceiling(@yezi/convert(float,(@zhong_r_count)))    endend    select          @ye_r_length as 叶子页面记录长度,        @ye_r_count as 叶子页面行数,        @yezi as 叶页面数量,        @zhong_r_length as 中间页面单条记录长度,        @zhong_r_count as 中间页行数,@zhongjian as 中间页面数量    select         (@yezi + @zhongjian) * 8192 / 1024.00 as '至少需要物理空间(KB)',        (@yezi + @zhongjian) * 8192 / 1024.00/1024.00 as '至少需要物理空间(MB)',        (@yezi + @zhongjian) * 8192 / 1024.00/1024.00/1024.00 as '至少需要物理空间(GB)'

微软technet,预估非聚集索引空间地址:http://technet.microsoft.com/zh-cn/library/ms190620

 

 

来自 :

转载于:https://www.cnblogs.com/zcm123/archive/2013/01/28/2880231.html

你可能感兴趣的文章
工作中如何做好技术积累
查看>>
怎么用sysLinux做U盘双PE+DOS??
查看>>
jqgrid中实现前台界面显示字符长度固定,后面用省略号代替
查看>>
Screen简单使用
查看>>
Fabric安装
查看>>
微服务:spring-cloud-archaius 起步
查看>>
Java免费开源数据库、Java嵌入式数据库、Java内存数据库
查看>>
关于pythonfor循环语句
查看>>
Android设置默认Launcher
查看>>
各类系统查看HBA卡WWN号
查看>>
4 GNS3模拟器的配置和使用
查看>>
LVS Nginx HAProxy 优缺点
查看>>
CSS Sprites技术使用方法工具技巧
查看>>
三种常用的Apk反编译工具
查看>>
Redis 消息队列 断线重连编码注意事项subscribe
查看>>
老男孩教育每日一题-第91天:根据要求写出itpables防火墙规则
查看>>
mysql 设置utf8字符编码
查看>>
CSS3 选择器——基本选择器
查看>>
设置JTable不可编辑的方法
查看>>
Spring Transactional
查看>>