MySQL高级---索引优化分析(三、索引简介)

1、索引的概念

        MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。可以得到索引的本质:索引是数据结构。可以简单理解为排好序的快速查找数据结构

        在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法。这种数据结构,就是索引。

2、下图就是一种可能的索引方式示例:

在这里插入图片描述
        左边是数据表,一共有两列七条记录,最左边的是数据记录的物理地址。为了加快Col2的查找,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找在一定的复杂度内获取到相应数据,从而快速的检索出符合条件的记录。

        一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储的磁盘上。我们平时说的索引,进入没有特别指明,都是指B树(多路搜索树,并不一定是二叉的)结构组织的索引,其中狙击符合索引,前缀索引,唯一索引默认都是使用的B+树索引,统称索引。

3、优缺点

优势:

        1、类似于大学的图书馆里建书目索引,提高数据检索的效率,降低数据库的IO成本。

        2、通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗。

劣势:

         1、虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行INSERT、UPDATE和DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息。

         2、实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引列也是要占用空间的。

小结: 索引只是提高效率的一个因素,如果你的MySQL有大数据量的表,就需要花时间研究建立最优秀的索引

4、索引的分类

单值索引
概念:即一个索引只包含单个列,一个表可以有多个单列索引

唯一索引
概念:索引列的值必须唯一,但允许有空值

主键索引
概念:设定为主键后数据库会自动建立索引,innodb为聚簇索引随表一起建索引

复合索引
概念:即一个索引包含多个列

操作命令
创建CREATE[UNIQUE]INDEX[indexName]ONtable_name(column))
删除DROPINDEX[indexName]ONmytable;
查看SHOWINDEXFROMtable_name\G
使用Alter 命令ALTERTABLEtbl_nameADDPRIMARYKEY(column_list):该语句添加一个主键,这意味着索引值必须是唯一的,且不能为NULL。
使用Alter 命令ALTERTABLEtbl_nameADDPRIMARYKEY(column_list)
使用Alter 命令ALTERTABLEtbl_nameADDINDEXindex_name(column_list):添加普通索引,索引值可出现多次。
使用Alter 命令ALTERTABLEtbl_nameADDFULLTEXTindex_name(column_list):该语句指定了索引为引。

5、索引结构与检索原理

MySQL使用的是Btree索引。
在这里插入图片描述
【初始化介绍】
         一颗b树,浅蓝色的块我们称之为一个磁盘块,可以看到每个磁盘块包含几个数据项(深蓝色所示)和指针(黄色所示)如磁盘块1包含数据项17和35,包含指针P1、P2、P3,P1表示小于17的磁盘块,P2表示在17和35之间的磁盘块,P3表示大于35的磁盘块。真实的数据存在于叶子节点即3、5、9、10、13、15、28、29、36、60、75、79、90、99。非叶子节点只不存储真实的数据,只存储指引搜索方向的数据项,如17、35并不真实存在于数据表中。

【查找过程】
         如果要查找数据项29,那么首先会把磁盘块1由磁盘加载到内存,此时发生一次IO,在内存中用二分查找确定29。在17和35之间,锁定磁盘块1的P2指针,内存时间因为非常短(相比磁盘的IO)可以忽略不计,通过磁盘块1 的P2指针的磁盘地址把磁盘块3由磁盘加载到内存,发生第二次IO,29在26和30之间,锁定磁盘块3的P2指针,通过指针加载磁盘块8到内存,发生第三次IO,同时内存中做二分查找找到29,结束查询,总计三次IO。

         真实的情况是,3层的b+树可以表示上百万的数据,如果上百万的数据查找只需要三次IO,性能提高将是巨大的,如果没有索引,每个数据项都要发生一次IO,那么总共需要百万次的IO,显然成本非常非常高。

6、适合创建索引的情况

         1、主键自动建立唯一索引;

         2、频繁作为查询条件的字段应该创建索引

         3、查询中与其它表关联的字段,外键关系建立索引

         4、单键/组合索引的选择问题,组合索引性价比更高

         5、查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度

         6、查询中统计或者分组字段

7、不适合创建索引的情况

         1、表记录太少

         2、经常增删改的表或者字段

         3、Where条件里用不到的字段不创建索引

         4、数据重复且分布平均的表字段不创建索引 如果某个数据列包含许多重复的内容 ,为它建立索引就没有太大的实际效果
在这里插入图片描述

相关推荐
©️2020 CSDN 皮肤主题: 程序猿惹谁了 设计师:白松林 返回首页