首页 1 2 3 4 5 6 7

mysql数据库索引相关记录

在关系数据库中，索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结构，它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。索引的作用相当于图书的目录，可以根据目录中的页码快速找到所需的内容。

1．选择唯一性索引

唯一性索引的值是唯一的，可以更快速的通过该索引来确定某条记录。例如，学生表中学号是具有唯一性的字段。为该字段建立唯一性索引可以很快的确定某个学生的信息。如果使用姓名的话，可能存在同名现象，从而降低查询速度。

2．为经常需要排序、分组和联合操作的字段建立索引

经常需要ORDER BY、GROUP BY、DISTINCT和UNION等操作的字段，排序操作会浪费很多时间。如果为其建立索引，可以有效地避免排序操作。

3．为常作为查询条件的字段建立索引

如果某个字段经常用来做查询条件，那么该字段的查询速度会影响整个表的查询速度。因此，为这样的字段建立索引，可以提高整个表的查询速度。

4．限制索引的数目

索引的数目不是越多越好。每个索引都需要占用磁盘空间，索引越多，需要的磁盘空间就越大。修改表时，对索引的重构和更新很麻烦。越多的索引，会使更新表变得很浪费时间。

5．尽量使用数据量少的索引

如果索引的值很长，那么查询的速度会受到影响。例如，对一个CHAR(100)类型的字段进行全文检索需要的时间肯定要比对CHAR(10)类型的字段需要的时间要多。

6．尽量使用前缀来索引

如果索引字段的值很长，最好使用值的前缀来索引。例如，TEXT和BLOG类型的字段，进行全文检索会很浪费时间。如果只检索字段的前面的若干个字符，这样可以提高检索速度。

7．删除不再使用或者很少使用的索引

表中的数据被大量更新，或者数据的使用方式被改变后，原有的一些索引可能不再需要。数据库管理员应当定期找出这些索引，将它们删除，从而减少索引对更新操作的影响。

8 . 最左前缀匹配原则，非常重要的原则。

mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配，比如a 1=”” and=”” b=”2” c=”“> 3 and d = 4 如果建立(a,b,c,d)顺序的索引，d是用不到索引的，如果建立(a,b,d,c)的索引则都可以用到，a,b,d的顺序可以任意调整。

9 .=和in可以乱序。

比如a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意顺序，mysql的查询优化器会帮你优化成索引可以识别的形式

10 . 尽量选择区分度高的列作为索引。

区分度的公式是count(distinct col)/count()，表示字段不重复的比例，比例越大我们扫描的记录数越少，唯一键的区分度是1，而一些状态、性别字段可能在大数据面前区分度就是0，那可能有人会问，这个比例有什么经验值吗？使用场景不同，这个值也很难确定，一般需要join的字段我们都要求是0.1以上，即平均1条扫描10条记录

11 .索引列不能参与计算，保持列“干净”。

比如from_unixtime(create_time) = ’2014-05-29’就不能使用到索引，原因很简单，b+树中存的都是数据表中的字段值，但进行检索时，需要把所有元素都应用函数才能比较，显然成本太大。所以语句应该写成create_time = unix_timestamp(’2014-05-29’);

12 .尽量的扩展索引，不要新建索引。
比如表中已经有a的索引，现在要加(a,b)的索引，那么只需要修改原来的索引即可

13、当单个索引字段查询数据很多，区分度都不是很大时，则需要考虑建立联合索引来提高查询效率

============================================================

1、先存数据，再建索引

有索引的好处是搜索比较快但是在有索引的前提下进行插入、更新操作会很慢

2、不要对规模小的数据表建立索引，数据量超过300的表应该有索引；

对于规模小的数据表建立索引不仅不会提高功能,相反使用索引查找可能比简单的全表扫描还要嫚而且建索引还会占用一部分的存储空间

3、当对表的查询操作比更新操作频率更高时，对该表建立索引

4、在不同值较少的字段上不必要建立索引，如性别字段

5、对于查询操作中频繁使用的列建立索引，不对很少或从来不作为查询条件的列建立索引

6、表的主键、外键必须有索引；

7、经常出现在Where子句中的字段，特别是大表的字段，应该建立索引；

8、索引应该建在选择性高的字段上；在SQL语句中经常进行GROUP BY、ORDER BY的字段上建立索引；

9、索引应该建在小字段上，对于大的文本字段甚至超长字段，不要建索引

=========================================

【避免全表扫描的方法】

1.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。

2.应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描，

如：select id from t where num is null可以在num上设置默认值0，确保表中num列没有null值，然后这样查询：select id from t where num=0

3.应尽量避免在 where 子句中使用!=或<>操作符，否则引擎将放弃使用索引而进行全表扫描。

4.应尽量避免在 where 子句中使用or 来连接条件，否则将导致引擎放弃使用索引而进行全表扫描，

如：select id from t where num=10 or num=20可以这样查询：select id from t where num=10 union all select id from t where num=20

5.in 和 not in 也要慎用，否则会导致全表扫描，

如：select id from t where num in(1,2,3) 对于连续的数值，能用 between 就不要用 in 了：select id from t where num between 1 and 3

6.下面的查询也将导致全表扫描：select id from t where name like '李%'若要提高效率，可以考虑全文检索。

7..避免在索引列上使用计算，也就是说，应尽量避免在 where 子句中对字段进行表达式操作和函数操作，这将导致引擎放弃使用索引而进行全表扫描。

如：select id from t where num/2=100应改为:select id from t where num=1002

select id from t where substring(name,1,3)='abc' ，name以abc开头的id，应改为:select id from t where name like 'abc%'

8.很多时候用 exists 代替 in 是一个好的选择：exists用于检查子查询是否至少会返回一行数据，该子查询实际上并不返回任何数据，而是返回值true或false。

select num from a where num in(select num from b)

用下面的语句替换：select num from a where exists (select 1 from b where num=a.num)

9.任何地方都不要使用 select * from t ，用具体的字段列表代替“”，不要返回用不到的任何字段。

10.用>=替代>

高效: SELECT FROM EMP WHERE DEPTNO >=4

低效: SELECT * FROM EMP WHERE DEPTNO >3

两者的区别在于, 前者DBMS将直接跳到第一个DEPT等于4的记录，而后者将首先定位到DEPTNO=3的记录并且向前扫描到第一个DEPT大于3的记录。

11.用Where子句替换having子句

* 浙大PAT甲级 1043

二叉查找树的建立与数的遍历。 AC代码： #include<iostream> #include<vector> #include<map> #include&

nginx之location

语法 location [ = | ~ | ~* | ^~ ] demo { … } location @name { … } location = /demo 完全匹配

C语言动态分配多维数组

分析两种动态分配二位数组的方法，其原理一致。 0. 动态分配一维数组int a[rows] #include <stdlib.h> int main{vo

SQL Server Reporting Services安装错误的解决方案

When you Uninstall SQl server some o

python中出现变量前后带下划线的是什么意思

前后没有下划线的是公有方法，前边有一个下划线的为私有方法或属性，子类无法继承，前边有两个下划线的一般是为了避免于子类属性或者方法名冲突，无法在外部直接访问。前后都有双下划线的为系统方法或属性。

caffe源码阅读1：caffe.proto解析

看caffe源码先从这里开始吧。它位于…\src\caffe\proto目录下，在这个文件夹下还有一个.pb.cc和一个.pb.h文件，这两个文件都是由caffe.p

YOLO-v1 论文阅读笔记

思想和特点之前的目标检测算法均需要多个步骤实现目标的分类和定位。如RCNN系列，首先需要进行region proposal，RCNN到Faster RCNN模块逐步将其他任务整合到网络，最终将region proposal也用网络来实现，但是仍然是

关于移动App开发前端UI框架选择

问题：现在移动开发各种必须，而移动开发纠结在于怎样快速高效的开发出来。做web开发有些年头了，成熟的前端套件（easyui，extjs，jqueryui）很是方便，可以开发出

Angular 小白学习入门

环境搭建 1.安装nodejs