关于sql:您如何解释查询的解释计划?

关于sql:您如何解释查询的解释计划?

How do you interpret a query's explain plan?

尝试了解SQL语句的执行方式时,有时建议查看解释计划。 在解释(解释)解释计划时应该经过什么过程? 什么应该脱颖而出,"哦,这很出色?" 与"哦,不,那是不对的"。


每当我看到评论说完整的表扫描是不好的并且索引访问是好的时,我都会发抖。全表扫描,索引范围扫描,快速全索引扫描,嵌套循环,合并联接,哈希联接等只是分析人员必须理解的访问机制,并且结合了数据库结构知识和查询目的。为了得出任何有意义的结论。

完全扫描只是读取数据段(表或表(子)分区)的大部分块的最有效方法,尽管它通常可以指示性能问题,但这仅在上下文中它是否是实现查询目标的有效机制。作为数据仓库和BI专家,我对性能的第一警告标志是基于索引的访问方法和嵌套循环。

因此,对于如何阅读解释计划的机制,Oracle文档是一个很好的指南:http://download.oracle.com/docs/cd/B28359_01/server.111/b28274/ex_plan.htm#PFGRF009

也请仔细阅读《性能调优指南》。

还有一个Google用于"基数反馈",该技术可使用解释计划将查询中各个阶段的基数估计与执行过程中遇到的实际基数进行比较。我相信Wolfgang Breitling是该方法的作者。

因此,底线是:了解访问机制。了解数据库。了解查询的意图。避免经验法则。


这个主题太大,无法回答这样的问题。您应该花一些时间阅读《 Oracle性能调整指南》。


下面的两个示例显示了完全扫描和使用INDEX的快速扫描。

最好专注于您的费用和基数。查看示例,使用索引可以降低运行查询的成本。

这有点复杂(我对此没有100%的处理能力),但是从根本上讲Cost是CPU和IO成本的函数,而Cardinality是Oracle希望解析的行数。减少这两者都是一件好事。

不要忘记查询的成本会受到查询和Oracle优化器模型(例如COST,CHOOSE等)以及运行统计信息的频率的影响。

范例1:

扫描http://docs.google.com/a/shanghainetwork.org/File?id=dd8xj6nh_7fj3cr8dx_b

示例2使用索引:

索引http://docs.google.com/a/fukuoka-now.com/File?id=dd8xj6nh_9fhsqvxcp_b

并且正如已经建议的那样,请注意TABLE SCAN。您通常可以避免这些情况。


寻找诸如顺序扫描之类的东西可能会有所帮助,但实际情况是数字中...除非数字只是估计值!通常比查看查询计划有用得多的是查看实际执行情况。在Postgres中,这是EXPLAIN和EXPLAIN ANALYZE之间的区别。 EXPLAIN ANALYZE实际上执行查询,并获取每个节点的实际计时信息。这样一来,您可以查看实际发生的情况,而不是计划者认为会发生的情况。很多时候,您会发现顺序扫描根本不是问题,而是查询中的其他问题。

另一个关键是确定实际的昂贵步骤是什么。许多图形工具将使用大小不同的箭头来指示计划成本的不同部分。在这种情况下,只需查找有细箭头进入而粗箭头离开的步骤。如果您不使用GUI,则需要注意这些数字并查找它们突然变大的位置。稍加练习,就可以很容易地找出问题所在。


实际上,对于此类问题,最好的办法是使用ASKTOM。特别是他对这个问题的答案包含在线Oracle文档的链接,其中解释了许多此类规则。

要记住的一件事是,解释计划实际上是最好的猜测。

学习使用sqlplus并尝??试使用AUTOTRACE命令将是一个好主意。有了一些困难的数字,您通常可以做出更好的决策。

但是您应该询问。他对此一无所知:)


基本上,您应该看一下每个操作,并根据给定的操作原理知道这些操作是否"有意义"。

例如,如果要联接两个表,则A和B分别位于它们的列C和D(AC = BD)上,并且您的计划在表上显示聚集索引扫描(SQL Server术语-不确定oracle术语) A,然后嵌套循环连接到表B上的一系列聚簇索引查找,您可能会认为存在问题。在这种情况下,您可能希望引擎先执行一对索引扫描(在连接列的索引上),然后再进行合并连接。进一步的调查可能会发现不良的统计信息,从而使优化器选择该连接模式或实际上不存在的索引。


一个"哦,不,那是不对的"通常以表格扫描的形式出现。表扫描不使用任何特殊索引,可以有助于清除内存缓存中的所有有用信息。例如,在postgreSQL中,您会发现它看起来像这样。

1
Seq Scan ON my_table  (cost=0.00..15558.92 ROWS=620092 width=78)

有时,表扫描比使用索引查询行更为理想。但是,这是您似乎正在寻找的那些危险信号模式之一。


说明的输出告诉您每个步骤花费了多长时间。首先是要找到花费很长时间的步骤并了解它们的含义。诸如顺序扫描之类的事情告诉您,您需要更好的索引-这主要是对特定数据库和经验的研究。


我主要寻找索引或表扫描。这通常告诉我,我在where语句或join语句中的重要列上缺少索引。

从http://www.sql-server-performance.com/tips/query_execution_plan_analysis_p1.aspx:

If you see any of the following in an
execution plan, you should consider
them warning signs and investigate
them for potential performance
problems. Each of them are less than
ideal from a performance perspective.

1
2
3
4
5
6
7
8
9
10
11
* INDEX OR TABLE scans: May indicate a need FOR better OR  additional indexes.
* Bookmark Lookups: Consider changing the CURRENT clustered INDEX,
  consider USING a covering INDEX, LIMIT
  the NUMBER OF COLUMNS IN the SELECT
  statement.
* FILTER: Remove any functions IN the WHERE clause, don't include wiews
  in your Transact-SQL code, may need
  additional indexes.
* Sort: Does the data really need to be sorted? Can an index be used to
  avoid sorting? Can sorting be done at
  the client more efficiently?

It is not always possible to avoid
these, but the more you can avoid
them, the faster query performance
will be.


查看计划中每个子部分花费的时间百分比,并考虑引擎在做什么。例如,如果要扫描表,请考虑在要扫描的字段上放置索引


经验法则

(您可能还想阅读详细信息:

  • Oracle文档
  • ASKTOM
  • SQL Server文件
    )

几个大表的表扫描

使用唯一索引
索引包括所有必填字段

最常见的胜利

在我所看到的大约90%的性能问题中,最简单的方法就是将具有很多(4个或更多)表的查询分解为2个较小的查询和一个临时表。


推荐阅读

    linux执行多次命令?

    linux执行多次命令?,系统,信息,标准,工作,情况,命令,周期性,服务,代码,时间,l

    linux并行化执行命令?

    linux并行化执行命令?,系统,工具,信息,命令,名称,网络,管理,首页,服务,暂停,L

    如何执行linux命令?

    如何执行linux命令?,单位,系统,网络,信息,权威,命令,文件,音乐,目录,选项,mv

    linux打断执行的命令?

    linux打断执行的命令?,系统,状态,网站,标准,通用,客服,人员,名字,网络,暂停,L

    linux查询url命令?

    linux查询url命令?,系统,网址,工具,数据,网站,命令,传播,软件,地址,标准,linu

    linux查询命令进程?

    linux查询命令进程?,系统,名称,总量,情况,状态,进程,材料,工具,电脑,数据,怎

    linux命令没执行完?

    linux命令没执行完?,系统,设备,工具,情况,密码,状态,电脑,管理,材料,服务,Lin

    shell中执行linux命令?

    shell中执行linux命令?,系统,名称,环境,管理,工作,代码,技术,软件,经理,基础

    查询linux内存命令?

    查询linux内存命令?,系统,情况,信息,工具,电脑,状态,命令,内存,发行,总量,查

    linux扫描端口命令?

    linux扫描端口命令?,系统,地址,网络,状态,信息,检测,情况,工具,端口,灵活,lin

    linux命令查询屏保?

    linux命令查询屏保?,系统,工作,工具,信息,地址,图片,命令,目录,基础,电脑,lin

    linux打印命令执行?

    linux打印命令执行?,信息,系统,工具,服务,命令,发行,基础,位置,设备,时间,怎

    linux执行两次命令?

    linux执行两次命令?,系统,信息,连续,名称,命令,初级,首页,工具,管理,终端,lin

    linux命令执行安装?

    linux命令执行安装?,软件,系统,管理,网站,官网,市场,中心,最新,灵活,工作,如

    linux执行一条新命令?

    linux执行一条新命令?,系统,工作,命令,管理,网络,服务,信息,目录,路径,脚本,L

    监控linux执行命令?

    监控linux执行命令?,系统,情况,数据,实时,网络,信息,状态,时间,设备,命令,如

    linux链路查询命令?

    linux链路查询命令?,系统,信息,工作,地址,命令,工具,时间,盘中,基础,名字,lin

    linux命令卡死不执行?

    linux命令卡死不执行?,系统,设备,数据,密码,工具,情况,软件,环境,分析,命令,l

    linux查询文件夹命令?

    linux查询文件夹命令?,系统,软件,电脑,命令,文件,文件夹,单位,第三,档案,数

    linux执行c程序命令?

    linux执行c程序命令?,系统,工作,工具,信息,代码,命令,文件,保险,管理,环境,li