von Markus Winand.

SQL Server Skripte für den „3-Minuten Test“


Dieser Abschnitt enthält die create, insert und select Kommandos für den „3-Minuten Test“. Mach den Test doch selbst, bevor du weiter liest.

Die Ausführungspläne sind zur besseren Lesbarkeit abgekürzt.

Tabellen Setup

Die Tabelle TBL wird als Clustered-Index auf dem Primärschlüssel angelegt. Stattdessen kann man mittels PRIMARY KEY NONCLUSTERED auch ohne Clustered-Index testen.

CREATE TABLE tbl (
  id          NUMERIC NOT NULL,
  date_column DATE,
  a           NUMERIC,
  b           NUMERIC,
  text        VARCHAR(255),
  state       CHAR(1),
  CONSTRAINT tbl_pk PRIMARY KEY (id)
);

CREATE VIEW rand_helper AS SELECT RND=RAND();;

CREATE FUNCTION random_string (@maxlen int)
   RETURNS VARCHAR(255)
AS BEGIN
   DECLARE @rv VARCHAR(255)
   DECLARE @loop int
   DECLARE @len int

   SET @len = (SELECT CAST(rnd * (@maxlen-3) AS INT) + 3
                 FROM rand_helper)
   SET @rv = ''
   SET @loop = 0

   WHILE @loop < @len BEGIN
      SET @rv = @rv 
              + CHAR(CAST((SELECT rnd * 26
                             FROM rand_helper) AS INT )+97)
      IF @loop = 0 BEGIN
          SET @rv = UPPER(@rv)
      END
      SET @loop = @loop +1;
   END

   RETURN @rv
END;

CREATE FUNCTION random_int (@min int, @max int)
   RETURNS INT
AS BEGIN
   DECLARE @rv INT
   SET @rv = (SELECT rnd * (@max) + @min
                FROM rand_helper)
   RETURN @rv
END;

WITH generator (n) AS
( SELECT 1
   UNION ALL
  SELECT n + 1
    FROM generator
   WHERE N < 50000
)
INSERT INTO tbl
SELECT n
     , DATEADD(day, -n, GetDate())
     , n % 1234
     , [dbo].random_int(1, 10)
     , [dbo].random_string(20)
     , CASE WHEN (n % 5) = 0 THEN 'X' ELSE 'A' END
  FROM generator
OPTION (MAXRECURSION 0);

exec sp_updatestats;

Frage 1 — DATE Anit-Pattern

CREATE INDEX tbl_idx ON tbl (date_column);
SELECT count(*)
  FROM tbl
 WHERE DATEPART(yyyy, date_column) = 2016;
SELECT count(*)
  FROM tbl
 WHERE date_column >= CAST('2016-01-01' AS DATE)
   AND date_column <  CAST('2017-01-01' AS DATE);

Frage 2 — Indiziertes Top-N

CREATE INDEX tbl_idx ON tbl (a, date_column);
 SELECT TOP 1 *
   FROM tbl
  WHERE a = 123
  ORDER BY date_column DESC;

Die Abfrage verwendet den Index (Index Seek) in absteigender Reihenfolge (ORDERED BACKWARD). Beachte, dass keine Sortieroperation aufscheint.

|--Top(TOP EXPRESSION:((1)))
     |--Index Seek(OBJECT:([tbl].[tbl_idx]),
             SEEK:([tbl].[a]=[@a]) ORDERED BACKWARD)

Table 'tbl'. Scan count 1, logical reads 3,
             physical reads 0, read-ahead reads 0, lob logical reads 0,
             lob physical reads 0, lob read-ahead reads 0.

Frage 3 — Spaltenreihenfolge

CREATE INDEX tbl_idx ON tbl (a, b);
SELECT *
  FROM tbl
 WHERE a = 123
   AND b = 1;
SELECT *
  FROM tbl
 WHERE b = 123;

Die zweite Abfrage liest den ganzen Index (Index Scan). Wenn die Spalten im Index umgedreht werden, können beide Abfragen optimal vom Index profitieren (Index Seek).

|--Index Seek(OBJECT:([tbl].[tbl_idx]),
         SEEK:([tbl].[a]=[@a]
          AND  [tbl].[b]=[@b]) ORDERED FORWARD)


Table 'tbl'. Scan count 1, logical reads 3,
             physical reads 0, read-ahead reads 0, lob logical reads 0,
             lob physical reads 0, lob read-ahead reads 0.

|--Index Scan(OBJECT:([tbl].[tbl_idx]),
        WHERE:([tbl].[b]=[@b])


Table 'tbl'. Scan count 1, logical reads 372,
             physical reads 0, read-ahead reads 0, lob logical reads 0,
             lob physical reads 0, lob read-ahead reads 0.
|--Index Seek(OBJECT:([tbl].[tbl_idx]),
         SEEK:([tbl].[b]=[@b]
           AND [tbl].[a]=[@a]) ORDERED FORWARD)

Table 'tbl'. Scan count 1, logical reads 3,
             physical reads 0, read-ahead reads 0, lob logical reads 0,
             lob physical reads 0, lob read-ahead reads 0.



|--Index Seek(OBJECT:([tbl].[tbl_idx]),
         SEEK:([tbl].[b]=[@b]) ORDERED FORWARD)

Table 'tbl'. Scan count 1, logical reads 40,
             physical reads 0, read-ahead reads 0, lob logical reads 0,
             lob physical reads 0, lob read-ahead reads 0.

Frage 4 — LIKE

CREATE INDEX tbl_idx ON tbl (text);
SELECT *
  FROM tbl
 WHERE text LIKE '%TERM%';

Das Wildcard am Anfang des Suchbegriffes macht einen Index Seek unmöglich, sodass der ganze Index gelesen werden muss (Index Scan).

|--Index Scan(OBJECT:([tbl].[tbl_idx]), 
       WHERE:([tbl].[text] like '%TERM%'))

Frage 5 — Index Only Scan

CREATE INDEX tbl_idx ON tbl (a, date_column);
SELECT date_column, count(*)
  FROM tbl
 WHERE a = 123
 GROUP BY date_column;
SELECT date_column, count(*)
  FROM tbl
 WHERE a = 123
   AND b = 1
 GROUP BY date_column;

Die erste Abfrage nutzt den Index, um auf der Spalte A zu suchen, kann aber auch die selektierte Spalte DATE_COLUMN aus dem Index lesen. Die zweite Abfrage muss zusätzlich in den Clustered-Index sehen (bzw. RID Lookup (HEAP)), um den Filter auf der Spalte B zu prüfen. Obwohl dieser Zugriff das Ergebnis schmälert, wird die Abfrage viel langsamer.

|--Compute Scalar(DEFINE:([...])
     |--Stream Aggregate(GROUP BY:([tbl].[date_column]))
          |--Index Seek(OBJECT:([tbl].[tab_idx]),
                  SEEK:([tbl].[a]=[@a]) ORDERED FORWARD)

Table 'tbl'. Scan count 1, logical reads 3,
             physical reads 0, read-ahead reads 0, lob logical reads 0,
             lob physical reads 0, lob read-ahead reads 0.



|--Compute Scalar(DEFINE:[...])
     |--Stream Aggregate(GROUP BY:([tbl].[date_column]))
          |--Nested Loops(Inner Join)
               |--Index Seek(
                      OBJECT:([tbl].[tab_idx]),
                        SEEK:([tbl].[a]=[@a]))
               |--Clustered Index Seek(
                      OBJECT:([tbl].[tbl_pk]),
                        SEEK:([tbl].[id]=[tbl].[id]),
                       WHERE:([tbl].[b]=[@b]))

Table 'tbl'. Scan count 1, logical reads 235,
             physical reads 0, read-ahead reads 0, lob logical reads 0,
             lob physical reads 0, lob read-ahead reads 0.

Über den Autor

Foto von Markus Winand

Markus Winand lehrt effizientes SQL – inhouse und online. Er minimiert die Entwicklungszeit durch modernes SQL und optimiert die Laufzeit durch schlaue Indizierung – dazu hat er auch das Buch SQL Performance Explained veröffentlicht.

Kaufen Sie sein Buch bei Amazon

Titelbild von „SQL Performance Explained“: Eichhörnchen läuft durchs Grass

Die Essenz: SQL-Tuning auf 200 Seiten

Bei Amazon kaufen
(Taschenbuch)

Taschenbuch und PDF auch auf Markus' Webseite erhältlich.

Holen Sie sich Markus

…für ein Training ins Büro.

Sein beliebtes Training stimmt Entwickler auf SQL Performance ein.

Erfahren Sie mehr»

„Use The Index, Luke!“ von Markus Winand ist unter einer Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported License lizenziert.
Impressum | Kontakt | KEINE GEWÄHR | Handelsmarken | Datenschutz | CC-BY-NC-ND 3.0 Lizenz