Was weißt du über SQLite Indizierung?

Die meisten Fragen folgen einem einfachen Muster: Sie zeigt einen Index und eine Abfrage. Die Frage ist dann, ob Index und Abfrage zusammenpassen, oder nicht.

Falls du eine Abfrage ändern würdest, um die Performance zu verbessern, muss die neue Abfrage dasselbe Ergebnis liefern. Das bedeutet auch alle Spalten, wenn select * genutzt wird.

Bevor ich dir das Ergebnis zeige…

Lade deine Antworten bitte hoch

Ich würde mich freuen, wenn du mir deine Antworten zur Analyse überlässt (wie in diesem Artikel).

Antworten anonym hochladenÜberspringen

(Datenschutz)

Frage 5

Diese Frage ist anders. Sieh dir zuerst den Index und die ursprüngliche Abfrage an:

CREATE INDEX tbl_idx ON tbl (a, date_column)

SELECT date_column, count(*)
  FROM tbl
 WHERE a = 38
 GROUP BY date_column

Gehe davon aus, dass die Abfrage zumindest einige Zeilen liefert und dass es keine anderen Indizes auf dieser Tabelle gibt.

Um eine neue Anforderung umzusetzen, wird eine weitere Bedingung (b = 1) in die where-Klausel aufgenommen:

SELECT date_column, count(*)
  FROM tbl
 WHERE a = 38
   AND b = 1
 GROUP BY date_column

Wie wird sich diese Änderung auf die Performance auswirken?

Gar nicht: Die Abfrage wird ungefähr gleich schnell bleiben
Falsch! Die Abfrage wird langsamer.
Der Index beinhaltet alle Spalten der ursprünglichen Abfrage. Daher konnte sie als Index-Only Scan ausgeführt werden. Ein Zugriff auf die eigentliche Tabelle war nicht nötig.
Jeder Zugriff auf eine Spalte, die nicht im Index ist, verhindert diese Optimierung. Die Datenbank muss dann für jede Zeile, die der ursprünglichen where-Klausel entspricht, in die Tabelle gehen, und nachsehen ob diese Zeile auch dem neuen where-Filter genügt. Selbst wenn der neue Filter alle Zeilen entfernt, geschieht das erst, nachdem ein zusätzlicher Aufwand angefallen ist. Obwohl die Gruppierung dann schneller geht (weniger Zeilen) kann das den Mehraufwand des Tabellenzugriffes nicht ausgleichen.
Tipp
Verwende einen Index-Only Scan für Abfragen über viele Zeilen aber wenige Spalten.
Vermeide select * um die Chance auf einen Index-Only Scan zu verbessern.
Siehe auch: Index-Only Scan und Myth: select * is bad
Unzureichende Information: Die Frage kann nicht eindeutig beantwortet werden
Falsch. Die Information oben lässt den rückschluss zu, dass die Abfrage langsamer wird.
Der Index beinhaltet alle Spalten der ursprünglichen Abfrage. Daher konnte sie als Index-Only Scan ausgeführt werden. Ein Zugriff auf die eigentliche Tabelle war nicht nötig.
Jeder Zugriff auf eine Spalte, die nicht im Index ist, verhindert diese Optimierung. Die Datenbank muss dann für jede Zeile, die der ursprünglichen where-Klausel entspricht, in die Tabelle gehen, und nachsehen ob diese Zeile auch dem neuen where-Filter genügt. Selbst wenn der neue Filter alle Zeilen entfernt, geschieht das erst, nachdem ein zusätzlicher Aufwand angefallen ist. Obwohl die Gruppierung dann schneller geht (weniger Zeilen) kann das den Mehraufwand des Tabellenzugriffes nicht ausgleichen.
Tipp
Verwende einen Index-Only Scan für Abfragen über viele Zeilen aber wenige Spalten.
Vermeide select * um die Chance auf einen Index-Only Scan zu verbessern.
Siehe auch: Index-Only Scan und Myth: select * is bad
Schlecht: Die Abfrage dauert länger
Richtig: die Abfrage wird langsamer
Der Index beinhaltet alle Spalten der ursprünglichen Abfrage. Daher konnte sie als Index-Only Scan ausgeführt werden. Ein Zugriff auf die eigentliche Tabelle war nicht nötig.
Jeder Zugriff auf eine Spalte, die nicht im Index ist, verhindert diese Optimierung. Die Datenbank muss dann für jede Zeile, die der ursprünglichen where-Klausel entspricht, in die Tabelle gehen, und nachsehen ob diese Zeile auch dem neuen where-Filter genügt. Selbst wenn der neue Filter alle Zeilen entfernt, geschieht das erst, nachdem ein zusätzlicher Aufwand angefallen ist. Obwohl die Gruppierung dann schneller geht (weniger Zeilen) kann das den Mehraufwand des Tabellenzugriffes nicht ausgleichen.
Tipp
Verwende einen Index-Only Scan für Abfragen über viele Zeilen aber wenige Spalten.
Vermeide select * um die Chance auf einen Index-Only Scan zu verbessern.
Siehe auch: Index-Only Scan und Myth: select * is bad
Gut: Die Abfrage wird schneller
Falsch: die Abfrage wird langsamer!
Der Index beinhaltet alle Spalten der ursprünglichen Abfrage. Daher konnte sie als Index-Only Scan ausgeführt werden. Ein Zugriff auf die eigentliche Tabelle war nicht nötig.
Jeder Zugriff auf eine Spalte, die nicht im Index ist, verhindert diese Optimierung. Die Datenbank muss dann für jede Zeile, die der ursprünglichen where-Klausel entspricht, in die Tabelle gehen, und nachsehen ob diese Zeile auch dem neuen where-Filter genügt. Selbst wenn der neue Filter alle Zeilen entfernt, geschieht das erst, nachdem ein zusätzlicher Aufwand angefallen ist. Obwohl die Gruppierung dann schneller geht (weniger Zeilen) kann das den Mehraufwand des Tabellenzugriffes nicht ausgleichen.
Tipp
Verwende einen Index-Only Scan für Abfragen über viele Zeilen aber wenige Spalten.
Vermeide select * um die Chance auf einen Index-Only Scan zu verbessern.
Siehe auch: Index-Only Scan und Myth: select * is bad

Zum Ergebnis

Frage 4

Passen Index und Abfrage zueinander oder nicht?

CREATE INDEX tbl_idx ON tbl (text)

PRAGMA case_sensitive_like = true

SELECT *
  FROM tbl
 WHERE text LIKE 'TJ%'

Deine Antwort:

Passen: Keine Änderung nötig.
Obwohl like-Ausdrücke, die mit einem Wildcard-Zeichen (% oder _) beginnen, diesen Index nicht effizient nutzen können, kann ein Suchbegriff, der das Wildcard-Zeichen nur am Ende hat diesen Index sehr effizient nutzen.
Siehe auch: Eine bildhafte Erklärung, wann like langsam ist
Passen nicht: Der Index oder die Abfrage sollten geändert werden
Obwohl like-Ausdrücke, die mit einem Wildcard-Zeichen (% oder _) beginnen, diesen Index nicht effizient nutzen können, kann ein Suchbegriff, der das Wildcard-Zeichen nur am Ende hat diesen Index sehr effizient nutzen.
Siehe auch: Eine bildhafte Erklärung, wann like langsam ist

Nächste Frage

Frage 3

Passt der Index zu beiden Abfragen?

CREATE INDEX tbl_idx ON tbl (a, b)

SELECT *
  FROM tbl
 WHERE a = 38
   AND b = 1

SELECT *
  FROM tbl
 WHERE b = 1

Deine Antwort:

Passen: Keine Änderung nötig.
Der Index passt nur zur ersten Abfrage. Die Zweite Abfrage kann den Index nicht effizient nutzen.
Grundsätzlich kann der Index immer noch komplett gelesen werden (Full-Index-Access). Das ist jedoch sehr ineffizient und kann nicht als Lösung angesehen werden.
Dreht man die Spalten im Index um, wird der Index für beide Abfragen nutzbar – ohne zusätzlichen Wartungsaufwand. Der Index sollte daher wie folgt aussehen:
```
CREATE INDEX tbl_idx ON tbl (b, a)
```
Tipp
Indizes können nur von links nach rechts effizient genutzt werden. Wenn der erste Indexspalte nicht in der where-Klausel ist, ist der Index nutzlos.
Lies mehr über mehrspaltige Indizes.
Passen nicht: Der Index oder eine Abfrage sollte geändert werden
Der Index passt nur zur ersten Abfrage. Die Zweite Abfrage kann den Index nicht effizient nutzen.
Grundsätzlich kann der Index immer noch komplett gelesen werden (Full-Index-Access). Das ist jedoch sehr ineffizient und kann nicht als Lösung angesehen werden.
Dreht man die Spalten im Index um, wird der Index für beide Abfragen nutzbar – ohne zusätzlichen Wartungsaufwand. Der Index sollte daher wie folgt aussehen:
```
CREATE INDEX tbl_idx ON tbl (b, a)
```
Tipp
Indizes können nur von links nach rechts effizient genutzt werden. Wenn der erste Indexspalte nicht in der where-Klausel ist, ist der Index nutzlos.
Lies mehr über mehrspaltige Indizes.

Nächste Frage

Frage 2

Passen Index und Abfrage zueinander oder nicht?

CREATE INDEX tbl_idx ON tbl (a, date_column)

SELECT *
  FROM tbl
 WHERE a = 12
 ORDER BY date_column DESC
 LIMIT 1

Deine Antwort:

Passen: Keine Änderung nötig.
Die Abfrage kann als indizierte Top-N-Abfrage laufen. Dafür muss nur der B-Baum durchwandert werden (log(n)) und ein einziges mal auf die Tabelle zugegriffen werden.
Tipp
Verwende dieses Muster für Abfragen nach dem letzten, besten, … Eintrag.
Dafür ist es essentiell, dass der Index die where und order by-Klauseln unterstützt. Die Datenbank nutzt den Index, um den letzten passenden Eintrag zu finden, und nimmt diese Zeile gleich als Ergebnis. Obwohl es eine order by-Klausel gibt, muss nicht sortiert werden.
Mehr dazu
Passen nicht: Der Index oder die Abfrage sollten geändert werden
Die Abfrage kann als indizierte Top-N-Abfrage laufen. Dafür muss nur der B-Baum durchwandert werden (log(n)) und ein einziges mal auf die Tabelle zugegriffen werden.
Tipp
Verwende dieses Muster für Abfragen nach dem letzten, besten, … Eintrag.
Dafür ist es essentiell, dass der Index die where und order by-Klauseln unterstützt. Die Datenbank nutzt den Index, um den letzten passenden Eintrag zu finden, und nimmt diese Zeile gleich als Ergebnis. Obwohl es eine order by-Klausel gibt, muss nicht sortiert werden.
Mehr dazu

Nächste Frage

Frage 1

Passen Index und Abfrage zueinander oder nicht?

CREATE INDEX tbl_idx ON tbl (date_column)

SELECT COUNT(*)
  FROM tbl
 WHERE STRFTIME ('%Y', date_column) = 2025

Deine Antwort:

Passen: Keine Änderung nötig.
Durch die Anwendung der Funktion wird der Index für diese Abfrage nutzlos.
Grundsätzlich kann der Index immer noch komplett gelesen werden (Full-Index-Access). Das ist jedoch sehr ineffizient und kann nicht als Lösung angesehen werden.
Tipp
Schreibe Suchen nach zusammenhängenden Perioden als explizite Bereichsbedingung.
Besser ist es, den Index zu behalten und die Abfrage umzuschreiben:
```
SELECT COUNT(*)
  FROM tbl
 WHERE date_column >= '2025-01-01'
   AND date_column <  '2026-01-01'
```
Beachte, dass ein funktionsbasierter Index nicht die empfohlene Lösung für solche Abfragen ist.
Mehr dazu
- SQL extract: Zugriff auf Datums- und Zeit-Felder
- Vermeide es, den „letzten Moment“ eines Zeitbereiches ermitteln zu müssen
Passen nicht: Der Index oder die Abfrage sollten geändert werden
Durch die Anwendung der Funktion wird der Index für diese Abfrage nutzlos.
Grundsätzlich kann der Index immer noch komplett gelesen werden (Full-Index-Access). Das ist jedoch sehr ineffizient und kann nicht als Lösung angesehen werden.
Tipp
Schreibe Suchen nach zusammenhängenden Perioden als explizite Bereichsbedingung.
Besser ist es, den Index zu behalten und die Abfrage umzuschreiben:
```
SELECT COUNT(*)
  FROM tbl
 WHERE date_column >= '2025-01-01'
   AND date_column <  '2026-01-01'
```
Beachte, dass ein funktionsbasierter Index nicht die empfohlene Lösung für solche Abfragen ist.
Mehr dazu
- SQL extract: Zugriff auf Datums- und Zeit-Felder
- Vermeide es, den „letzten Moment“ eines Zeitbereiches ermitteln zu müssen

Nächste Frage

Wenn du diese Seite magst, magst du vielleicht auch …

… meine Newsletter bestellen, gratis Sticker erhalten, mein Buch kaufen oder an einer Schulung teilnehmen.

Dein Ergebnis

Du hast ${RESULT} von 5 richtig Beantwortet.

Diese fünf Fehler solltest du nie wieder machen:

Unnötige Funktionen auf indizierte Spalten in der where-Klausel anwenden
Nicht von indizierten Top-N-Abfragen profitieren
Die Spaltenreihenfolge in mehrspaltigen Indizes falsch wählen
Like-Filter ineffizient anwenden
Den Index-Only Scan nicht nutzen

Die Erklärungen zu den einzelnen Punkten findest du unten. Wenn du die Beispiele selbst ausprobieren möchtest, findest du die nötigen create-Anweisungen in diesem Download.

Du kannst nicht alles an einem Tag lernen. Abonniere den Newsletter via E-Mail, Bluesky oder RSS um sukzessive aufzuholen. Und sieh dir auch modern-sql.com an.

Über den Autor

Markus Winand gibt auf modern-sql.com Einblick in SQL und zeigt, wie es von verschiedenen Systemen unterstützt wird. Zuvor machte er use-the-index-luke.com, was er noch immer wartet. Markus kann als Trainer, Sprecher und Berater auf winand.at engagiert werden.

Was weißt du über SQLite Indizierung?

Bevor ich dir das Ergebnis zeige…

Lade deine Antworten bitte hoch

Frage 5

Tipp

Tipp

Tipp

Tipp

Frage 4

Frage 3

Tipp

Tipp

Frage 2

Tipp

Mehr dazu

Tipp

Mehr dazu

Frage 1

Tipp

Mehr dazu

Tipp

Mehr dazu

Wenn du diese Seite magst, magst du vielleicht auch …

Dein Ergebnis

Über den Autor

Der 3-Minuten Test

Inhaltsverzeichnis

Aktuelle Blog Posts

Geek-Ware

Neuigkeiten Abonnieren

Was weißt du über SQLite Indizierung?

Bevor ich dir das Ergebnis zeige…

Lade deine Antworten bitte hoch

Frage 5

Tipp

Tipp

Tipp

Tipp

Frage 4

Frage 3

Tipp

Tipp

Frage 2

Tipp

Mehr dazu

Tipp

Mehr dazu

Frage 1

Tipp

Mehr dazu

Tipp

Mehr dazu

Wenn du diese Seite magst, magst du vielleicht auch …

Dein Ergebnis

Über den Autor

Sein Buch kaufen

Sein Training

Der 3-Minuten Test

Inhaltsverzeichnis

Aktuelle Blog Posts

Geek-Ware

Neuigkeiten Abonnieren