von Markus Winand.

Numerische Strings


Numerische Strings sind Zahlen, die in Text-Feldern gespeichert werden. Obwohl das eine sehr schlechte Design-Praxis ist, kann man einen Index dennoch nutzen, wenn man diese Spalten durchgehend als Text behandelt.

SELECT ...
  FROM ...
 WHERE numeric_string = '42'

Diese Abfrage kann einen Index auf NUMERIC_STRING natürlich nutzen. Wenn man den Vergleich aber mit einer Zahl durchführt, kann die Bedingung nicht mehr als Zugriffsprädikat verwendet werden.

SELECT ...
  FROM ...
 WHERE numeric_string = 42

Beachte die fehlenden Hochkomma. Manche Datenbanken liefern hier einen Fehler (z.B. PostgreSQL), viele führen stattdessen aber einfach eine implizite Konvertierung durch:

SELECT ...
  FROM ...
 WHERE TO_NUMBER(numeric_string) = 42

Es ist also dasselbe Problem wie zuvor. Durch die Funktion kann ein Index auf NUMERIC_STRING nicht sinnvoll genutzt werden. Die Lösung ist wieder dieselbe: Anstatt den Spaltentypen an den Suchbegriff anzupassen, passt man den Suchbegriff an den Spaltentypen an:

SELECT ...
  FROM ...
 WHERE numeric_string = TO_CHAR(42)

Da kann man sich schon fragen, warum es die Datenbank nicht anders macht? Das liegt daran, dass das Parsen eines numerischen Strings immer ein eindeutiges Ergebnis liefert. Umgekehrt ist das nicht der Fall. Wenn man eine Zahl als Text darstellt, kann man zum Beispiel Tausender-Separatoren oder führende Nullen verwenden.

42
042
0042
00042
...

Die Datenbank weiß nicht, wie die Zahlen im Textfeld formatiert sind. Daher wird die Konvertierung in die andere Richtung durchgeführt; der Text wird in Zahlen gewandelt – das ist immer eindeutig.

Hinweis in eigener Sache

Wenn Dir dieser Artikel gefällt, könnte mein Buch SQL Performance Explained oder mein Training auch etwas für Dich sein.

Bei der Konvertierung mit TO_CHAR erhält man nur eine String-Repräsen­tation der Zahl. Eine Abfrage liefert dann nur den ersten der oben angeführten Werte. Mit der TO_NUMBER-Konvertierung erhält man aber alle Werte. Die beiden Varianten sind also nicht nur aus Performance-Sicht, sondern auch inhaltlich unterschiedlich!

Mit numerischen Strings handelt man sich also zahlreiche Probleme ein. Vor allem die Performance-Probleme bei einer impliziten Konvertierung, aber auch das Risiko von Konvertierungsfehlern, wenn ungültige Zahlen gespeichert sind. Dadurch kann sogar die trivialste Abfrage mit einer Fehlermeldung abbrechen.

Tipp

Verwende numerische Typen, um Zahlen zu speichern.

In die andere Richtung besteht das Problem übrigens nicht.

SELECT ...
  FROM ...
 WHERE numeric_number = '42'

Die Datenbank wird auch hier den String als Zahl interpretieren. Die Konvertierung wird aber nicht auf der Tabellenspalte durchgeführt, die eventuell indiziert sein könnte. Daher kann diese Abfrage einen normalen Index auf NUMERIC_NUMBER nutzen. Manuell kann man die Abfrage dennoch verschleiern, indem man die Konvertierung auf der falschen Seite durchführt:

SELECT ...
  FROM ...
 WHERE TO_CHAR(numeric_number) = '42'

Über den Autor

Foto von Markus Winand

Markus Winand lehrt effizientes SQL – inhouse und online. Er minimiert die Entwicklungszeit durch modernes SQL und optimiert die Laufzeit durch schlaue Indizierung – dazu hat er auch das Buch SQL Performance Explained veröffentlicht.

Sein Buch bei Amazon kaufen

Titelbild von „SQL Performance Explained“: Eichhörnchen läuft durchs Grass

Die Essenz: SQL-Tuning auf 200 Seiten

Bei Amazon kaufen
(Taschenbuch)

Taschenbuch und PDF auch auf Markus' Webseite erhältlich.

Holen Sie sich Markus

…für ein Training ins Büro.

Sein beliebtes Training stimmt Entwickler auf SQL Performance ein.

Erfahren Sie mehr»

„Use The Index, Luke!“ von Markus Winand ist unter einer Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported License lizenziert.
Impressum | Kontakt | KEINE GEWÄHR | Handelsmarken | Datenschutz | CC-BY-NC-ND 3.0 Lizenz