von Markus Winand.

Numerische Strings


Numerische Strings sind Zahlen, die in Text-Feldern gespeichert werden. Obwohl das eine sehr schlechte Design-Praxis ist, kann man einen Index dennoch nutzen, wenn man diese Spalten durchgehend als Text behandelt.

SELECT ...
  FROM ...
 WHERE numeric_string = '42'

Diese Abfrage kann einen Index auf NUMERIC_STRING natürlich nutzen. Wenn man den Vergleich aber mit einer Zahl durchführt, kann die Bedingung nicht mehr als Zugriffsprädikat verwendet werden.

SELECT ...
  FROM ...
 WHERE numeric_string = 42

Beachte die fehlenden Hochkomma. Manche Datenbanken liefern hier einen Fehler (z.B. PostgreSQL), viele führen stattdessen aber einfach eine implizite Konvertierung durch:

SELECT ...
  FROM ...
 WHERE TO_NUMBER(numeric_string) = 42

Es ist also dasselbe Problem wie zuvor. Durch die Funktion kann ein Index auf NUMERIC_STRING nicht sinnvoll genutzt werden. Die Lösung ist wieder dieselbe: Anstatt den Spaltentypen an den Suchbegriff anzupassen, passt man den Suchbegriff an den Spaltentypen an:

SELECT ...
  FROM ...
 WHERE numeric_string = TO_CHAR(42)

Da kann man sich schon fragen, warum es die Datenbank nicht anders macht? Das liegt daran, dass das Parsen eines numerischen Strings immer ein eindeutiges Ergebnis liefert. Umgekehrt ist das nicht der Fall. Wenn man eine Zahl als Text darstellt, kann man zum Beispiel Tausender-Separatoren oder führende Nullen verwenden.

42
042
0042
00042
...

Die Datenbank weiß nicht, wie die Zahlen im Textfeld formatiert sind. Daher wird die Konvertierung in die andere Richtung durchgeführt; der Text wird in Zahlen gewandelt – das ist immer eindeutig.

Bei der Konvertierung mit TO_CHAR erhält man nur eine String-Repräsen­tation der Zahl. Eine Abfrage liefert dann nur den ersten der oben angeführten Werte. Mit der TO_NUMBER-Konvertierung erhält man aber alle Werte. Die beiden Varianten sind also nicht nur aus Performance-Sicht, sondern auch inhaltlich unterschiedlich!

Mit numerischen Strings handelt man sich also zahlreiche Probleme ein. Vor allem die Performance-Probleme bei einer impliziten Konvertierung, aber auch das Risiko von Konvertierungsfehlern, wenn ungültige Zahlen gespeichert sind. Dadurch kann sogar die trivialste Abfrage mit einer Fehlermeldung abbrechen.

Tipp

Verwende numerische Typen, um Zahlen zu speichern.

In die andere Richtung besteht das Problem übrigens nicht.

SELECT ...
  FROM ...
 WHERE numeric_number = '42'

Die Datenbank wird auch hier den String als Zahl interpretieren. Die Konvertierung wird aber nicht auf der Tabellenspalte durchgeführt, die eventuell indiziert sein könnte. Daher kann diese Abfrage einen normalen Index auf NUMERIC_NUMBER nutzen. Manuell kann man die Abfrage dennoch verschleiern, indem man die Konvertierung auf der falschen Seite durchführt:

SELECT ...
  FROM ...
 WHERE TO_CHAR(numeric_number) = '42'

Wenn dir gefällt, wie ich die Dinge erkläre, wirst du meine Kurse lieben.

Über den Autor

Foto von Markus Winand

Markus Winand lehrt effizientes SQL – inhouse und online. Er minimiert die Entwicklungszeit durch modernes SQL und optimiert die Laufzeit durch schlaue Indizierung – dazu hat er auch das Buch SQL Performance Explained veröffentlicht.

„Use The Index, Luke!“ von Markus Winand ist unter einer Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported License lizenziert.
Impressum | Kontakt | KEINE GEWÄHR | Handelsmarken | Datenschutz | CC-BY-NC-ND 3.0 Lizenz