von Markus Winand.

Numerische Strings


Numerische Strings sind Zahlen, die in Text-Feldern gespeichert werden. Obwohl das eine sehr schlechte Design-Praxis ist, kann man einen Index dennoch nutzen, wenn man diese Spalten durchgehend als Text behandelt.

SELECT ...
  FROM ...
 WHERE numeric_string = '42'

Diese Abfrage kann einen Index auf NUMERIC_STRING natürlich nutzen. Wenn man den Vergleich aber mit einer Zahl durchführt, kann die Bedingung nicht mehr als Zugriffsprädikat verwendet werden.

SELECT ...
  FROM ...
 WHERE numeric_string = 42

Beachte die fehlenden Hochkomma. Manche Datenbanken liefern hier einen Fehler (z.B. PostgreSQL), viele führen stattdessen aber einfach eine implizite Konvertierung durch:

SELECT ...
  FROM ...
 WHERE TO_NUMBER(numeric_string) = 42

Es ist also dasselbe Problem wie zuvor. Durch die Funktion kann ein Index auf NUMERIC_STRING nicht sinnvoll genutzt werden. Die Lösung ist wieder dieselbe: Anstatt den Spaltentypen an den Suchbegriff anzupassen, passt man den Suchbegriff an den Spaltentypen an:

SELECT ...
  FROM ...
 WHERE numeric_string = TO_CHAR(42)

Da kann man sich schon fragen, warum es die Datenbank nicht anders macht? Das liegt daran, dass das Parsen eines numerischen Strings immer ein eindeutiges Ergebnis liefert. Umgekehrt ist das nicht der Fall. Wenn man eine Zahl als Text darstellt, kann man zum Beispiel Tausender-Separatoren oder führende Nullen verwenden.

42
042
0042
00042
...

Die Datenbank weiß nicht, wie die Zahlen im Textfeld formatiert sind. Daher wird die Konvertierung in die andere Richtung durchgeführt; der Text wird in Zahlen gewandelt – das ist immer eindeutig.

Hinweis in eigener Sache: Schulung in Wien

SQL Performance und modernes SQL – das sind die Themen meiner 5-tägigen SQL-Schulung im Mai. Mehr darüber und andere Schulungsformate auf winand.at.

Bei der Konvertierung mit TO_CHAR erhält man nur eine String-Repräsen­tation der Zahl. Eine Abfrage liefert dann nur den ersten der oben angeführten Werte. Mit der TO_NUMBER-Konvertierung erhält man aber alle Werte. Die beiden Varianten sind also nicht nur aus Performance-Sicht, sondern auch inhaltlich unterschiedlich!

Mit numerischen Strings handelt man sich also zahlreiche Probleme ein. Vor allem die Performance-Probleme bei einer impliziten Konvertierung, aber auch das Risiko von Konvertierungsfehlern, wenn ungültige Zahlen gespeichert sind. Dadurch kann sogar die trivialste Abfrage mit einer Fehlermeldung abbrechen.

Tipp

Verwende numerische Typen, um Zahlen zu speichern.

In die andere Richtung besteht das Problem übrigens nicht.

SELECT ...
  FROM ...
 WHERE numeric_number = '42'

Die Datenbank wird auch hier den String als Zahl interpretieren. Die Konvertierung wird aber nicht auf der Tabellenspalte durchgeführt, die eventuell indiziert sein könnte. Daher kann diese Abfrage einen normalen Index auf NUMERIC_NUMBER nutzen. Manuell kann man die Abfrage dennoch verschleiern, indem man die Konvertierung auf der falschen Seite durchführt:

SELECT ...
  FROM ...
 WHERE TO_CHAR(numeric_number) = '42'

Über den Autor

Foto von Markus Winand

Markus Winand ist der SQL Renaissance Botschafter auf der Mission, Entwickler auf die Evolution von SQL im 21. Jahrhundert aufmerksam zu machen. Markus kann als Trainer, Sprecher und Berater auf winand.at engagiert werden.

Sein Buch bei Amazon kaufen

Titelbild von „SQL Performance Explained“: Eichhörnchen läuft durchs Grass

Die Essenz: SQL-Tuning auf 200 Seiten

Bei Amazon kaufen
(Taschenbuch)

Taschenbuch und PDF auch auf Markus' Webseite erhältlich.

Sein Training

Markus verwandelt veraltetes SQL-92-Wissen in solides und zeitgemäßes SQL-Know-how

Erfahren Sie mehr»

„Use The Index, Luke!“ von Markus Winand ist unter einer Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported License lizenziert.
Impressum | Kontakt | KEINE GEWÄHR | Handelsmarken | Datenschutz und DSGVO | CC-BY-NC-ND 3.0 Lizenz