Ein Clustered-Index (SQL Server, MySQL/InnoDB) ist eine Tabelle, die in einer B-Tree Struktur gespeichert wird. Es gibt keine zweite Struktur (Heap-Tabelle).
Ein Non-Clustered Index ist ein Index, der auf eine andere Datenstruktur verweist, wo weitere Tabellenspalten gespeichert werden.
Ein Tabellenzugriff über einen sekundären Index (Index auf dem Clustered Index) ist langsamer als dasselbe Szenario mit einer Heap-Tabelle.
SQL Server kann Tabellen optional als Clustered-Index verwalten. Man hat also die freie Wahl zwischen einem Clustered-Index und einer Heap-Tabelle. Es kann jedoch maximal einen Clustered-Index pro Tabelle geben. Wenn dieser gelöscht wird, wird die Tabelle in eine Heap-Tabelle umgebaut. Beim Anlegen eines Clustered-Indexes auf eine Heap-Tabelle wird die Heap-Strutkur gelöscht. SQL Server unterstützt beliebige Clustering-Schlüssel – insbesondere auch non-unique Spaltenkombinationen. Um eine SQL Server Tabelle ohne Clustered-Index anzulegen, muss die NONCLUSTERED
Klausel verwendet werden:
CREATE TABLE (
id NUMBER NOT NULL,
[...]
CONSTRAINT pk PRIMARY KEY NONCLUSTERED (id)
)
Die MySQL InnoDB Engine verwendet ausschließlich Clustered-Indizes. MySQL verwendet den Primärschlüssel oder einen Unique-Constraint als Clustering-Schlüssel. Wenn es keinen Unique-Constraint gibt, generiert MySQL eine eindeutige ID für jeden Eintrag. Die MyISAM Engine kennt keinen Clustered-Index und verwendet ausschließlich Heap-Tabellen.
Die Oracle Datenbank kann Tabellen als Clustered-Index verwalten, nennt diese Funktion aber Index-organisierte Tabelle.
Links
Buch Abschnitt: Index-organisierte Tabellen
Glossar: Heap-Tabelle — Unsortiert gespeicherte Tabellen
Glossar: Sekundärer Index — Weitere Indizes auf einen Clustered-Index