El propósito de un índice es proveer una representación ordenada de
los datos. Sin embargo, no es posible almacenar los datos de forma
secuencial porque una sentencia insert
generaría el movimiento de los datos presentes para hacer espacio a los
nuevos. Mover grandes cantidades de datos consume mucho tiempo, y eso
provocaría lentitud durante la ejecución de la sentencia insert
. La solución es establecer un orden
lógico, que es independiente del orden físico en memoria.
El orden lógico se crea a través de la lista doblemente enlazada. Cada nodo tiene un puntero hacia sus dos nodos vecinos, parecido a una cadena. Los nuevos nodos se agregan entre dos nodos existentes, que actualizan su puntero haciendo referencia al nuevo nodo. La ubicación física de los nuevos nodos no importa debido a que la lista doblemente enlazada mantiene el orden lógico.
Esta estructura se domina una lista doblemente enlazada , porque cada nodo hace referencia al anterior y al siguiente nodo. De este modo, la base de datos puede leer el índice hacia delante o hacia atrás según sea necesario. Es posible insertar un nuevo nodo sin mover grandes cantidades de datos, solo se actualizarían los punteros.
Las listas doblemente enlazadas son también usadas por las colecciones (contenedores) en muchos lenguajes de programación.
Lenguaje de programación | Nombre |
---|---|
Java | java.util.LinkedList |
.NET Framework | System.Collections.Generic.LinkedList |
C++ | std::list |
Las bases de datos utilizan las listas doblemente enlazadas para conectar los nodos hojas. Cada nodo hoja está almacenado dentro de un bloque de la base de datos (también llamado página); esta es la unidad de almacenamiento más pequeña. Todos los bloques de índices tienen el mismo tamaño, generalmente unos kilobytes. La base de datos usa el espacio de cada bloque lo mejor que puede y almacena el mayor número posible de registros en cada bloque. Eso significa que el orden del índice se mantiene sobre dos niveles diferentes: los registros del índice dentro de cada nodo hoja y los nodos hojas entre ellos mismos usando la lista doblemente enlazada.
Figura 1.1 Nodo hoja del índice y datos de la tabla

Figura 1.1
ilustra los nodos hojas del índice y su conexión con la tabla de datos.
Cada registro del índice consiste en las columnas indexadas (la llave, la
columna 2) y hace referencia a su registro correspondiente dentro de la
tabla (a través del ROWID
o RID
). A diferencia del índice, los datos de la tabla están
almacenados en una estructura llamada heap que no está ordenada. No existe
ninguna relación entre los registros almacenados en el mismo bloque de la
tabla, ni existen conexiones entre los bloques.
Si te gusta mi manera de explicar, te encantará mi libro.