de Martin LE TARNEC.

Los nodos hojas de un índice


El propósito de un índice es proveer una representación ordenada de los datos. Sin embargo, no es posible almacenar los datos de forma secuencial porque una sentencia insert generaría el movimiento de los datos presentes para hacer espacio a los nuevos. Mover grandes cantidades de datos consume mucho tiempo, y eso provocaría lentitud durante la ejecución de la sentencia insert. La solución es establecer un orden lógico, que es independiente del orden físico en memoria.

El orden lógico se crea a través de la lista doblemente enlazada. Cada nodo tiene un puntero hacia sus dos nodos vecinos, parecido a una cadena. Los nuevos nodos se agregan entre dos nodos existentes, que actualizan su puntero haciendo referencia al nuevo nodo. La ubicación física de los nuevos nodos no importa debido a que la lista doblemente enlazada mantiene el orden lógico.

Esta estructura se domina una lista doblemente enlazada , porque cada nodo hace referencia al anterior y al siguiente nodo. De este modo, la base de datos puede leer el índice hacia delante o hacia atrás según sea necesario. Es posible insertar un nuevo nodo sin mover grandes cantidades de datos, solo se actualizarían los punteros.

Las listas doblemente enlazadas son también usadas por las colecciones (contenedores) en muchos lenguajes de programación.

Lenguaje de programaciónNombre
Javajava.util.LinkedList
.NET FrameworkSystem.Collections.Generic.LinkedList
C++std::list

Las bases de datos utilizan las listas doblemente enlazadas para conectar los nodos hojas. Cada nodo hoja está almacenado dentro de un bloque de la base de datos (también llamado página); esta es la unidad de almacenamiento más pequeña. Todos los bloques de índices tienen el mismo tamaño, generalmente unos kilobytes. La base de datos usa el espacio de cada bloque lo mejor que puede y almacena el mayor número posible de registros en cada bloque. Eso significa que el orden del índice se mantiene sobre dos niveles diferentes: los registros del índice dentro de cada nodo hoja y los nodos hojas entre ellos mismos usando la lista doblemente enlazada.

Figura 1.1 Nodo hoja del índice y datos de la tabla

Figura 1.1 ilustra los nodos hojas del índice y su conexión con la tabla de datos. Cada registro del índice consiste en las columnas indexadas (la llave, la columna 2) y hace referencia a su registro correspondiente dentro de la tabla (a través del ROWID o RID). A diferencia del índice, los datos de la tabla están almacenados en una estructura llamada heap que no está ordenada. No existe ninguna relación entre los registros almacenados en el mismo bloque de la tabla, ni existen conexiones entre los bloques.

Si te gusta mi manera de explicar las cosas, te encantará mi libro.

Acerca del autor

Foto de Markus Winand

Markus Winand enseña eficientemente SQL, en casa y online. Minimiza el tiempo de desarrollo utilizando moderno SQL y optimiza el tiempo de ejecución con indexación inteligente. Para ello también ha publicado el libro SQL Performance Explained.

“Use The Index, Luke” de Markus Winand se halla bajo licencia Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported License.
Aspectos legales | Contacto | SIN GARANTÍA | Marcas | Privacy | CC-BY-NC-ND 3.0 licencia