Opérations

Cette section explique les opérations les plus communes sur un plan d'exécution de la base de données SQL Server de Microsoft. Vous pouvez aussi jeter un œil à la documentation de Microsoft.

Accès aux tables et aux index

SQL Server a une terminologie simple : les opérations « Scan » lisent la totalité de l'index ou de la table, alors que les opérations « Seek » utilisent le B-tree ou une adresse physique (RID, équivalent de ROWID sur Oracle) pour accéder à une partie spécifique de l'index ou de la table.

Index Seek, Clustered Index Seek: L'opération Index Seek effectue un parcours B-tree et suit la chaîne de nœuds feuilles pour trouver toutes les entrées correspondantes. Voir aussi « Anatomie d'un index SQL ».
Index Scan, Clustered Index Scan: Lit entièrement l'index (toutes les lignes) dans l'ordre de l'index. Selon diverses statistiques systèmes, la base de données peut utiliser cette opération si elle a besoin de toutes les lignes dans l'ordre de l'index, par exemple pour une clause order by correspondante.
Key Lookup (Clustered): Récupère une ligne unique à partir d'un index organisé. Ceci est équivalent à un INDEX UNIQUE SCAN sur Oracle pour une table organisée en index (IOT). Voir aussi « Regrouper les données : La deuxième puissance de l'indexation ».
RID Lookup (Heap): Récupère une ligne unique à partir d'une table, équivalent au TABLE ACCESS BY INDEX ROWID sur Oracle. Voir aussi « Anatomie d'un index SQL ».
Table Scan: Cette opération est également connue comme un parcours complet de table. Elle lit entièrement la table, lignes et colonnes, comme stockées sur le disque. Bien que des opérations de lecture multi-blocs puissent améliorer considérablement la vitesse d'un Table Scan, il s'agit quand même d'une des opérations les plus coûteuses. En dehors des taux élevés d'entrées/sorties, un Table Scan doit également inspecter toutes les lignes de la table, et par conséquent requérir une quantité considérable de temps processeur. Voir aussi « Parcours complet de table ».

Jointures

En général, les opérations de jointure ne traitent que deux tables en même temps. Dans le cas où une requête a plus de tables jointes, elles sont exécutées séquentiellement : d'abord deux tables, puis le résultat intermédiaire avec la table suivante. Dans le contexte de jointure, le terme « table » peut aussi signifier « résultat intermédiaire ».

Nested Loops: Joint deux tables en récupérant le résultat d'une table et en requêtant l'autre table pour chacune des lignes de la première. SQL Server utilise également des opérations de boucles imbriquées pour récupérer des données de table après un accès d'index. Voir aussi « Boucles imbriquées ».
Hash Match: La jointure par correspondance de hachage charge les enregistrements candidats à partir d'un côté de la jointure dans une table de hachage, qui est alors sondée pour chacune des lignes de l'autre côté de la jointure. Voir aussi « Jointure par hachage ».
Merge Join: La jointure d'assemblage combine deux listes triées comme une fermeture Éclair. Les deux côtés de la jointure doivent être pré-triés. Voir aussi « Fusion par tri ».

Tri et regroupement

Sort: Trie le résultat selon la clause order by. Cette opération nécessite une grande quantité de mémoire pour matérialiser le résultat intermédiaire (sans pipeline). Voir aussi « Indexer un tri ».
Sort (Top N Sort): Trie un sous ensemble du résultat selon la clause order by. Elle est utilisée pour les requêtes top-N si une exécution avec pipeline n'est pas possible. Voir aussi « Récupérer les N premières lignes ».
Stream Aggregate: Agrège un ensemble pré-trié selon la clause group by. Cette opération ne place pas le résultat intermédiaire dans un tampon : il est exécuté dans un pipeline. Voir aussi « Indexer le Group By » à la page %p.
Hash Match (Aggregate): Groupe les résultats en utilisant une table de hachage. Cette opération nécessite une grande quantité de mémoire pour matérialiser le résultat intermédiaire (sans pipeline). La sortie n'est pas triée. Voir aussi « Indexer le Group By » à la page %p.

Requêtes Top-N

Top

Annule les opérations sous-jacentes quand le nombre désiré de lignes a été récupéré. Voir aussi « Récupérer les N premières lignes ».

L'efficacité d'une requête top-N dépend du mode d'exécution des opérations sous-jacentes. C'est très inefficace lors de l'arrêt d'opérations ne fonctionnant pas en pipeline, comme un Sort par exemple.

Section précédente Section suivante

You can’t learn everything in one day. Subscribe the newsletter via E-Mail, Bluesky or RSS to gradually catch up. Have a look at modern-⁠sql.com as well.

À propos de l'auteur

Markus Winand est l’ambassadeur de la renaissance SQL. Il a pour mission d’initier les développeurs à l’évolution du SQL au 21ème siècle. Markus peut être engagé comme formateur, conférencier et consultant chez winand.at.

Opérations

Accès aux tables et aux index

Jointures

Tri et regroupement

Requêtes Top-N

À propos de l'auteur

Table des matières

Latest Blog Posts

Entrer en contact avec Markus Winand

Opérations

Accès aux tables et aux index

Jointures

Tri et regroupement

Requêtes Top-N

À propos de l'auteur

Livre de Markus

Table des matières

Latest Blog Posts

Entrer en contact avec Markus Winand