インデックスの結合

複数のインデックスを結合する

「各列を含むインデックスを1つ作るのと、where句に出てくる全ての列にそれぞれインデックスを作るの、どっちがいいの？」というのは、インデックス作成に関する一番よくある質問でしょう。その答えは非常に簡単で、多くの場合は、複数の列を含む 1つのインデックスの方がよいでしょう。そのようなインデックスを、連結あるいは複合インデックスといいます。詳しくは「複合インデックス」で説明しています。

とは言え、どうインデックスを作ったとしても1つのインデックスでは完璧な動きにできないクエリもあります。例えば以下の例のように、 2つ以上の範囲条件を含むクエリがそうです。

SELECT first_name, last_name, date_of_birth 
  FROM employees
 WHERE UPPER(last_name) < ? 
   AND date_of_birth    < ?

フィルタ述語なしにBツリーインデックスでこのようなクエリをサポートすることはできません。これを考えるには、インデックスは連結リストであることを思い出す必要があります。

インデックスをUPPER(LAST_NAME), DATE_OF_BIRTHの順で定義した時、リストはAから始まり Zで終わります。誕生日は、同名の従業員が2人いる時にだけ考慮されます。インデックスを逆の順序で定義した場合は、リストは最も年上の従業員で始まり、最も若い従業員で終わります。この時、従業員の名前は、並べ替えの順序に大きな影響を与えません。

いくらインデックスの定義をいじっても、エントリは常に鎖のようにつながりになります。一端には小さな値が、反対側には大きな値が来ます。そのため、インデックスはアクセス述語としては1つの範囲条件しかサポートできないのです。2つの独立した範囲条件をサポートするには、チェスの盤のように、2つ目の軸が必要になります。上で挙げたようなクエリはチェス盤の角から全てのエントリを検索できます。しかしインデックスはチェス盤ではなく鎖のようになっており、角はありません。

協力してください

この記事が気に入ったら、私の書いた本「SQLパフォーマンス詳解」や私によるトレーニングもきっと気にいるはず。

フィルタ述語を使うことはできますので、結局はマルチカラムインデックスと組み合わせて使うことになります。多くの場合は、それが最適解になります。選択性のより高い列をインデックス定義の最初に置くことで、アクセス述語に使うことができます。これが、「最も選択性の高い列を最初に」という都市伝説の根拠です。ただし、これはフィルタ述語を使わざるを得ない時にのみ当てはまる法則です。

もう1つの方法として、別々の列に対して作成したインデックスを2つ使う手もあります。この場合は、データベースはまずそれぞれのインデックスをスキャンし、その結果をまとめなくてはなりません。複数のインデックスを使うのは、それぞれのインデックスツリーをたどらなくてはならないことから、それだけでそれなりの負荷が要求されます。さらに加えて、データベースは中間結果をまとめるのに多くのメモリとCPU リソースを消費する必要があるのです。

注記

インデックスは、2つ使うより1つだけ使う方が高速。

データベースは、インデックスをまとめるのに2つの方法を使います。最初は、インデックスの結合演算です。第4章4, 「結合処理」で、関連するアルゴリズムについて説明しています。2つ目は、データウェアハウスの機能を活用したアプローチです。

データウェアハウスは、アドホックなクエリを実行する環境のルーツであるとも言えます。任意の条件をクリックで選んでいき、それをクエリとして実行する必要があります。where句に現れる列の組み合わせを事前に予想することが難しいので、ここまで述べてきたように、その状況では、インデックスをうまく使うのはほぼ無理ということになります。

データウェアハウスでは、この問題を解決するために特別なインデックスタイプを使います。それが、いわゆるビットマップインデックスです。ビットマップインデックスが有利なのは、比較的簡単に結果をまとめることができる点です。つまり、各列にそれぞれインデックスを作成した時にそれなりのパフォーマンスが得られるということです。逆に言えば、クエリが事前に分かっていて、マルチカラムなBツリーインデックスを作っておいた方が、複数のビットマップインデックスをまとめるよりも高速だということです。

一方で、ビットマップインデックスの飛び抜けた弱点は、insertやupdate、deleteのスケーラビリティがとんでもなく悪いということです。同時書き込みは実質的に不可能です。これは、データのロードの処理が順番にスケジュールされることの多いデータウェアハウスにおいては特に問題にはなりません。しかしオンラインアプリケーションでは、ビットマップインデックスはほぼ使い物にならないと言えます。

重要

ビットマップインデックスは、オンライントランザクション処理(OLTP)では使い物になりません。

多くのデータベース製品では、Bツリーとビットマップインデックスのハイブリッドな仕組みが提供されています。適当なアクセスパスがない時は、Bツリーのスキャンの結果を、メモリ上のビットマップ構造に変換します。この変換は、効率的にできます。ビットマップ構造は永続化して保存されることはなく、SQL文の実行後に破棄されるので、書き込みのスケーラビリティがないことによる問題を回避できます。この方法のマイナス面としては、メモリとCPUが大量に必要になることです。結局のところこの方法は、オプティマイザがやけくそになった時の最終手段です。

前へ次へ

You can’t learn everything in one day. Subscribe the newsletter via E-Mail, Bluesky or RSS to gradually catch up. Have a look at modern-⁠sql.com as well.

著者について

Markus Winand氏は、開発者がSQLパフォーマンスを改善するお手伝いをしています。彼は、SQL Performance Explainedの著者でもあり、出張トレーニングや http://winand.at/でのリモート講義も行っています。

インデックスの結合

協力してください

注記

重要

著者について

目次

最新ニュース

Connect with Markus Winand

インデックスの結合

協力してください

注記

重要

著者について

彼の本

目次

最新ニュース

Connect with Markus Winand