Datenbankindex
Ein Datenbankindex, oder kurz Index (im Plural „Indexe“ oder „Indizes“), ist eine von der Datenstruktur getrennte Indexstruktur in einer Datenbank, die die Suche und das Sortieren nach bestimmten Feldern beschleunigt.
Ein Index besteht aus einer Ansammlung von Zeigern (Verweisen), die eine Ordnungsrelation auf eine oder mehrere Spalten in einer Tabelle definieren. Wird bei einer Abfrage eine indizierte Spalte als Suchkriterium herangezogen, sucht das Datenbankmanagementsystem (DBMS) die gewünschten Datensätze anhand dieser Zeiger. In der Regel finden hier B+-Bäume Anwendung. Ohne Index müsste die Spalte sequenziell durchsucht werden, während eine Suche mit Hilfe des Baums nur logarithmische Komplexität hat.
In der Datenbanksprache SQL wird ein Index mit dem Befehl
CREATE INDEX Indexname ON Tabellenname ( Spaltenname(n) )
definiert (kein Standard-SQL, siehe unten). Meistens wird eine einzelne Spalte indiziert, doch auch zusammengesetzte Indizes sind in den meisten Datenbanksystemen möglich. Auf Spalten, die Primärschlüssel enthalten (SQL-Klausel primary key
im Befehl create table
),
wird automatisch ein Index gelegt.
Häufig reicht die Sortierung der Daten nach einem Primärindex nicht aus, so dass weitere Indizes erforderlich sind. Wird nun für diese weiteren Erschließungen ein Gesamtinhaltsverzeichnis aufgebaut, entsteht ein Sekundärindex.
Arten von Indizes
Bitmap Index
Der Bitmapindex basiert auf der Speicherung der Spaltenwerte in Form von Bitketten. Dieser Indextyp findet aus datenbanktechnischen Gründen Verwendung bei geringer Selektivität und niedriger Aktualisierungserwartung der zu indizierenden Spalte(n).
Clustered Index
Viele Datenbankverwaltungssysteme erlauben auch die Definition eines clustered Index. Dieser unterscheidet sich von einem non-clustered Index dadurch, dass nicht nur die Liste der Zeiger auf die Datensätze in sortierter Form vorliegt, sondern dass das DBMS zusätzlich versucht, neu eingefügte Datensätze, die innerhalb des Index nah beieinander liegen, auch physisch im Speicher nah beieinander abzulegen. Das kann die Suche nach Werten dieser Spalte weiter beschleunigen.
Funktionaler Index
Unter einem funktionalen Index (englisch functional index oder function based index) versteht man eine spezielle Form eines Index in einem Datenbankmanagementsystem. Im Gegensatz zu einem normalen Index werden nicht die reinen Feldwerte, beispielsweise der Vorname, in den Index aufgenommen, sondern mittels Datenbankfunktionen transformierte Werte, beispielsweise to_upper(Vorname)
für eine Umwandlung in Großbuchstaben.
Reverse Index
Unter einem reverse Index versteht man einen Index, in dem die Werte vor dem Speichern bitweise oder byteweise umgekehrt werden. Beim Lesen dieses Index müssen die gelesenen Werte wieder in die richtige Reihenfolge konvertiert werden, bevor sie ausgewertet werden können. Die 'vertauschten' Werte werden wie bei anderen Indizes meistens als B-Baum gespeichert. Ein Reverse-Index hat den Vorteil, dass bei einem Einfügen von fortlaufenden Schlüsseln der Index-Baum nicht in einen unbalancierten Zustand kommt und reorganisiert werden muss. Er hat jedoch den Nachteil, dass ein Range-Scan (z. B. where nr between 100 and 120) nicht über den Reverse-Index evaluiert werden kann.
Partitionierter Index
Genauso wie Datenbanktabellen partitioniert werden können, können auch Indizes partitioniert werden. Dabei wird unterschieden, ob die Partitionierung sich an der ersten Spalte orientiert, die indiziert wird, oder an einer anderen Spalte.
Wenn die Datenbanktabelle, auf die sich der Index bezieht, partitioniert ist, dann kann der Index nach denselben Kriterien partitioniert werden (lokale Indexpartitionierung). Einige Datenbanksysteme z. B. Oracle bieten auch die Möglichkeit, einen Index nach anderen Kriterien zu partitionieren (globale Indexpartitionierung).
Indizes in SQL
Keiner der verschiedenen SQL-Standards definiert Befehle für Indizes. Die Befehle zum Anlegen und Entfernen von Indizes sind daher immer datenbankspezifisch. Allerdings haben sich die Befehle CREATE INDEX und DROP INDEX weitestgehend durchgesetzt.