Patricia-Trie
In der Informatik ist ein Patricia-Trie (abgeleitet aus dem engl. reTrieval) eine Datenstruktur, genauer eine spezielle Art eines Tries zur gleichzeitigen Speicherung von mehreren Zeichenketten. Seinen Namen verdankt er dem Akronym PATRICIA, das für Practical Algorithm to Retrieve Information Coded in Alphanumeric steht. Er wurde 1968 von Donald R. Morrison veröffentlicht.
Der Patricia-Trie zeichnet sich im Gegensatz zum normalen Trie dadurch aus, dass die Daten komprimiert abgespeichert werden. Dazu werden Zeichen, bei denen keine Verzweigung im Baum entsteht, einfach übersprungen und die Anzahl der ausgelassenen Knoten vor dem nächsten auftretenden Zeichen gespeichert. Somit wird gewährleistet, dass ein Suchbegriff eindeutig zugeordnet werden kann.
Die Größe von Patricia-Tries hängt somit nicht von der Länge der gespeicherten Schlüsselwerte ab und jeder neue Eintrag kann durch Erstellen von nur einem neuen Knoten und einer neuen Kante eingefügt werden. Somit wachsen sie langsam, auch wenn eine große Anzahl neuer Elemente eingefügt wird.
Patricia-Tries können dazu verwendet werden, assoziative Arrays mit Strings als Schlüsseln zu konstruieren. Hiermit wird Speicherplatz für die Schlüssel gespart.
Siehe auch
Weblinks
- Monash University: Algorithms and Data Structures Research & Reference Material: PATRICIA, von Lloyd Allison [en]
- Practical Algorithm to Retrieve Information Coded in Alphanumeric, Originalpapier im ACM Portal [en]
- NIST's Dictionary of Algorithms and Data Structures: Patricia Tree [en]
- Anwendung einer binären Verweiskettenmethode beim Aufbau von Listen. Elektronische Rechenanlagen 10 (1968), von Gernot Gwehenberger beschreibt eine unabhängig etwa zur selben Zeit entwickelte identische Suchmethode und Datenstruktur [de]