Hubs und Authorities

Als Hubs und Authorities lassen sich in der Netzwerktheorie herausragende Knoten anhand ihrer Verlinkung einteilen. Vereinfacht gesagt sind Hubs und Authorities dabei Knoten, die mit vielen anderen Knoten verbunden sind – beispielsweise bekannte Persönlichkeiten in sozialen Netzwerken und Linkverzeichnisse im World Wide Web.

Berechnung

Das Konzept der Hubs und Authorities liefert ähnlich wie der PageRank-Algorithmus ein Konzept zur automatischen Beurteilung von Webseiten anhand ihrer Verlinkung, mit dem sich ein Ranking-Verfahren angeben lässt. Es wurde 1999 von Jon Kleinberg vorgeschlagen und ist unter dem Namen hypertext-induced topic selection (HITS) bekannt.

Dabei wird jede Seite nach zwei Kategorien bewertet:

Hubs sind Seiten, die auf viele inhaltlich wertvolle Dokumente zeigen.
Authorities sind Seiten, deren Inhalt als besonders gut angesehen wird.

Der Algorithmus geht davon aus, dass gute Hubs Hyperlinks zu vielen Authorities haben und Authorities von vielen Hubs aus erreichbar sind.

Zur Bewertung wird jeder Seite $i$ aus einer Grundmenge von $i=1,\ldots ,n$ Seiten ein Hub-Gewicht $h_{i}$ und ein Authority-Gewicht $a_{i}$ zugeordnet. Die Grundmenge wird aus der Suchanfrage generiert. Dazu werden Seiten, die auf die Suchbegriffe zutreffen, um eine gewisse Anzahl an Seiten, die aus der Grundmenge verlinkt sind oder die auf die Grundmenge zeigen, erweitert. Danach werden die Gewichte wie folgt aktualisiert bis eine Konvergenz festzustellen ist:

h_{i}\leftarrow \delta \sum _{j=1}^{n}A_{ij}\,a_{j}

a_{i}\leftarrow \lambda \sum _{k=1}^{n}{A^{T}}\!_{ik}\,h_{k}

Dabei ist $A$ die Verlinkungsmatrix, in der $A_{ij}=1$ , falls die Seite $i$ einen Link auf die Seite $j$ besitzt, und $A_{ij}=0$ , falls dies nicht der Fall ist. $A^{T}$ ist die transponierte Matrix von $A$ , d. h. ${A^{T}}\!_{ij}=A_{ji}$ . Es gilt also:

Der Hub-Wert einer Seite $i$ ergibt sich aus der Summe aller Authority-Werte der Seiten, die von $i$ verlinkt sind.
Der Authority-Wert einer Seite $i$ ergibt sich aus der Summe aller Hub-Werte der Seiten, die auf $i$ verlinken.

Durch gegenseitiges Einsetzen der Definitionen erhält man die Abhängigkeiten:

h\leftarrow \delta \,\lambda \,AA^{T}\,h\,

a\leftarrow \delta \,\lambda \,A^{T}\!\!A\,a\,

Dabei konvergieren $h$ und $a$ gegen einen der Eigenvektoren zum größten Eigenwert von $AA^{T}$ bzw. $A^{T}A$ .

$\delta$ und $\lambda$ sind dabei meist Normierungen auf den Einheitskreis. Außerdem sind $AA^{T}$ bzw. $A^{T}A$ jeweils symmetrisch und positiv semidefinit. Daraus ergibt sich, dass beide Matrizen diagonalisierbar sind und damit eine Orthonormalbasis haben. Die wiederholte Multiplikation konvergiert damit gegen den größten Eigenvektor.

Siehe auch: Skalenfreies Netzwerk

Literatur

Jon Kleinberg: Authoritative sources in a hyperlinked environment. In: Journal of the ACM. 46, Nr. 5, 1999, S. 604–632. doi:10.1145/324133.324140.

Weblinks

Kleinbergs Hubs & Authorities bei drweb.de

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.