TrustRank
Der TrustRank-Algorithmus ist ein Verfahren zur Bewertung der Qualität von Webseiten[1]. Es wurde von Zoltán Gyöngyi, Héctor García-Molina und Jan Pedersen entwickelt und von Yahoo zum Patent angemeldet.[2] Er dient zur halbautomatischen Klassifizierung der Qualität einer Seite bzw. zum Auffinden von Spam-Seiten und soll Suchmaschinen bei der Bewertung von Webseiten helfen.
Der Algorithmus
Der Ansatz des Trustrank-Verfahrens ist, dass Webseiten, die von vertrauenswürdigen Seiten (trust für engl. Vertrauen) verlinkt werden, selbst vertrauenswürdig sind, während Spam-Seiten selten oder nie von vertrauenswürdigen Seiten verlinkt werden.
Beim TrustRank-Algorithmus wird eine kleine Anzahl von vertrauenswürdigen Seiten manuell ausgewählt. Diese können dann, ähnlich wie beim PageRank-Verfahren, Vertrauen auf verlinkte Webseiten weitervererben. Die Vertrauenswürdigkeit einer Seite nimmt ab, je weiter sie von den Quellen entfernt liegt. Die Berechnung des TrustRank erfolgt, nach manueller Festlegung der Quellen, automatisch anhand der Linkstruktur, d. h. den Links auf den Webseiten.
Andere Verwendungen des Begriffs
Der Begriff TrustRank wird nicht nur für den Algorithmus von Gyöngyi, García-Molina und Pedersen verwandt, sondern auch für eine Reihe anderer Verfahren.[3] So trägt auch ein Antiphishing-Filter von Google diesen Namen[4].
Siehe auch
Quellenangaben
- Zoltán Gyöngyi, Héctor García-Molina, Jan Pedersen, "Combating Web Spam with TrustRank", Proceedings of the International Conference on Very Large Data Bases 30:576, 2004. (online,PDF,englisch; 324 kB)
- Patentanmeldung EP1817697A2: Linkbasierte Spam-Erkennung. Angemeldet am 26. Oktober 2005, veröffentlicht am 15. August 2007, Anmelder: Yahoo Inc, Erfinder: Pavel Berkhin et al.
- Google TrustRank Myth Busted! - Reuben Yau (Memento vom 6. Juni 2016)
- Vijay Krishnan, Rashmi Raj: Web Spam Detection with Anti-Trust Rank. In: PDF. Computer Science DepartmentStanford University, abgerufen am 23. Mai 2019.