Gnutella2
Gnutella2 (kurz G2) ist ein dezentrales Peer-to-Peer-Netzwerkprotokoll das unter anderem zum Filesharing genutzt wird. Es wurde 2002 von Michael Stokes veröffentlicht und ist der Nachfolger von gnutella. Alles bis auf das alte Handshake des gnutella-Protokolls wurde neu entwickelt. Somit ist ein neues System entstanden, welches über andere Paketformate, einen anderen Suchalgorithmus und ein stark verbessertes Metadatensystem verfügt. Gnutella2 hat zwischen 250.000 und 300.000 Nutzer je nach Tageszeit[1] und ist vor allem durch seinen meistgenutzten Client Shareaza bekannt.
Geschichte
Im November 2002 gab Michael Stokes das Gnutella2-Protokoll im Gnutella Developers Forum[2] bekannt. Sofort darauf gab es einen langen Diskurs unter den Entwicklern. Einige vertraten die Meinung, dass das eigentliche Ziel von Gnutella2 sei, komplett mit dem alten gnutella-0.6-Protokoll zu brechen und somit viele der Dinge, die als Behelfslösung vorhanden waren, nun endlich zu überwinden. Andere hingegen vertraten die Meinung (hauptsächlich Angehörige der LimeWire- und BearShare-Lager), dass diese nur ein Publicity-Gag sei und versagten jegliche technische Unterstützung. Diese Gruppe weigert sich teilweise bis heute das Netzwerk Gnutella2 zu nennen und spricht nur von „Mike's Protocol“. Ein weiteres Argument, das diese Gruppe gegen das Protokoll vorbringt, ist, dass der Name (durch die angehängte 2) andeutet, das Protokoll sei eine Nachfolgeversion des älteren gnutella-Protokolls, was durch seine Andersartigkeit nicht stimme.
Seltsamerweise benutzt das Gnutella2-Protokoll die alte „GNUTELLA CONNECT/0.6“-Handshake-Kennung zum Verbindungsaufbau. Dies ist die Kennung, wie sie in der gnutella-0.6-Spezifikation dokumentiert ist. Auch hierüber existiert eine Meinungsverschiedenheit unter den Entwicklern. Während einige dies als Schritt sehen, um Rückwärtskompatibilität mit dem alten Protokoll zu halten, so dass gnutella-Clients das neue Protokoll schrittweise in ihren Code integrieren können, kritisieren andere aus dem GDF dies als Versuch, auf Kosten des gnutella-Netzwerkes einen neuen, völlig ohne Beziehung zum alten Netzwerk stehenden, Standard zu etablieren.
Nachdem die Entwickler auf ihren Standpunkt festgefahren waren, entstand ziemlich schnell ein Flamewar, hauptsächlich durch und um den führenden BearShare-Entwickler Vincent Falco, so dass die konträren Seiten noch weiter zementiert wurden.
Der Entwurf mit den Spezifikationen wurde am 26. März 2003 veröffentlicht, danach folgten noch ein paar genauere und konkretere Spezifikationen. Gnutella2 (G2) wird von den meisten „alten“ gnutella-Clients nicht unterstützt. Im Gegensatz dazu gibt es eine große Unterstützung der neuen Gnutella2-Clients für das alte Gnutella-Netzwerk. Viele Gnutella2-Fürsprecher behaupten, dass dies aus politischen Gründen so sei, gnutella(1)-Leute entgegnen dagegen, dass es technische Gründe dafür gebe.
Funktionsweise
Gnutella2 teilt die Nodes in zwei Gruppen ein. Blätter (engl. original leaves) und Hubs. Die Blätter halten nur ein oder zwei Verbindungen zu den Hubs aufrecht, während die Hubs Hunderte von Verbindungen zu den Blättern und anderen Hubs halten. Wenn nun eine Suchanfrage erfolgt, versucht – sofern noch nicht vorhanden – der Node zunächst einmal eine Liste von Hubs zu bekommen und kontaktiert dann die Hubs in dieser Liste. Dabei merkt er sich, welche Hubs schon besucht wurden. Dies wird solange fortgesetzt, bis die Liste abgearbeitet worden ist oder aber eine vordefinierte Suchschranke überschritten wurde. Somit wird sichergestellt, dass ein Benutzer eine weit verbreitete Datei einfach und ohne das Netz zu überlasten finden kann. Theoretisch wäre er sogar in der Lage eine einzelne (einmalige) Datei irgendwo im Netzwerk aufzuspüren.
Die Hubs führen einen Index und wissen so, welche Dateien jedes Blatt anbietet. Der Index, genannt Query Routing Table, ist eine Hashtabelle der Suchbegriffe. Diese Liste der Suchbegriffe lädt das Blatt zum Hub hoch, der Hub generiert daraus eine kombinierte Version mit allen Schlüsselwortlisten der Blätter, die er betreut. Diese kombinierte Liste sendet er nun zu seinen Nachbarhubs, um so die Anzahl der weitergeleiteten Suchanfragen zu reduzieren. Somit kann der Hub die benötigte Bandbreite reduzieren, da Suchanfragen nun nur noch an bestimmte Hubs oder Blätter weitergeleitet werden müssen.
Gnutella2 benutzt ausführlich das User Datagram Protocol (UDP), statt des Transmission Control Protocols (TCP), für seine Suchanfragenpakete. Der Datenoverhead, der durch TCP vorhanden wäre, würde ein Zufallsbewegungssuchsystem unmöglich machen, obwohl selbstverständlich auch UDP Nachteile hat, wie zum Beispiel, dass der Sender keine Informationen darüber erhält, dass der Empfänger seine Nachricht auch erhalten hat. Dies kann jedoch durch das Senden von Antwortpaketen umgangen werden.
Protokoll-Merkmale
Gnutella2 benutzt ein erweiterbares binär-XML-ähnliches Paketformat. Dieses ist als Antwort auf die vielen Behelfslösungen in gnutella gedacht und soll ermöglichen, dass zukünftige Verbesserungen des Netzwerkes oder Erweiterungen von einzelnen Clients hinzugefügt werden können, ohne dass dadurch Funktionsstörungen in den anderen oder alten Clients entstehen. Viele Entwickler behaupten, dass es somit einfacher wäre, ein Gnutella2-Client zu entwickeln, als einen gnutella-Client. Allerdings sehen andere Entwickler das Generic Gnutella Extension Protocol (GGEP) als schon vorhandene adäquate Lösung für das oben adressierte Problem an.
Gnutella2 setzt SHA1-Hashsummen zur Datei-Identifikation ein. Des Weiteren kommen auch Tiger-Tree-Hashes zum Einsatz, so dass damit eine einzelne Datei zuverlässig parallel von mehreren Quellen (Multi-source-downloading/swarming) heruntergeladen werden kann. Auch wird so das zuverlässige Hochladen von Dateiteilen während des Dateiladens ermöglicht.
Um darüber hinaus ein robustes, vollständiges Suchsystem anbieten zu können, werden in Gnutella2 Metadaten zur verbesserten Benennung und Bewertung des Inhaltes eingesetzt. Damit können vielfältigere Qualitätsinformationen in den Suchergebnissen aufgeführt werden, als dies durch den bloßen Dateinamen möglich wäre. Nodes können diese Informationen sogar weitergeben, wenn sie die bewertete Datei nicht mehr besitzen. Somit können die Benutzer Viren oder Würmer markieren und diese Information den anderen Benutzern zur Verfügung stellen, ohne eine Kopie dieser Viren oder Würmer auf dem Computer behalten müssten.
Zusätzlich nutzt Gnutella2 Datenkompression, um so die für die Verbindungen benötigte Bandbreite zu reduzieren.
Clients
Einige Gnutella2-Clients:
- Shareaza (Windows), Open Source C++ unter der GPL, meistgenutzter G2-Client mit etwa 93 % Marktanteil .
- Sharelin (Unix), Open Source C++ unter der GPL
- Morpheus (Windows), proprietär.
- Gnucleus (Windows), Open source Kern in C/C++ unter der LGPL.
- Adagio (plattformunabhängig), Open source Ada unter der GPL, Entwicklung Juli 2004 eingestellt
- FileScope (plattformunabhängig), Open source C# unter der GPL
- MLDonkey bis Version 2.8.7 (plattformunabhängig), Open source OCaml unter der GPL
Fußnoten und Referenzen
- Anzahl der Teilnehmer am G2-Netzwerk. Trillinux crawler (G2paranha). Abgerufen am 30. April 2009.
- Gnutella Developers Forum
Weblinks
- Gnutella2-Wiki (englisch)
- Gnutella2 Crawler (englisch)
- Shareaza Community Wiki