Git
Git [ɡɪt] ist eine freie Software zur verteilten Versionsverwaltung von Dateien, die durch Linus Torvalds initiiert wurde.
Git | |
---|---|
Basisdaten | |
Maintainer | Junio Hamano |
Entwickler | Junio C. Hamano, Shawn O. Pearce, Linus Torvalds u. v. a. |
Erscheinungsjahr | 2005 |
Aktuelle Version | 2.35.1[1] (29. Januar 2022) |
Betriebssystem | Linux, FreeBSD, macOS, Solaris u. a. unixoide; Windows; Haiku; … |
Programmiersprache | C[2], Unix-Shell, Perl, Tcl, Python, C++ |
Kategorie | Versionsverwaltung |
Lizenz | GNU General Public License, Version 2[3] |
deutschsprachig | ja |
git-scm.com |
Geschichte
Durch eine Lizenzänderung des bis dahin genutzten proprietären BitKeeper-Systems konnten die Linux-Kernel-Entwickler dieses nicht mehr kostenlos verwenden, und somit blieb vielen Entwicklern der Zugang verwehrt. Daher begann Linus Torvalds im April 2005 mit der Entwicklung einer neuen Quellcode-Management-Software und präsentierte bereits wenige Tage nach deren Ankündigung eine erste Version.
Torvalds wünschte sich ein verteiltes System, das wie BitKeeper genutzt werden kann und die folgenden Anforderungen erfüllt:
- Unterstützung verteilter, BitKeeper-ähnlicher Arbeitsabläufe
- Sehr hohe Sicherheit gegen sowohl unbeabsichtigte als auch böswillige Verfälschung
- Hohe Effizienz
Ein bereits existierendes Projekt namens Monotone entsprach den ersten beiden Anforderungen,[4] das dritte Kriterium wurde jedoch von keinem bestehenden System erfüllt.
Torvalds entschied sich dagegen, Monotone an seine Anforderungen anzupassen und begann stattdessen, ein eigenes System zu entwickeln. Einer der Hauptgründe für diesen Schritt war die Arbeitsweise, für die Monotone nach Torvalds Ansicht optimiert ist. Torvalds argumentierte, dass einzelne Revisionen von einem anderen Entwickler in den eigenen Entwicklungszweig zu importieren zu Rosinenpickerei und unordentlichen Repositorien führen würde. Wenn hingegen immer ganze Zweige importiert werden, wären Entwickler gezwungen aufzuräumen. Dazu seien Wegwerf-Zweige notwendig.
“This is my only real conceptual gripe with ‘monotone’. I like the model, but they make it much harder than it should be to have throw-away trees due to the fact that they seem to be working on the assumption of ‘one database per developer’ rather than ‘one database per tree’. You don’t have to follow that model, but it seems to be what the setup is geared for, and together with their ‘branches’ it means that I think a monotone database easily gets very cruddy. The other problem with monotone is just performance right now, but that’s hopefully not too fundamental.”
„Ich habe nur ein wirkliches konzeptionelles Problem mit ‚monotone‘: Ich mag die Arbeitsweise, aber sie erschwert die Nutzung von Wegwerf-Bäumen, weil das Konzept anscheinend auf der Annahme ‚eine Datenbank je Entwickler‘ statt ‚eine Datenbank je Baum‘ basiert. Man braucht zwar nicht diesem Modell zu folgen, aber die System-Einrichtung scheint darauf ausgerichtet zu sein. Zusammen mit ihren ‚Zweigen‘ befürchte ich ein schnelles Verdrecken der monotone-Datenbank. Ein anderes, hoffentlich nicht zu grundlegendes Problem, ist die derzeitige Leistungsfähigkeit von monotone.“
Gits Gestaltung verwendet einige Ideen aus Monotone sowie BitKeeper, aber keinen Quellcode daraus. Es soll ausdrücklich ein eigenständiges Versionsverwaltungssystem sein.
Derzeitiger Maintainer von Git ist Junio Hamano.[5]
Name
Der Name „Git“ bedeutet in der britischen Umgangssprache so viel wie „Blödmann“. Linus Torvalds erklärte seine Wahl des ungewöhnlichen Namens mit einem Witz sowie damit, dass das Wort praktikabel und in der Softwarewelt noch weitgehend unbenutzt war:
“I’m an egotistical bastard, and I name all my projects after myself. First ‘Linux’, now ‘Git’.”
„Ich bin ein egoistischer Mistkerl, und ich benenne all meine Projekte nach mir. Zuerst ‚Linux‘, jetzt eben ‚Git‘.“
“The joke ‘I name all my projects for myself, first Linux, then git’ was just too good to pass up. But it is also short, easy-to-say, and type on a standard keyboard. And reasonably unique and not any standard command, which is unusual.”
„Der Witz ‚Ich benenne alle meine Projekte nach mir, zuerst Linux, nun eben Git‘ war einfach zu gut, um ihn nicht zu machen. Aber es (der Befehl) ist auch kurz, einfach auszusprechen und auf einer Standardtastatur zu schreiben, dazu einigermaßen einzigartig und kein gewöhnliches Standardkommando – was ungewöhnlich ist.“
Der Name Linux wurde anfangs nicht von Torvalds selbst propagiert und nur widerwillig akzeptiert.[8]
Eigenschaften
Git ist ein verteiltes Versionsverwaltungssystem, das sich in einigen Eigenschaften von typischen Versionsverwaltungssystemen unterscheidet:
Nicht-lineare Entwicklung
Sowohl das Erstellen neuer Entwicklungszweige (branching) als auch das Verschmelzen zweier oder mehrerer Zweige (merging) sind integrale Bestandteile der Arbeit mit Git und fest in die Git-Werkzeuge eingebaut.[9] Git enthält Programme, mit deren Hilfe sich die nicht-lineare Geschichte eines Projektes einfach visualisieren lässt und mit deren Hilfe man in dieser Geschichte navigieren kann. Verzweigungen („branches“) in Git sind (im Gegensatz zu anderen SCMs) sehr effektiv implementiert: Ein Branch stellt nur eine Reference, kurz ref, eine Textdatei mit einer Commit-ID, dar, die in einem Repository im Verzeichnis .git/refs/heads
(z. B. .git/refs/heads/master
für den master-Branch) liegt und auf einen bestimmten Commit verweist. Über dessen Parental Commits, also Eltern-Commits, lässt sich die Branch-Struktur rekonstruieren. Durch diese Eigenschaften lassen sich weiterhin sehr große und effiziente Entwicklungsstrukturen wie bei Git selbst oder dem Linux-Kernel realisieren, bei denen jedes Feature und jeder Entwickler einen Branch oder ein eigenes Repository haben, aus dem der Projektverantwortliche („maintainer“) dann Commits über Merge oder Cherry-pick (Nutzen einzelner Commits) in den Hauptzweig des Projekts (master) übernehmen kann.
Kein zentraler Server
Jeder Benutzer besitzt eine lokale Kopie des gesamten Repositorys, inklusive der Versionsgeschichte (history). So können die meisten Aktionen lokal und ohne Netzwerkzugriff ausgeführt werden. Es wird nicht zwischen lokalen Entwicklungszweigen und Entwicklungszweigen entfernter Repositories unterschieden. Obwohl es keinen technischen Unterschied zwischen verschiedenen Repositories gibt (außer dem zwischen normalen und bare-Repositories auf Servern, bei denen kein Working-Tree, also die echten Dateien existiert), gilt die Kopie, auf die von einer Projekt-Homepage aus verwiesen wird, häufig als das offizielle Repository, in das die Revisionen der Entwickler übertragen werden. Es existieren spezielle Remote-tracking branches. Das sind Referenzen (siehe Nicht-lineare Entwicklung), die auf den Stand eines anderen Repositorys zeigen.
Datentransfer zwischen Repositorien
Daten können neben dem Übertragen auf Dateisystemebene (file://
) mit unterschiedlichen Netzwerkprotokollen zwischen Repositories übertragen werden. Git hat ein eigenes, sehr effizientes Protokoll, das den TCP-Port 9418 nutzt (git://
), welcher allerdings nur zum Fetchen und Clonen genutzt werden kann, also dem Lesen eines Repositorys. Ebenso kann der Transfer über SSH (ssh://
, das gängigste Protokoll für Schreiboperationen), HTTP (http://
), HTTPS (https://
) oder über (weniger effizient) FTP (ftp://
) oder rsync (rsync://
) erfolgen.[10] Die Übertragung in das offizielle Repository eines Projekts erfolgt häufig in Form von Patches, die via E-Mail an den Entwickler oder eine Entwicklungs-Mailing-Liste geschickt werden. Alternativ kann auch ein Review-System wie Gerrit verwendet werden.[11] Für Projekte, die auf Websites wie GitHub oder Bitbucket gespeichert ("hosting") werden, kann eine Änderung einfach durch das Pushen eines Branches vorgeschlagen werden, der dann bei Bedarf durch ein Merge in das Projekt integriert wird.
Kryptographische Sicherheit der Projektgeschichte
Die Geschichte eines Projektes wird so gespeichert, dass der Hash-Wert einer beliebigen Revision (commit) auf der vollständigen Geschichte basiert, die zu dieser Revision geführt hat. Dadurch ist es nicht möglich, die Versionsgeschichte nachträglich zu manipulieren, ohne dass sich der Hash-Wert der Revision ändert. In der Kryptographie nennt man dies einen Hash-Baum. Einzelne Revisionen können zusätzlich markiert (tagging) und optional mit GPG digital signiert werden (signed tag), beispielsweise um den Zustand zum Zeitpunkt der Veröffentlichung einer neuen Version der Software zu kennzeichnen.
Speichersystem und Dateiversionierung
Es gibt Versionsverwaltungssysteme (beispielsweise CVS), die für jede Datei (und jedes Verzeichnis) eigene, von allen anderen Dateien unabhängige Revisionsnummern verwalten. Für eine Datei wird nur dann eine neue Nummer erzeugt, wenn die jeweilige Datei Teil einer Commit-Operation ist. Im Gegensatz dazu weist Git bei jedem Commit allen im Repository verwalteten Dateien (und Verzeichnissen) eine neue, für alle Dateien gleiche Revisionsnummer zu. Das Abspeichern selbst erfolgt, indem im Commit-Objekt ein Verweis auf die Projektwurzel als tree-Objekt gespeichert wird, das wiederum Verweise auf blobs (binary large objects, die reinen Inhalte der Dateien ohne Identifizierung) und weitere trees (Verzeichnisse) enthält. Ein tree-Objekt verweist (wie ein Verzeichnis-Inode) mit seinen Einträgen auf SHA1-Prüfsummen, die weitere trees und blobs identifizieren, ähnlich Inode-Nummern in Dateisystemen. Wenn eine Datei in einem Commit nicht geändert wird, ändert sich auch die Checksumme nicht, und sie braucht nicht nochmals gespeichert zu werden. Die Objekte liegen im Projekt unter .git/objects
. Über Git-„Bordmittel“ lässt sich jeder beliebige Commit über den zugeordneten Hash-Wert (die Prüfsumme) eindeutig identifizieren, separat auslesen, verschmelzen oder gar als Abzweigungspunkt nutzen – vergleichbar mit den Revisionsnummern in anderen Systemen.
Säubern des Repositorys
Die Daten gelöschter und zurückgenommener Aktionen und Entwicklungszweige bleiben vorhanden (und können wiederhergestellt werden), bis sie explizit gelöscht werden.
Interoperabilität
Es gibt Hilfsprogramme, die Interoperabilität zwischen Git und anderen Versionskontrollsystemen herstellen. Solche Hilfsprogramme existieren unter anderem für GNU arch (git-archimport), CVS (git-cvsexportcommit, git-cvsimport und git-cvsserver), Darcs (darcs-fastconvert, darcs2git und andere), Quilt (git-quiltimport) und Subversion (git-svn).
Web-Interface
Mit Gitweb gibt es eine in Perl geschriebene Weboberfläche. Der Team Foundation Server von Microsoft hat eine Git-Anbindung (Git-tf).
Verbreitung
Laut Open Hub verwendeten im April 2019 rund 69 % aller dort registrierten Softwareprojekte Git.[12] Damit dominiert Git mit großem Abstand zu dem nächstplatzierten Subversion, das 25 % erreicht.
Verwendung
Die aktuelle Version wird produktiv für die Entwicklung vieler Projekte, sowohl kommerziell als auch im Open-Source-Bereich, oft auf Plattformen wie GitHub, GitLab[13] oder BitBucket eingesetzt. So wird Git zur Versionsverwaltung des Linux-Kernels oder nach der Umstellung Microsofts auf Git 2017 von Microsoft Windows verwendet.[14]
Verwaltung von Inhalt
Obwohl Git primär zur Versionsverwaltung von Quellcode entwickelt wurde, wird es auch zum Speichern von flach strukturierten (im Gegensatz zu relationalen Strukturen) Datensätzen direkt als Datei genutzt. So können Funktionen wie Versionsverwaltung, Hook, diff, Replikation und Offline-Nutzung auch für Inhalte ohne Datenbank genutzt werden.[15] Die Nutzung ist ähnlich zu NoSQL, auch wenn Git keine Indexstruktur, Abfrage oder Gleichzeitigkeit erlaubt.
Der Einsatz erstreckt sich auch auf inhaltlich einfach strukturierte Systeme wie CMS[15] oder Wikis.[16][17]
Unterstützte Betriebssysteme
Unix/Linux
Git läuft auf fast allen modernen unixartigen Systemen wie Linux, Solaris, macOS, FreeBSD, DragonFly BSD, NetBSD, OpenBSD, AIX, IRIX.
Apple liefert macOS mit einer leicht abgewandelten Git-Version aus. Hauptsächlich wird diese verwendet, um die Kompatibilität mit Apples Entwicklungsumgebung Xcode zu erhöhen.[18]
Windows
Es gibt mehrere Portierungen von Git für Microsoft Windows:
- Git for Windows,[19] die Portierung des Git-Projektes (früher entwickelt unter dem Namen msysGit[20]). Kann durch das Modul posh-git auch via PowerShell genutzt werden.[21]
- Die Cygwin-Umgebung enthält Git.
TortoiseGit ist eine Erweiterung für den Windows-Explorer (Windows Shell Extension), so dass man Git unter Windows auch ohne Kommandozeile verwenden kann. TortoiseGit benötigt zusätzlich eine Git-Installation, normalerweise Git for Windows.[22]
GUIs
Literatur
- Valentin Haenel, Julius Plenz: Git – Verteilte Versionsverwaltung für Code und Dokumente. Open Source Press, München 2011, ISBN 3-941841-42-4 (Online-Version).
- Sven Riedel: Git – kurz & gut. O’Reilly Verlag, Köln 2009, ISBN 3-89721-914-X.
- Jon Loeliger, Matthew McCullough: Version Control with Git. 2. Auflage. O’Reilly Media, Sebastopol 2012, ISBN 978-1-4493-1638-9 (eBook).
- Scott Chacon: Pro Git. APress, New York 2009, ISBN 1-4302-1833-9.
Weblinks
- Git Homepage – offizielle Webpräsenz von Git
- Git documentation – Git-Dokumentation auf der Git-Website (englisch)
- Pro Git – deutsche Übersetzung des Buches Pro Git auf der Git-Website
- Git for Windows (englisch)
- Git: a brief introduction auf YouTube mit Randal L. Schwartz, seit 2005 ein Wegbereiter von Git, am 12. Oktober 2007 (englisch)
- Linus Torvalds on Git – Linus Torvalds über Git bei einem Google Tech Talk, 3. Mai 2007 auf YouTube (englisch)
Einzelnachweise
- Git v2.35.1 Release Notes. 29. Januar 2022 (abgerufen am 9. Februar 2022).
- The git Open Source Project on Open Hub: Languages Page. In: Open Hub. (abgerufen am 14. Juli 2018).
- Copying. (englisch, abgerufen am 5. August 2018).
- Linus Torvalds: Kernel SCM saga.. In: Linux-Kernel Archive. 6. April 2005, abgerufen am 5. August 2018 (englisch).
- Alexander Neumann: Vor 10 Jahren: Linus Torvalds baut Git. In: Heise online. 8. April 2015, abgerufen am 5. August 2018.
- Git FAQ: Why the 'Git' name? 9. März 2013, abgerufen am 5. August 2018 (englisch).
- Robert McMillan: Lord of the Files: How GitHub Tamed Free Software (And More). In: Wired. 21. Februar 2012, abgerufen am 6. August 2018 (englisch).
- Siehe dazu Geschichte von Linux #Der Name Linux
- Chapter 1. Repositories and Branches. In: Git User’s Manual. Abgerufen am 5. August 2018 (englisch).
- Exporting a git repository via http. In: Git User’s Manual. Abgerufen am 5. August 2018 (englisch).
- Submitting patches to a project. In: Git User’s Manual. Abgerufen am 5. August 2018 (englisch).
- Compare Repositories – Open Hub. Open Hub, abgerufen am 26. April 2019 (englisch).
- GitLab Documentation. Abgerufen am 5. August 2018 (englisch).
- Rainald Menge-Sonnentag: Microsoft nutzt ab sofort Git zur Windows-Entwicklung. Heise online, 23. August 2017, abgerufen am 5. August 2018.
- Brandon Keepers: Git: the NoSQL Database. 21. April 2012, abgerufen am 5. August 2018 (englisch).
- Adam Feber: How we Moved 2.3 Million Wiki Pages to Git. (Nicht mehr online verfügbar.) 4. Februar 2014, archiviert vom Original am 10. August 2016; abgerufen am 3. Februar 2019 (englisch).
- gollum – A git-based Wiki. Abgerufen am 5. August 2018 (englisch).
- Are there any differences with the git provided by Apple and the official git? Abgerufen am 18. April 2019 (englisch).
- Alexander Neumann: Git for Windows verlässt Preview-Status. Heise online, 19. August 2015, abgerufen am 5. August 2018.
- Relationship to Git for Windows. Abgerufen am 5. August 2018 (englisch).
- Git - Git in PowerShell. Abgerufen am 18. Juli 2020.
- Frequently asked questions (FAQ). What are the system prerequisites of TortoiseGit? In: tortoisegit.org. Abgerufen am 26. April 2019 (englisch).