<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="de">
	<id>https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=Google_File_System</id>
	<title>Google File System - Versionsgeschichte</title>
	<link rel="self" type="application/atom+xml" href="https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=Google_File_System"/>
	<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=Google_File_System&amp;action=history"/>
	<updated>2026-05-18T10:27:31Z</updated>
	<subtitle>Versionsgeschichte dieser Seite in Wikipedia (Deutsch) – Lokale Kopie</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://wiki-de.moshellshocker.dns64.de/index.php?title=Google_File_System&amp;diff=684382&amp;oldid=prev</id>
		<title>imported&gt;Meinichselbst: Parameter fix</title>
		<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=Google_File_System&amp;diff=684382&amp;oldid=prev"/>
		<updated>2025-06-08T16:39:51Z</updated>

		<summary type="html">&lt;p&gt;Parameter fix&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Neue Seite&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Das &amp;#039;&amp;#039;&amp;#039;Google File System&amp;#039;&amp;#039;&amp;#039; (&amp;#039;&amp;#039;&amp;#039;GFS&amp;#039;&amp;#039;&amp;#039; oder &amp;#039;&amp;#039;&amp;#039;GoogleFS&amp;#039;&amp;#039;&amp;#039;) ist ein proprietäres [[verteiltes Dateisystem]] für Linux-basierte Systeme, das Google intern entwickelte, um große Datenmengen vor allem aus dem Index der [[Google Suche|Google-Suche]] und später auch aus [[Gmail]] zu speichern und zu verarbeiten.&amp;lt;ref name=&amp;quot;google-fs-paper-2003&amp;quot; /&amp;gt;&amp;lt;ref name=&amp;quot;google-fs-2-2009&amp;quot; /&amp;gt; Das Google File System kennt zwei Arten von Komponenten: die Master- und die Chunkserver. Erstere halten lediglich Metainformationen über Dateien, während letztere die tatsächlichen Daten auf einem klassischen [[Linux]]-[[Dateisystem]] persistieren. Das Google File System unterteilt die Dateien dafür in [[Datenblock|Chunks]], so dass eine Datei auf mehrere Server aufgeteilt werden kann. In der ersten Version war jeder Chunk 64 Megabyte groß, während die Größe später auf 1&amp;amp;nbsp;MB aktualisiert wurde (Stand 2009).&amp;lt;ref name=&amp;quot;google-fs-2-2009&amp;quot; /&amp;gt; Das Google File System arbeitet eine Abstraktionsebene höher als typische Dateisysteme und kümmert sich lediglich um die Verteilung, unter Gewährleistung von [[Verfügbarkeit]] und [[Konsistenz (Datenspeicherung)|Konsistenz]] der Daten.&amp;lt;ref name=&amp;quot;google-fs-paper-2003&amp;quot; /&amp;gt; Es ist für einen hohen Datendurchsatz optimiert und kann hunderte von Terabytes verteilt auf tausende Festplatten auf tausenden Maschinen verwalten.&amp;lt;ref name=&amp;quot;google-fs-2-2009&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Aufbau ==&lt;br /&gt;
Das Google File System ist an die notwendigen Anforderungen der &amp;#039;&amp;#039;Websuche&amp;#039;&amp;#039; angepasst, die eine enorme Menge an zu speichernden Daten generiert. GFS entstand aus einem früheren Versuch Googles, welcher den Namen „BigFiles“ trägt und von [[Larry Page]] sowie [[Sergey Brin]] während ihrer Forschungstätigkeit an der [[Stanford University]] entwickelt wurde.&lt;br /&gt;
&lt;br /&gt;
Die Daten werden durchgehend in sehr großen, teilweise sogar mehrere [[Speicherkapazität|Gigabyte]] großen Dateien gespeichert, welche nur in extrem seltenen Fällen gelöscht, überschrieben oder [[Datenkompression|komprimiert]] werden; Daten werden üblicherweise angehängt oder ausgelesen. Das [[Dateisystem]] ist auch entworfen und optimiert worden, um auf Googles rechnenden [[Rechnerverbund|Clustern]] laufen zu können, deren [[Netzwerkelement|Netzknoten]] aus handelsüblichen PCs bestehen. Dies bedeutet allerdings auch, dass man die hohe Ausfallrate und den damit verbundenen Datenverlust individueller Netzknoten als Normalzustand ansehen muss. Das äußert sich auch darin, dass kein Unterschied zwischen normaler (Herunterfahren) und abnormaler Beendigung (Absturz) gemacht wird: Serverprozesse werden standardmäßig per [[Kill (Unix)|Killbefehl]] beendet. Andere Designentscheidungen setzen auf hohe Datendurchsatzraten, auch wenn dies auf Kosten der [[Verzögerung (Telekommunikation)|Latenzzeit]] geht.&lt;br /&gt;
&lt;br /&gt;
Ein &amp;#039;&amp;#039;GFS Cluster&amp;#039;&amp;#039; besteht aus einem &amp;#039;&amp;#039;Master&amp;#039;&amp;#039; und hunderten oder tausenden &amp;#039;&amp;#039;Chunkservern&amp;#039;&amp;#039;. Die Chunkserver speichern die Dateien, wobei jede Datei in 64&amp;amp;nbsp;MB große Stücke &amp;#039;&amp;#039;(„Chunks“)&amp;#039;&amp;#039; gespalten ist, ähnlich [[Cluster (Datenträger)|Clustern]] oder [[Datenblock|Sektoren]] in gebräuchlichen Dateisystemen.&lt;br /&gt;
&lt;br /&gt;
Um Datenverlust zu verhindern, wird jede Datei beim GFS standardmäßig mindestens dreimal pro Cluster gespeichert. Bei Ausfall eines Chunkservers treten nur verschwindend geringe Verzögerungen auf, bis die Datei wieder ihre Standardanzahl an Replikas besitzt. Je nach Bedarf kann die Anzahl auch höher liegen, etwa bei [[Ausführbare Datei|ausführbaren Dateien]]. Jedem Chunk wird eine eindeutige, 64 Bit lange Kennzeichnung zugewiesen, logische Mappings der Dateien zu den einzelnen Chunks werden beibehalten.&lt;br /&gt;
&lt;br /&gt;
Der Master speichert keine Chunks, sondern vielmehr deren [[Metadaten]], wie etwa [[Dateiname]]n, Dateigrößen, ihren Speicherort sowie den ihrer Kopien, welche [[Prozess (Informatik)|Prozesse]] gerade auf welchen Chunk zugreifen etc. Die Master erhalten jegliche Anfragen für eine Datei und liefern als Antwort die dazugehörigen Chunkserver und erteilen entsprechende Sperren an den Prozess. Ein Client darf allerdings für gewisse Zeit die Adresse der Chunkserver [[cache]]n. Fällt die Anzahl an verfügbaren Replikas unter die Normzahl, sind es auch die Master, die die Erstellung einer neuen Chunkkopie anstoßen. Die Metadaten werden aktuell gehalten, indem die Master regelmäßig Aktualisierungsanfragen an die Chunkserver senden („[[Heartbeat (Informatik)|heart-beat]] messages“, auf Deutsch etwa: „Herzschlag-Nachrichten“).&lt;br /&gt;
&lt;br /&gt;
Design und Implementierung des GFS sehen nur einen Master pro Cluster vor. Dies hat den Anschein, ein Fehler im System zu sein, der dessen [[Skalierbarkeit]] und Zuverlässigkeit begrenzt, da die maximale Größe und [[Uptime]] von der Leistungsfähigkeit und Uptime des Masters abhängt, da dieser die Metadaten katalogisiert und fast alle Anfragen durch ihn laufen; Googles Techniker haben allerdings durch Messungen gezeigt, dass dies (zumindest bis jetzt) nicht der Fall und GFS sehr wohl skalierbar ist. Der Master ist im Normalfall der leistungsfähigste Netzknoten im Netzwerk. Um die [[Ausfallsicherheit]] sicherzustellen, gibt es mehrere „Schatten-Master“, die den Hauptrechner spiegeln und notfalls, sollte der Master einmal ausfallen, sofort einspringen. Zusätzlich stehen die Schattenmaster auch für reine Leseanfragen, die ja den Haupttraffic ausmachen, zur Verfügung, so dass sich die Skalierbarkeit dadurch weiter erhöht. Engstellen gibt es nur selten, da [[Client]]s nur nach Metadaten fragen, die komplett im [[Arbeitsspeicher]] als [[B-Baum]] vorgehalten werden – sie sind sehr kompakt, pro Megabyte Daten fallen lediglich einige Bytes an. Durch den Einsatz nur eines Hauptknotens verringert sich die Software[[Komplexität (Informatik)|komplexität]] drastisch, da Schreiboperationen nicht koordiniert werden müssen.&lt;br /&gt;
&lt;br /&gt;
== Literatur ==&lt;br /&gt;
* Matthew Helmke: &amp;#039;&amp;#039;Ubuntu Unleashed 2015 Edition&amp;#039;&amp;#039;. Pearson Education Inc, 2015, ISBN 978-0-672-33837-3.&lt;br /&gt;
* Kuan-Ching Li, Qing Li, Timothy K. Shih (Hrsg.): &amp;#039;&amp;#039;Cloud Computing and Digital Media&amp;#039;&amp;#039;. Taylor &amp;amp; Francis Group, Boca Raton 2014, ISBN 978-1-4665-6917-1.&lt;br /&gt;
* Kenli Li, Zheng Xiao, Yan Wang, Jiayi Du, Keqin Li (Hrsg.): &amp;#039;&amp;#039;Parallel Computational Fluid Dynamics&amp;#039;&amp;#039;. Springer Verlag, Berlin / Heidelberg 2014, ISBN 978-3-642-53961-9.&lt;br /&gt;
* Yunquan Zhang, Kenli Li, Zheng Xiao (Hrsg.): &amp;#039;&amp;#039;High Performance Computing&amp;#039;&amp;#039;. Springer Verlag, Berlin / Heidelberg 2012, ISBN 978-3-642-41590-6.&lt;br /&gt;
&lt;br /&gt;
== Siehe auch ==&lt;br /&gt;
* [[Amazon Dynamo]]&lt;br /&gt;
&lt;br /&gt;
== Einzelnachweise ==&lt;br /&gt;
&amp;lt;references responsive&amp;gt;&lt;br /&gt;
&amp;lt;ref name=&amp;quot;google-fs-paper-2003&amp;quot;&amp;gt;{{Cite book |doi=10.1145/945445.945450 |chapter=The Google file system |title=Proceedings of the nineteenth ACM Symposium on Operating Systems Principles – SOSP &amp;#039;03 |pages=29 |year=2003 |author=S. Ghemawat, H. Gobioff, S. T. Leung &amp;lt;!--|citeseerx=10.1.1.125.789--&amp;gt; |isbn=1-58113-757-5 &amp;lt;!--|s2cid=221261373--&amp;gt; |url=http://static.googleusercontent.com/media/research.google.com/en//archive/gfs-sosp2003.pdf |language=en}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&amp;lt;ref name=&amp;quot;google-fs-2-2009&amp;quot;&amp;gt;{{Internetquelle |titel=GFS: Evolution on Fast-forward |url=https://queue.acm.org/detail.cfm?id=1594206 |sprache=en |abruf=2021-02-24}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&amp;lt;/references&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Weblinks ==&lt;br /&gt;
* [http://users.ece.gatech.edu/~dblough/6102/presentations/gfs-sosp2003.pdf Originalpaper zum Google File System] (PDF; 276&amp;amp;nbsp;kB)&lt;br /&gt;
* [https://www.quora.com/What-is-a-Google-File-System What is a Google File System?] (abgerufen am 31. Juli 2017)&lt;br /&gt;
* [http://www.uio.no/studier/emner/matnat/ifi/INF5100/h10/undervisningsmateriale/gfs.pdf GOOGLE FILE SYSTEM (GFS)] (abgerufen am 31. Juli 2017)&lt;br /&gt;
* [https://cs.stanford.edu/~matei/courses/2015/6.S897/slides/gfs.pdf The Google File System] (abgerufen am 31. Juli 2017)&lt;br /&gt;
* [http://www.cs.cornell.edu/courses/cs6464/2009sp/lectures/15-gfs.pdf GFS: The Google File System] (abgerufen am 31. Juli 2017)&lt;br /&gt;
&lt;br /&gt;
[[Kategorie:Google|File System]]&lt;br /&gt;
[[Kategorie:Verteiltes Dateisystem]]&lt;br /&gt;
[[Kategorie:Netzwerkarchitektur]]&lt;br /&gt;
[[Kategorie:Linux-Software]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Meinichselbst</name></author>
	</entry>
</feed>