PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : DC - Distributed Computing



Zahmekoses
02.01.2004, 12:13
Was ist Distributed Computing?

Das Problem

Computer werden in der Wissenschaft heutzutage immer häufiger eingesetzt, um den Menschen bei Forschungen zu unterstützen. In manchen Bereichen (zum Beispiel in der Klimaforschung oder bei Gen-Analysen) wird dazu für Simulationen und andere langwierige Berechnungen sehr viel Rechenkraft benötigt.
Die "übliche" Lösung für dieses Problem sind sogenannte Supercomputer. Diese sind recht groß und bestehen meist aus sehr vielen Prozessoren, die mittels komplizierter Elektronik verbunden sind, um gemeinsam an diesem Problem arbeiten zu können. Allerdings kosten solche Supercomputer einige Millionen Euro, was ihre Anschaffung nur für finanzkräftige Institutionen erschwinglich macht. Forschungsprojekte ohne große Subventionen können da leider nicht mithalten.

Die Idee

Warum soll nur ein einziger, noch dazu recht teurer Computer an dem Problem arbeiten? Es ist doch viel geschickter, das Problem in kleine Happen aufzuteilen und diese Teilprobleme auf mehreren Computern zu berechnen. Dann brauchen diese Computer auch nicht eine solch enorme Leistungsfähigkeit zu haben.

Dein Einsatz

Und genau das ist die Stelle, an der Du in's Spiel kommst. Auch wenn sich durch die Aufteilung des Problems ganz normale PCs nutzen lassen, so ist es den meisten Forschungseinrichtungen doch nicht möglich, sich mehrere hundert oder gar Tausende von PCs anzuschaffen. Andererseits hat dein Computer bestimmt noch Rechenkapazität übrig. Denn wenn du Briefe damit schreibst, der Bildschirmschoner läuft oder du in der Mittagspause bist, dann nutzt dein Computer nur einen verschwindend geringen Teil seiner maximalen Leistungsfähigkeit aus. Ist es nicht eine super Idee, die ungenutzte Kapazität zur Lösung wissenschaftlicher Probleme zur Verfügung zu stellen?

Die Technik

Mit der weiten Verbreitung des Internets sind seit einiger Zeit auch die technischen Grundlagen vorhanden, um solche Projekte durchzuführen. Dazu stellt ein Forschungsteam einen Server im Internet bereit, von dem man sich ein kleines Programm (den sogenannten Client) auf den eigenen Computer herunterladen kann. Wenn dieses Programm dann auf dem eigenen Computer aktiviert wird, verbindet es sich mit dem Server im Internet und lädt von dort ein Datenpaket (auch Work Unit genannt) mit Arbeitsanweisungen. Dabei handelt es sich nur um ein klitzekleines Teilproblem der ursprünglichen Aufgabe. An diesem Teilproblem arbeitet das Programm dann eine ganze Weile (meist mehrere Stunden oder Tage) und schickt die Ergebnisse danach wieder zurück und fordert neue Daten an.
Das Programm benutzt dabei auch nur die ungenutzten Ressourcen des Computers, d.h. wenn man selbst gleichzeitig mit anderen Programmen arbeitet, dann verspürt man keine zeitlichen Verzögerungen durch das Forschungsprogramm. Manche der Programme sind auch so geschrieben, daß sie als Bildschirmschoner laufen und nur dann aktiv werden, wenn sowieso niemand am Computer arbeitet.

Beispielprojekte

Seventeen or Bust (17oB) versucht zum Beispiel eine noch kleinere Sierpinski-Zahl zu finden (es sind jetzt nur noch 11 mögliche Kandidaten übrig).
Great Internet Mersenne Prime Search (GIMPS) sucht nach weiteren Primzahlen.
Drug Design Optimization Lab (D2OL) versucht Medikamente zu optimieren.
Distributed Folding (DF) versucht einen Algorithmus zu finden, mit dem man die Proteinfaltungssequenz perfekt simulieren kann.
Chessbrain entwickelt einen noch besseren Schachcomputer.
Cancer Research (THINK) versucht ein Heilmittel für Krebs zu finden.
CommunityTSC versucht ein Heilmittel für Tuberöse Sklerose zu finden.
RC5-72 versucht eine Nachricht zu entschlüssen, welche mit 72 Bit verschlüsselt wurde. (um somit zu beweisen, dass unsere heutige Sicherheitstechnik nicht gut genug ist.)
SETI@home wertet Daten vom größten Radioteleskop der Welt (Arecibo) aus auf der Suche nach außerirdischen Signalen (^^")

Für mehr Infos unter www.rechenkraft.net. Dort findet ihr eine Liste aller Projekte und eine breit gefächerte Community steht bereit um zu allen möglichen Fragen so gut es geht eine Antwort zu geben.
Schaut einfach mal vorbei. :)

ciao
Zahme

Masterfly
10.01.2004, 16:35
Die Frage wäre, wie sieht es mit der Sicherheit aus ?

Zahmekoses
10.01.2004, 17:39
Die Frage ist meist der Hauptkritikpunkt. Natürlich gibt es keine Garantie, dass das alles 100% Sicher ist, jedoch wenn Millionen User (Wie bei SETI@home [ca. 4,8 Mio sind es atm]) oder Großkonzerne bzw. Universitäten daran beteiligt sind, stärkt dies Wohl die Plausibilität der Projekte. Somit bleibt es eine reine Vertrauenssache für den Projektteilnehmer. Hier verweise ich nochmal auf die HP einer sehr großen (und erfolgreichen) DC-Community (klick (www.rechenkraft.net)), welche eine ausführliche Liste aller momentan vertrauenswürdigen Projekte hat.

Schaut einfach vorbei und seht euch um. Jeder findet dort ein Projekt das ihn anspricht und ebenso gibt es dort noch eine vielfältige (und vorallem nette ^^) Community die mit Rat und Tat zur Seite steht.

ciao
Zahme

Masterfly
10.01.2004, 17:53
Es geht mir nicht ums ausspionieren (dagegen kann ich was machen) aber wie sieht es aus, wenn der mir zuschickende PC von einem Virus befallen ist oder wie wird davor geschützt, das sich nicht ein Hacker dazwischen klemmt und mir was ganz anderes schickt.
Im Forum hab ich schon nach einer antwort gesucht, aber nichts gefunden -.- sind wohl alle sehr vertrauenssellig.

Zahmekoses
10.01.2004, 21:00
Zum Schutz vor Hacker sei gesagt, dass das hin und herschicken zwischen dem PC und dem Betreiber über eine abgesicherte Verbindung erfolgt (ist bei vielen so). Die Zeit, die ein Hacker hätte um diese Verbindung zu knacken ist zu kurz, womit eine mögliche Hackerattacke ausbleibt. (Die Programme rechnen alle Offline und müssen nur zu den Servern connecten um fertig berechnete Ergebnisse abzuschicken)

Wenn der BetreiberPC nen Virus hat, kannst du den Virus nur empfangen wenn sich der Virus in der Datei aufhält, die vom Server verschickt wird (keine ausführbare Datei). So ein Virus ist recht wiedersinnig, weil

1. Die Verbreitung absolut gering/null wäre (denn nich jeder hat das Programm laufen, welche Dateien der Virus infizieren soll)
2. Müsse der Virus direkt angepasst sein an die Datei die verschickt wird und dies wird extrem schwer, weil die Dateien nie/selten gleich sind [man berechnet ja immer was neues]

Eine Gefahr durch so eingeschleuste Viren ist somit viel mehr als gering. Eigentlich schon fast null.

Und: ja, natürlich sind wir vertrauensseelig, da dieses ganze Prinzip seit nunmehr 4 Jahren einwandfrei funktioniert und es zudem meist eigentlich gemeinnützige Projekte sind, welche wirklich hinter guten Zielen stehen. ;)

ciao
Zahme

Masterfly
10.01.2004, 23:38
Ich zweifle nicht am Sinn der Projekte nur an der Sicherheit und Sorry wenn der Hacker den verschickenden Server knackt ist das überhaupt nicht mehr sicher, weil man nicht die daten prüfen kann.
Wenn man schon mit erlebt hat wie selbst solche Server wie der Hauptserver von freenet geknackt wurde, und über abuse erfährt wie oft Attacken auf die großen Server laufen ....


Nicht alle Viren, Würmer oder co müssen speziel angepasst werden, es reicht ein Betriebsystem, ansonsten wären manche Viren nicht so verbreitet.

Zahmekoses
12.01.2004, 07:31
Wenn der Hacker den Server hackt, könnte er die Daten (die verschickt werden) manipulieren, wenn er weiss wie das System funktioniert, korrekt.

Bei der Viren Sache bin ich leicht überfragt, weil mir bsiher nur Viren bekannt sind die über Dateitransfer auf den PC gelangen. Damit eine Work Unit den Virus enthält, müsste der Virus auch erst dort eingearbeitet werden. etc. pp.

Schlussendlich gibt es immernoch den Faktor Risiko, doch den hat man bei diesen Projekten genauso wie bei Online-Games, Freemail-Dienste, Foren, etc. ;) [Wer sagt denn nicht, das im CIL ein Applet eingebaut ist, welches euch den einen oder anderen Wurm raufsetzt, nur weil ihr das Applet ausladen lässt? ;)]

Ergo: Es bleibt ein Restrisiko, dass so etwas (wie von dir beschrieben) passieren kann. Ich sehe dies aber nicht als sooo negativ an, weil dieses Restrisiko fast überall im Internet vorhanden ist.

ciao
Zahme