Index  | Recent Threads  | Unanswered Threads  | Who's Active  | Guidelines  | Search

Quick Go »
No member browsing this thread
Thread Status: Active
Total posts in this thread: 5
[ Jump to Last Post ]
Post new Thread
Previous Thread This topic has been viewed 2015 times and has 4 replies Next Thread
Joined: Dec 12, 2008
Post Count: 2
Status: Offline
Reply to this Post  Reply with Quote 
Analyse and deployment of algorithm and software solutions forlarge scale bioinformatic applications into computing grid (5.4 MB)

Analyse and deployment of algorithm and software solutions forlarge scale bioinformatic applications into computing grid

Raphaël Bolze

This thesis was conducted by the needs of the Decrypthon project (collaborative project between AFM, CNRS and IBM). First we show the role of architect played in order to select and define the Decrypthon grid infrastructure. The resources of this grid are hosted by five Universities (Bordeaux I, Lille I, ENS-Lyon, Pierre et Marie Curie Paris VI et Orsay). The network connexion is provided by RENATER (Réseau National de Télécommunications pour l'Enseignement et la Recherche). The CRIHAN ( Centre de ressources Informatiques de Hautes Normandie) is also involved into this parternship and provides data warehouse for scientists. In a second hand we present several experiments carried on Grid'5000 in order to validate the grid middleware DIET and its tools on a large scale platform such as Grid'5000. On this research platform, we also studied the application of the project "Help Cure Muscular Dystrophy", one of the project selected by the Decrypthon. This study prepared the launch of a 6 months computing phase on the volunteers grid : World Community Grid support by IBM US. The document presents all steps before and after the computing phase which require more than 80 centuries of CPU time on the volunteers device. Finally, we have designed several heuristics to tackle the problem of online multi-workflow scheduling in a shared grid environment. We have implemented those heuristics into DIET middleware and we have validated their behavior with case study applications from Decrypthon. This work required many software developments in the aim to grid enabled bioinformatic applications and transparenlty give access to the Decrypthon grid, but also into DIET middleware and tools around : DIET_Webboard, VizDIET, GoDIET, LogService, MA_DAG, etc. The results exposed in this thesis were obtained with tree different grids : the Decrypthon grid, the volunteer grid (World Community Grid) and the research grid (Grid'5000).

Analyse et déploiement de solutions algorithmiques et logicielles pour des applications bioinformatiques à grande échelle sur la grille

Raphaël Bolze

INRIA Rhône-Alpes / LIP Laboratoire de l'Informatique du Parallélisme - GRAAL
LIP - Laboratoire de l'Informatique du Parallélisme

Cette thèse présente un ensemble d'objectifs dont le fil conducteur est le programme Décrypthon (projet tripartite entre l'AFM, le CNRS et IBM) où les applications et les besoins ont évolué au fur et à mesure de l'avancée de nos travaux. Dans un premier temps nous montrerons le rôle d'architecte que nous avons endossé pour la conception de la grille Décrypthon. Les ressources de cette grille sont supportées par les cinq universités partenaires (Bordeaux I, Lille I, ENS-Lyon, Pierre et Marie Curie Paris VI et Orsay), ainsi que le réseau RENATER (Réseau National de Télécommunications pour l'Enseignement et la Recherche), sur lequel est connecté l'ensemble des machines. Le Centre de ressources informatiques de Haute Normandie (CRIHAN) participe également au programme, il héberge les données volumineuses des projets scientifiques. Nous présenterons ensuite les expériences que nous avons effectuées sur l'intergiciel DIET afin de tester ses propriétés de façon à explorer sa stabilité dans un environnement à grande échelle comme Grid'5000. Nous nous sommes intéressés, en outre, au projet "Help Cure Muscular Dystrophy", un des projets sélectionnés par le programme Décrypthon. Nous avons conduit des expériences dans le but de préparer la première phase de calcul sur la grille de volontaires "World Community Grid". Nous dévoilerons l'ensemble des étapes qui ont précédées et suivies la première phase calculatoire qui a demandé quelques 80 siècles de temps processeur. Pour terminer, nous avons développé une fonctionnalité à l'intergiciel DIET, le rendant capable de gérer l'exécution de tâches ayant des dépendances. Nous nous sommes intéressés à développer des algorithmes prenant en compte plusieurs applications qui demandent l'accès aux mêmes ressources de manière concurrente. Nous avons validé cette fonctionnalité avec des applications issues des projets du programme Décrython. Ces travaux ont nécessité un développement logiciel important, d'une part sur les applications du Décrypthon elles-mêmes et sur leur portage afin de rendre transparente leur utilisation sur la grille Décrypthon, mais aussi au niveau de l'intergiciel DIET et son écosystème : DIET_Webboard, VizDIET, GoDIET, LogService, MA_DAG, etc. Les résultats présentés ont été obtenus sur trois grilles mises à notre disposition: la grille universitaire du Décrypthon, la grille d'internautes (World Community Grid) et la grille expérimentale Grid'5000.

La partie de la thèse consacrée au projet de lutte contre la dystrophie musculaire commence à la page 112

4.3.1 L’application : MAXDo (p 112)
4.3.2 Evaluation de MAXDo sur la grille Grid’5000 (p 114)
4.3.3 Préparation pour la grille d’internautes (p 119)
4.3.4 Déroulement des calculs sur la grille WCG (p 122)
4.3.5 Analyse des résultats de la phase I du projet HCMD (p 125)

4.4 Comparaison de deux types de grilles (p 126)
4.4.1 Processeurs virtuels à plein temps (p 128)
4.4.2 Prévision pour la phase II du projet HCMD (p 133)
[Edit 4 times, last edit by [AF>EDLS>BIOMED] Heyoka at Dec 13, 2008 7:46:31 PM]
[Dec 13, 2008 7:16:07 PM]   Link   Report threatening or abusive post: please login first  Go to top 
Advanced Cruncher
Joined: Oct 2, 2006
Post Count: 83
Status: Offline
Project Badges:
Reply to this Post  Reply with Quote 
Re: Analyse and deployment of algorithm and software solutions forlarge scale bioinformatic applications into computing grid

Thanks. The document seems very interesting. Is there an English version available?
[Dec 14, 2008 2:44:56 AM]   Link   Report threatening or abusive post: please login first  Go to top 
Veteran Cruncher
Joined: Dec 2, 2005
Post Count: 1422
Status: Offline
Project Badges:
Reply to this Post  Reply with Quote 
Re: Analyse and deployment of algorithm and software solutions forlarge scale bioinformatic applications into computing grid

yes a very intresting piece

same question is the rest of the article in english or translated in english somewere?

[Dec 14, 2008 9:37:49 PM]   Link   Report threatening or abusive post: please login first  Go to top 
Ace Cruncher
Joined: Jul 24, 2005
Post Count: 20043
Status: Offline
Reply to this Post  Reply with Quote 
Re: Analyse and deployment of algorithm and software solutions forlarge scale bioinformatic applications into computing grid

If you know how to search using oogle, you'll get a long way to find more by Bolze and knreed (K Reed), our tech:
WCG Global & Research > Make Proposal Help: Start Here!
Please help to make the Forums an enjoyable experience for All!
[Dec 14, 2008 9:58:46 PM]   Link   Report threatening or abusive post: please login first  Go to top 
Veteran Cruncher
Joined: Dec 2, 2005
Post Count: 1422
Status: Offline
Project Badges:
Reply to this Post  Reply with Quote 
Re: Analyse and deployment of algorithm and software solutions forlarge scale bioinformatic applications into computing grid

If you know how to search using oogle, you'll get a long way to find more by Bolze and knreed (K Reed), our tech:

normaly when i oogle my wife slaps me and reminds me im married... tongue

didnt think about google though thanks

[Dec 15, 2008 1:51:48 AM]   Link   Report threatening or abusive post: please login first  Go to top 
[ Jump to Last Post ]
Post new Thread