Moteur de recherche

 

Espace presse

Paris, Le 27 février 2003

La France se positionne en bonne place pour les calculs intensifs en génomique

Comment la bioinformatique peut-elle aider les biologistes pour l'interprétation des quantités colossales de données issues des programmes de séquençage des génomes ? Quelles solutions informatiques concevoir ? Avec quelles applications aujourd'hui et quelles perspectives pour la biologie ?
Ces questions seront débattues par une soixantaine de spécialistes internationaux, biologistes, bioinformaticiens et informaticiens, les 27 et 28 février 2003 à Évry, durant le séminaire scientifique
« TERAPROT, massive computing in genomics ». Une manifestation organisée sous l'égide de Genopole® en partenariat avec le CEA, Infobiogen et le Laboratoire Génome et informatique (CNRS- université d'Évry-Val d'Essonne).

La génomique est la science qui étudie la structure, le fonctionnement et l'évolution des génomes (ensemble du matériel génétique d'un organisme vivant, porté par la molécule d'ADN). Elle s'appuie sur la connaissance de la séquence des génomes, c'est-à-dire l'ordre d'enchaînement des unités élémentaires, ou nucléotides, sur l'ADN. Pourquoi des calculs intensifs en génomique ? L'explosion des quantités de données issues des programmes de séquençage des génomes induit de nouvelles pratiques en biologie. A titre d'exemple, le génome de l'Homme comporte 3 milliards de nucléotides pour environ 30 000 gènes. La bioinformatique, discipline née avec la biologie à grande échelle, est devenue incontournable dans le paysage scientifique. Conçue à l'origine pour le stockage et la gestion des données sur ordinateur, elle est aujourd'hui une composante à part entière de la recherche. Les applications développées fournissent aux scientifiques des outils pour l'interprétation de leurs résultats : assemblage des séquences, annotation des génomes (informations attachées aux séquences génomiques comme l'organisme d'origine, la localisation des gènes, éventuellement la description succincte de leur fonction), ou encore modélisation des interactions moléculaires. L'objectif des chercheurs maintenant : donner un sens aux séquences. Ce qui signifie attribuer à chaque gène identifié sa fonction biologique, via les protéines qu'il code. La comparaison des protéines des différents organismes séquencés est une voie particulièrement intéressante vers la compréhension de la fonction des gènes. Cette approche repose sur le principe suivant : les fonctions communes aux différentes espèces sont assurées par des protéines qui ont conservé des similarités au cours de l'évolution. A partir des protéines dont le rôle est connu dans un organisme, il est donc théoriquement possible d'identifier les protéines de même fonction dans d'autres organismes. Mais si l'on veut comparer deux à deux toutes les séquences protéiques disponibles dans les banques publiques, cela représente des milliards de calculs, hors de portée de la plupart des laboratoires de recherche. C'est pour répondre à ce véritable défi scientifique que sont nés deux programmes de comparaison massive de séquences protéiques sur le campus de Genopole®, à Évry : TERAPROT est le fruit de l'association de grands organismes de recherche publics : Infobiogen, l'université d'Évry-Val d'Essonne et le CEA, qui collaborent également avec des entreprises privées. Ce programme s'appuie sur l'ouverture aux projets civils de la puissance exceptionnelle de Tera (1ère puissance de calcul d'Europe et 7ème au monde), supercalculateur de la Direction des applications militaires du CEA, à Bruyères-le-Châtel. L'algorithme de calcul utilisé, BiofacetTM, a été mis au point par la société de bioinformatique Gene-IT. Les compétences des équipes bioinformatiques d'Infobiogen et du Laboratoire Génome et informatique entrent en jeu pour la mise en forme de la gigantesque base de données générée par ces calculs. Le choix des scientifiques de Teraprot a été de comparer uniquement des protéomes complets, c'est-à-dire l'ensemble des séquences protéiques prédites à partir de la séquence génomique des organismes entièrement séquencés. Une dizaine de jours –équivalents d'une utilisation à temps plein de la machine Tera- ont suffi pour réaliser les comparaisons d'une centaine de protéomes. Opérations qui auraient nécessité plus d'un an avec les moyens informatiques déjà importants d'Infobiogen. Originalité du programme, l'interface d'exploitation mise au point par Infobiogen permet aux chercheurs une interrogation à la carte de la base de données créée, en fonction de leurs centres d'intérêt et avec leurs propres paramètres. Contrairement aux grands centres proposant des calculs similaires, qui fournissent des résultats organisés selon certains critères préétablis. Les premiers résultats de Teraprot ont été mis à la disposition de la communauté scientifique internationale sur le serveur d'Infobiogen (www.infobiogen.fr/services/teraprot). Le projet DECRYPTHON, mené par l'AFM, IBM et Genomining, a, quant à lui, utilisé la technique du calcul partagé (ou grid computing) pour comparer plus de 550 000 protéines issues de 76 génomes différents dans l'ensemble du monde vivant (bactérie, plante, animal, homme). Triple défi scientifique, humain et technologique, DECRYPTHON proposait à tous les internautes possédant un PC et une connexion à Internet de mettre à la disposition des chercheurs la puissance inutilisée de leur ordinateur. Grâce à la solidarité de 75 000 internautes mobilisés dans le cadre du Téléthon 2001, la cartographie des protéomes est, depuis septembre 2002, disponible gratuitement sur Internet, sur le site d'Infobiogen(www.infobiogen.fr/services/decrypthon). Début 2003, l'AFM a lancé un appel d'offres auprès de la communauté scientifique pour l'exploitation de cette base de données. 15 projets de recherche ont été présélectionnés. Décrypthon a réuni une puissance de calcul et de stockage suffisantes pour traiter en moins de deux mois 2 millions de paquets de données, soit un volume de plus de 10 millions d'heures de calcul. Le projet a bénéficié de la collaboration de Genomining, qui a conçu le programme informatique et qui a organisé la mise en forme des résultats, ainsi que d'IBM, qui a apporté ses ressources informatiques et ses compétences en grid computing. Le programme informatique conçu par Genomining est basé sur l'algorithme d'alignement local de Smith-Waterman, dans une architecture distribuée représentant virtuellement une puissance de calcul de plus de 40 Téraflops. Des promesses pour l'avenir TERAPROT et DECRYPTHON sont des projets d'envergure qui constituent le fondement d'un pôle de compétences en calcul intensif pour la génomique en Ile-de-France. Ils permettent de positionner la France en très bonne place dans la compétition internationale pour l'analyse des données en génomique. Car l'enjeu de l'après-séquençage, pour les années à venir, est la découverte de la fonction des gènes des différentes espèces. En apportant un éclairage sur les mécanismes qui régissent le vivant, elle est la voie vers le développement d'applications, notamment dans le domaine de l'environnement et de l'agro-alimentaire. Les avancées dans ce domaine soulèvent également des espoirs en thérapeutique humaine : non seulement pour la mise au point de traitements dans les maladies génétiques proprement dites, mais aussi pour les grandes pathologies comme le cancer, les maladies neuro-dégénératives, les maladies cardiovasculaires, dont on sait aujourd'hui qu'elles ont une origine génétique. Les partenaires Le campus de Genopole®, à Évry, rassemble autour de la génomique, de la post-génomique et des sciences connexes, plus de vingt laboratoires de recherche académique, des filières complètes d'enseignement grâce à l'université d'Evry-Val d'Essonne et une quarantaine d'entreprises innovantes de biotechnologies. TERAPROT - Le CEA, organisme public de recherche, exerce ses missions dans les domaines de l'énergie (nucléaire et nouvelles sources d'énergie comme l'hydrogène et le solaire), de la défense nationale, des nouvelles technologies de l'information et de la communication, de la santé. Riche des compétences de ses 15000 chercheurs et collaborateurs, il est internationalement reconnu comme expert dans ces domaines et constitue une force de propositions pour les pouvoirs publics, les institutions et les industriels français et européens. - Le Centre de ressources Infobiogen est un pôle national pour l'informatique dédié à la génomique. Il a pour vocation d'accélérer la recherche dans le domaine en offrant des outils informatiques et en développant de nouveaux services accessibles à l'ensemble de la communauté scientifique. - Fondée en 1998, Gene-IT S.A. est une société de bioinformatique issue de l'INRIA, qui développe et commercialise une plate-forme logicielle unique de génomique comparative. La polyvalence de sa technologie, alliée à une expertise de plusieurs années, permet à Gene-IT de proposer des licences logicielles et des contrats de recherche ou d'externalisation aux industries pharmaceutiques, agrochimiques et du diagnostic, aux sociétés de génomique et de biotechnologie, ainsi qu'aux grands centres de recherche académiques. Gene-IT a parmi ses clients de nombreux industriels en Europe et aux Etats Unis (DuPont de Nemours, NV Organon, Pfizer, Rhobio, Servier, …), et des centres de recherche académique prestigieux tels que Infobiogen, l'Institut Pasteur, le Genoscope et l'EBI. - L'université d'Évry-Val d'Essonne - Le CNRS DECRYPTHON - Association loi 1901 créée en 1958, l'Association Française contre les Myopathies rassemble des malades et des familles touchées par des maladies neuromusculaires. Reconnue d'utilité publique, elle a pour mission de guérir et d'aider les personnes atteintes par ces maladies lourdement invalidantes, encore incurables et pour la plupart d'origine génétique. Pour atteindre ses objectifs, l'AFM mène des actions d'intérêt général pour les maladies rares et les maladies génétiques. Pour s'en donner les moyens, elle a créé le Téléthon en 1987 qui, chaque année, fait appel à la générosité du public durant le premier week-end de décembre. Grâce à la mobilisation de millions de donateurs, l'AFM est devenu un acteur majeur de la recherche génétique en France. Elle a créé notamment Généthon en 1990, laboratoire qui a réalisé les premières cartes du génome. L'AFM a soutenu plus de 7 200 programmes de recherche depuis 1987 et a contribué à la découverte des gènes responsables de plus de 700 maladies. - IBM, entreprise e-business, est le leader mondial des services et des technologies de l'information. IBM développe et commercialise des solutions e-business globales : matériels (serveurs, stockage et PC), logiciels, services et financement. Au travers de son vaste réseau mondial de consultants et d'experts en services et solutions et de ses 45 000 partenaires commerciaux, IBM transforme ces technologies avancées en valeur ajoutée au bénéfice d'entreprises de toute taille, notamment de PME-PMI. L'innovation est au cœur de la stratégie d'IBM qui investit chaque année près de 6 milliards de dollars en recherche et développement, avec plus de 3000 chercheurs et ingénieurs et huit laboratoires répartis dans six pays. Pour la dixième année consécutive, IBM est le numéro un aux Etats-Unis en matière de dépôt de brevets, avec près de 3288 brevets en 2002. Chaque année, plus de 30% de ces brevets se concrétisent par des offres commerciales IBM. - Genomining est une société française de bioinformatique, dont la mission est de produire et de fournir de l'information biologique. Elle propose aux industries des sciences de la vie une combinaison unique de conseils, de services bioinformatiques, de service de calculs et d'accès à des bases de données biologiques de grande taille. Son fondateur, William Saurin, ancien Directeur Informatique de Génoscope, le "Génome Centre" public français, a quitté cet organisme pour créer Genomining, avec l'appui de Genopole®. Genomining mène ses programmes de recherche "in silico", c'est-à-dire sur des plates-formes informatiques.

Contacts :

Contact presse Genopole®:
Catherine Brun
01 60 87 44 98
catherine.brun@genopole.com
2, rue Gaston Crémieux
CP 5723 - 91057 Evry Cedex
www.genopole.org

Contact presse CEA:
Pascal Newton
01 40 56 20 97
pascal.newton@cea.fr
31-33, rue de la Fédération
75015 Paris
www.cea.fr

Contact presse AFM:
Estelle Assaf
01 69 47 12 78
eassaf@afm.genethon.fr
Rue de l'Internationale - BP 59
91002 Évry Cedex
www.afm-france.org


Haut de page

Retour à l'accueilContactcreditsCom'Pratique