Les limites des GWASComme nous l'avons déjà évoqué à plusieurs reprises, l'étude des maladies fréquentes et complexes (diabète, arthrite rhumatoïde, maladie de Crohn, etc.) par association pangénomique (GWAS, genome-wide association studies) se heurte actuellement à un sérieux problème, celui de l'« héritabilité manquante » [1,2]. Les associations dûment démontrées par GWAS s'avèrent correspondre à des risques relatifs faibles (typiquement de 1,2 à 1,5 au maximum) et, cumulées, ne rendent compte que d'une petite partie de l'héritabilité observée pour chacune de ces affections. Les insertions, duplications et délétions, dont la découverte est relativement récente, rendent sans doute compte d'une fraction notable de l'influence génétique ; mais il semble que le rôle le plus important soit joué par les variants rares, correspondant aux snip dont l'allèle mineur a une fréquence très infé-rieure à 1 %. Les puces à ADN employées pour les études GWAS sont, par construction, limitées aux variants fré-quents : il faudrait sinon qu'elles examinent non plus 500 000 ou un million de snip dans le génome, mais des centaines de millions voire des milliards, ce qui est techniquement hors de portée. Du coup, il ne reste plus guère que le séquençage pour détecter ces variants rares : on imagine que, dans les affections complexes, chacun d'eux exerce une influence notable sur le risque de maladie sans, bien sûr, en être le déterminant principal -sinon on retomberait dans le cas des maladies monogéniques et mendéliennes. Mais, malgré les fulgurants progrès enregistrés au cours des deux ou trois dernières années, une étude GWAS fondée sur la séquence ne constitue pas une perspective réaliste : le séquençage complet d'un ADN humain coûte au minimum quelques milliers d'euros [3], et il faudrait pratiquer cette analyse sur des milliers de patients et de témoins pour arriver à une puissance statistique suffisante. De plus, comme il s'agit de détecter des variants rares, la qualité de cette séquence doit être excellente : il ne s'agit pas de confondre erreurs de séquençage et variants vrais ! La multiplicité généralement adoptée 1 , de l'ordre de trente, risque fort d'être insuffisante, et il faudrait aller jusqu'à cent ou deux cents, ce qui augmente encore le coût. Les premiers résultats du 1 000 genomes project [4] sont à la fois encourageants et décevants, dans la mesure où la détection systématique d'allèles réel lement rares reste hors de portée : on se trouve donc face à une impasse, peut-être temporaire mais néanmoins extrêmement frustrante.
La montée en puissance des exomesLa tactique des exomes [5], sur laquelle je m'étais montré assez sceptique par le passé [3], semble, en fait, avoir le vent en poupe. Elle consiste en un séquençage ciblé sur les séquences exprimées, grâce à la sélection de ces dernières dans l'ADN total du prélèvement à l'aide soit de puces à ADN contenant l'ensemble des séquences exprimées, soit d'une hybridation en solution avec les même séquences munies d'une étiquet-te permettant la sélection des complexes...