Décodeur de mutation

Voici un outil qui permettra de traduire les informations de mutation trouvées dans les rapports génétiques en un texte plus compréhensible.
A ce jour, la localisation ou le type de mutation ne fournit aucune information significative sur l’impact de syngap1 ou sur l’évolution de la maladie.
Cet outil n’est là que pour fournir un meilleur contexte sur ce qui s’est passé pendant la mutation et pour fournir plus de connaissances aux parents qui sont intéressés.

Introduction

Le  gène SYNGAP1  est situé sur le chromosome 6 et est responsable de la production de la protéine SynGAP. Cette protéine agit comme un régulateur dans les synapses – là où les neurones communiquent entre eux. Une mutation du gène SYNGAP1 conduit à ce que le gène ne produise pas suffisamment de protéine SynGAP. Sans la bonne quantité de protéine SynGAP, nous constatons une augmentation de l’excitabilité dans les synapses, ce qui rend difficile la communication efficace des neurones. Cela conduit à de nombreux problèmes neurologiques observés chez les patients SynGAP.

Veuillez entrer la notation de la protéine (commencez par p.*) ou la notation de l'ADN codant (commencez par c.*) dans la case verte ci-dessous :

Exemples (p.Ser152Cysfs*2 ; p.Lys835Glnfs10 ; c.3582-4G>A ; c.4373_4377del ; c.1676-1G>C)

Qu'est-ce que ça veut dire ?

Le syndrome SYNGAP1 est causé par une variante du gène SYNGAP1 (6p.21.32).

Le corps humain est fait de trillions de cellules. Chaque cellule contient 23 paires de chromosomes (46 au total). Chaque chromosome contient des milliers de gènes. La plupart des gènes viennent également par paires et nous obtenons une copie de chaque parent.

Le rôle des gènes est de produire des protéines. Les protéines sont utilisées pour réguler les tissus et les organes du corps.

Un gène peut cesser de fonctionner ou ne plus fonctionner correctement lorsqu’une variante (parfois appelée mutation ou altération) se produit. Une variante est une erreur qui se produit, semblable à une faute de frappe, lorsque l’ADN est copié d’une cellule à l’autre ou en raison de facteurs environnementaux.

Un gène est comme un livre et il contient des chapitres. Les chapitres (exons) sont séparés par des pages de couverture (introns).
 
La définition du gène Syngap1 trouvée dans l’ADN est composée de 19 chapitres (19 exons). Ce sont les informations utilisées pour créer la protéine Syngap1 qui est ensuite utilisée par le cerveau.
 
Les introns ne sont pas utilisés pour coder les protéines mais sont toujours une partie importante du gène.
 
Lorsqu’une mutation se produit, elle peut être dans l’un des 19 exons. Comme les exons n’ont pas tous la même taille (pensez à un certain nombre de pages de chapitre dans un livre), certains chapitres plus gros sont statistiquement plus sujets à la mutation.
 
Les plus gros exons sont l’exon 8 et l’exon 15 qui couvrent plus de 40% de la définition des gènes. Les 60% restants sont répartis sur les 17 autres exons (avec entre 2% et 6% de chances de mutation chacun).
 
La mutation dans les introns existe également. La plupart du temps, cela n’a pas d’impact sur la création de protéines mais dans de rares cas, cela a un impact sur la lecture des exons lors de la création de la protéine. Nous pouvons voir cela comme une désinformation sur la page de couverture d’un chapitre qui aura un impact sur la lecture du livre même si le contenu du chapitre est correct.
Deux tests génétiques sont principalement utilisés, le test de l’exome et le test du génome complet. Lors de l’utilisation de la méthode de l’exome (plus rapide et moins chère), les mutations des introns ne sont pas découvertes. C’est pourquoi, le test du génome est préféré même s’il est plus cher et difficile à obtenir.
 
La localisation de la mutation ne donne pas encore une image claire de la gravité ou de l’efficacité du médicament.
 
Le gène Syngap1 est composé de 1343 acides aminés (quand on ne compte que les exons). Chaque acide aminé est créé par une combinaison de 3 nucléotides (a, t, g, c). Cela signifie qu’une seule erreur nucléotide/lettre dans un texte de 4029 caractères (3×1343=4029) peut conduire au syndrome du spectre Syngap1…
37’881 caractères sont utilisés au total lors du comptage des introns et des exons. 
C’est vraiment un “coup du hazard” minime sachant que l’ADN entier a environ 3 milliards de nucléotides…
Les 1343 Amino acides qui composent la protéine Syngap1
MSRSRASIHR GSIPAMSYAP FRDVRGPSMH RTQYVHSPYD RPGWNPRFCI
ISGNQLLMLD EDEIHPLLIR DRRSESSRNK LLRRTVSVPV EGRPHGEHEY
HLGRSRRKSV PGGKQYSMEG APAAPFRPSQ GFLSRRLKSS IKRTKSQPKL
DRTSSFRQIL PRFRSADHDR ARLMQSFKES HSHESLLSPS SAAEALELNL
DEDSIIKPVH SSILGQEFCF EVTTSSGTKC FACRSAAERD KWIENLQRAV
KPNKDNSRRV DNVLKLWIIE ARELPPKKRY YCELCLDDML YARTTSKPRS
ASGDTVFWGE HFEFNNLPAV RALRLHLYRD SDKKRKKDKA GYVGLVTVPV
ATLAGRHFTE QWYPVTLPTG SGGSGGMGSG GGGGSGGGSG GKGKGGCPAV
RLKARYQTMS ILPMELYKEF AEYVTNHYRM LCAVLEPALN VKGKEEVASA
LVHILQSTGK AKDFLSDMAM SEVDRFMERE HLIFRENTLA TKAIEEYMRL
IGQKYLKDAI GEFIRALYES EENCEVDPIK CTASSLAEHQ ANLRMCCELA
LCKVVNSHCV FPRELKEVFA SWRLRCAERG REDIADRLIS ASLFLRFLCP
AIMSPSLFGL MQEYPDEQTS RTLTLIAKVI QNLANFSKFT SKEDFLGFMN
EFLELEWGSM QQFLYEISNL DTLTNSSSFE GYIDLGRELS TLHALLWEVL
PQLSKEALLK LGPLPRLLND ISTALRNPNI QRQPSRQSER PRPQPVVLRG
PSAEMQGYMM RDLNSSIDLQ SFMARGLNSS MDMARLPSPT KEKPPPPPPG
GGKDLFYVSR PPLARSSPAY CTSSSDITEP EQKMLSVNKS VSMLDLQGDG
PGGRLNSSSV SNLAAVGDLL HSSQASLTAA LGLRPAPAGR LSQGSGSSIT
AAGMRLSQMG VTTDGVPAQQ LRIPLSFQNP LFHMAADGPG PPGGHGGGGG
HGPPSSHHHH HHHHHHRGGE PPGDTFAPFH GYSKSEDLSS GVPKPPAASI
LHSHSYSDEF GPSGTDFTRR QLSLQDNLQH MLSPPQITIG PQRPAPSGPG
GGSGGGSGGG GGGQPPPLQR GKSQQLTVSA AQKPRPSSGN LLQSPEPSYG
PARPRQQSLS KEGSIGGSGG SGGGGGGGLK PSITKQHSQT PSTLNPTMPA
SERTVAWVSN MPHLSADIES AHIEREEYKL KEYSKSMDES RLDRVKEYEE
EIHSLKERLH MSNRKLEEYE RRLLSQEEQT SKILMQYQAR LEQSEKRLRQ
QQAEKDSQIK SIIGRLMLVE EELRRDHPAM AEPLPEPKKR LLDAQERQLP
PLGPTNPRVT LAPPWNGLAP PAPPPPPRLQ ITENGEFRNT ADH

Définitions des mutations

ADN et ARN

L'ADN et l'ARN ont une structure en double hélice. Les groupements phosphates constituent le squelette (en gris), tandis que le milieu de la double hélice est formé par des paires de bases azotées (morceaux colorés). Chaque type de base azotée s'apparie avec une autre base spécifique. La cytosine s'apparie avec la guanine, tandis que l'adénine s'apparie avec la thymine dans l'ADN, et vice versa. Lorsque nous parlons d'ARN (un côté de l'hélice), l'adénine s'apparie avec l'uracile. C'est pourquoi, selon la notation que vous lisez, vous pouvez trouver T (pour Thymine) et U (pour Uracile). Par souci de simplicité dans l'explication ci-dessous, nous n'utiliserons que la notation ADN. L'ADN est comme un long fil fait de "paires de bases" AT et GC uniquement. Les gènes contiennent les informations nécessaires à la fabrication des protéines.

rnabasics

Composition de l'ARN

Pour que l'ADN fabrique des protéines, il doit être transcrit par l'ARN messager (ARNm). L'ARNm "lit" l'ADN trois bases à la fois, en y faisant correspondre ses bases complémentaires. Ces groupes de trois bases sont appelés codons, et chaque codon code pour un acide aminé différent. Les chaînes d'acides aminés constituent les protéines. Un ensemble de trois bases signifie "démarrer", d'autres spécifient les 20 acides aminés différents (blocs de construction des gènes) et une combinaison signifie "arrêter" La liste complète de toutes les bases est appelée génome

Duplication

Comme pour toutes les mutations, une mutation de duplication peut modifier radicalement les protéines créées par un organisme. Les protéines responsables de la lecture de l'ADN traitent la molécule en unités de trois paires de bases à la fois. Ces codons spécifient chacun un acide aminé différent. Si la séquence change ne serait-ce que d'un nucléotide, un acide aminé différent est placé dans la protéine. La fonction de chaque protéine dépend de l'interaction spécifique entre les acides aminés qui la composent. Une mutation de duplication peut déplacer plusieurs nucléotides. Dans ce cas, cela peut rendre la protéine complètement dysfonctionnelle ou lui donner une fonction entièrement nouvelle. De nouvelles adaptations peuvent survenir de cette façon, si elles sont transférées à la progéniture et sont bénéfiques. Cependant, la grande majorité des mutations sont délétères ou provoquent des effets négatifs.

Duplication complète des codons

Comme pour toutes les mutations, une mutation de duplication peut modifier radicalement les protéines créées par un organisme. Les protéines responsables de la lecture de l'ADN traitent la molécule en unités de trois paires de bases à la fois. Ces codons spécifient chacun un acide aminé différent. Si la séquence change ne serait-ce que d'un nucléotide, un acide aminé différent est placé dans la protéine. La fonction de chaque protéine dépend de l'interaction spécifique entre les acides aminés qui la composent. Une mutation de duplication peut déplacer plusieurs nucléotides. Dans ce cas, cela peut rendre la protéine complètement dysfonctionnelle ou lui donner une fonction entièrement nouvelle. De nouvelles adaptations peuvent survenir de cette façon, si elles sont transférées à la progéniture et sont bénéfiques. Cependant, la grande majorité des mutations sont délétères ou provoquent des effets négatifs.

Insertion

Les insertions et les délétions font référence à l'ajout ou à la suppression de courtes séquences de séquences nucléotidiques. Ces types de mutations sont généralement plus délétères que les substitutions car elles peuvent provoquer des mutations par décalage de cadre, altérant toute la séquence d'acides aminés en aval du site de mutation.

Insertion et Arrêt (Frameshift)

Le code génétique est lu en triplets par des enzymes productrices de protéines. Si trois nucléotides ou plus sont ajoutés dans un gène, des acides aminés entiers peuvent être absents de la protéine créée, ce qui peut avoir de graves effets fonctionnels. L'ajout d'un seul nucléotide n'est souvent pas préférable, car une mutation par décalage de cadre peut se produire. Une mutation de décalage de cadre déplace le gène entier et modifie tous les codons triplets d'origine. Une mutation de ce type peut amener un gène à produire un gène complètement non fonctionnel, car elle altère sérieusement la chaîne d'acides aminés que le gène produit.

Inversion

L'inversion fait référence à la commutation de séquences nucléotidiques.

Suppression complète du gène

Parfois, le gène complet peut être manquant (entièrement supprimé).

Non-sens/substitution

Une mutation non-sens se produit lorsqu'un nucléotide est substitué et cela conduit à la formation d'un codon stop au lieu d'un codon qui code pour un acide aminé. Un codon stop une certaine séquence de bases (TAG, TAA ou TGA dans l'ADN) qui arrête la production de la chaîne d'acides aminés. Il se trouve toujours à la fin de la séquence d'ARNm lors de la production d'une protéine, mais si une substitution le fait apparaître à un autre endroit, il terminera prématurément la séquence d'acides aminés et empêchera la bonne protéine d'être produite.

Faux-sens/substitution

Comme une mutation non-sens, une mutation faux-sens se produit lorsqu'un nucléotide est remplacé et qu'un codon différent est formé; mais cette fois, le codon qui se forme n'est pas un codon stop. Au lieu de cela, le codon produit un acide aminé différent dans la séquence d'acides aminés. Par exemple, si une substitution faux-sens change un codon d'AGC en GGC, l'acide aminé Glycine sera produit à la place de la Sérine. Une mutation faux-sens est considérée comme conservatrice si l'acide aminé formé via la mutation a des propriétés similaires à celui qui était censé être formé à la place. Il est dit non conservateur si l'acide aminé a des propriétés différentes de la structure et de la fonction d'une protéine.

Silencieux

Dans une mutation silencieuse, un nucléotide est substitué mais le même acide aminé est produit de toute façon. Cela peut se produire car plusieurs codons peuvent coder pour le même acide aminé. Par exemple, TTA et CTA codent tous deux pour la leucine, donc si le premier T est remplacé par un C, le même acide aminé se formera et la protéine ne sera pas affectée.

Effacement

Une mutation par délétion est une erreur dans le processus de réplication de l'ADN qui supprime les nucléotides du génome. Une mutation par délétion peut éliminer un seul nucléotide ou des séquences entières de nucléotides. L'effet de la mutation par délétion sera déterminé par l'endroit où elle se produit dans le gène et par le nombre de nucléotides supprimés. Le code génétique est lu en triplets par des enzymes productrices de protéines. Si trois nucléotides ou plus sont perdus dans un gène, des acides aminés entiers peuvent être absents de la protéine créée, ce qui peut avoir de graves effets fonctionnels. La perte d'un seul nucléotide n'est souvent pas meilleure, car une mutation par décalage de cadre peut se produire. Une mutation de décalage de cadre déplace le gène entier et modifie tous les codons triplets d'origine. Une mutation de ce type peut amener un gène à produire un gène complètement non fonctionnel.