Le 30 décembre 1961, Crick et ses collaborateurs font paraître un article dans la revue Nature, intitulé "General nature of the genetic code for proteins".
Source : https://geneticliteracyproject.org/2013/12/19/how-much-information-about-your-genetic-code-is-too-much/
Les acides aminés sont utilisés par les cellules pour fabriquer leurs protéines. La "recette" (ou "plan de montage") d'une protéine donnée est codée sur un gène dans la séquence de nucléotides du brin transcrit de l'ADN puis sur l'ARNm après la transcription.
On peut donc considérer cette deuxième étape de l'expression de l'information génétique comme la traduction de la "langue ARNm" vers la "langue protéine".
Or la "langue ARN" possède un "alphabet" de quatre "lettres" (A, U, C, G). Est-il alors possible d'écrire vingt mots différents (les 20 acides aminés) avec seulement 4 lettres ?
Piste d'exploitation
La longueur (= nombre de nucléotides) du codon a été déterminée grâce à des expériences de mutagenèse, dans lesquelles on a successivement ajouté 1, 2 puis 3 nucléotides à un gène donné. On observait ensuite l'effet sur ce gène en vérifiant si la cellule produisait normalement la protéine correspondante.
Avec l'addition de 1 ou 2 nucléotides, la protéine correspondante n'était plus produite (l'information portée par le gène était perdue), alors que l'addition de 3 nucléotides n'empêchait pas la synthèse de la protéine.
Ce document illustre les expériences ayant permis de déterminer le nombre minimal de "lettres" constituant un codon d'une information génétique.
Source : "General nature of the genetic code for proteins" (Nature) - voir aussi "Findings May Speed Solution to Genetic Code" (The Marshall W. Nirenberg Papers)
Ceci est la reproduction du schéma de Crick par Nirenberg, cliquer pour voir le schéma original.
Piste d'exploitation
Pour prouver l'hypothèse, on peut prendre l'exemple d'un message dont les mots seraient composés de 4 lettres (on peut choisir un autre nombre de lettres, le raisonnement serait le même, mais le résultat différent).
Prenons un exemple de message en français formé de trois mots de quatre lettres : "fred gite fort".
- Si j'ajoute une lettre en début de message (a par exemple), il devient : "afre dgit efor t", ce qui ne veut plus rien dire !
- Si j'ajoute 2 lettres : "aafr edgi tefo rt". Aucun sens…
- Si j'ajoute 3 lettres : "aaaf redg itef ort". Aucun sens…
- Si j'ajoute 4 lettres : "aaaa fred gite fort". Le message est à nouveau compréhensible. Pourquoi ? Dans l'expérience de Crick, c'est en ajoutant 3 nucléotides que le message redevient compréhensible (pour la cellule) : cela montre quoi ?