Décomposition des chaînes de caractères
Examinez les fréquences de codons (groupes de trois nucléotides consécutifs) dans la liste des nucléotides d'un gène.
Obtenez la séquence d'ADN du gène humain "SCNN1A".
In[1]:=
![Click for copyable input](assets.fr/string-decomposition/In_9.png)
dnasequence = GenomeData["SCNN1A", "FullSequence"];
Utilisez StringPartition pour construire la liste correspondante de codons.
In[2]:=
![Click for copyable input](assets.fr/string-decomposition/In_10.png)
codons = StringPartition[dnasequence, 3];
In[3]:=
![Click for copyable input](assets.fr/string-decomposition/In_11.png)
Take[codons, 10]
Out[3]=
![](assets.fr/string-decomposition/O_8.png)
Calculez la fréquence relative de chaque codon dans ce gène.
In[4]:=
![Click for copyable input](assets.fr/string-decomposition/In_12.png)
frequencies = N[Counts[codons]/Length[codons]];
Il existe 64 codons possibles formés à partir des nucléotides A, C, G, T et ils apparaissent tous dans le gène choisi.
In[5]:=
![Click for copyable input](assets.fr/string-decomposition/In_13.png)
frequencies // Length
Out[5]=
![](assets.fr/string-decomposition/O_9.png)
Trouvez les trois codons avec les fréquences les plus élevées.
In[6]:=
![Click for copyable input](assets.fr/string-decomposition/In_14.png)
TakeLargest[frequencies, 3]
Out[6]=
![](assets.fr/string-decomposition/O_10.png)
Trouvez les trois codons avec les fréquences les plus basses.
In[7]:=
![Click for copyable input](assets.fr/string-decomposition/In_15.png)
TakeSmallest[frequencies, 3]
Out[7]=
![](assets.fr/string-decomposition/O_11.png)
Visualisez toutes les fréquences dans une Grid.
Afficher l'entrée complète de Wolfram Language
Out[8]=
![](assets.fr/string-decomposition/O_12.png)