Descomposición de cadenas de caracteres
Examine las frecuencias de codones (grupos de nucleótidos consecutivos) en la lista de nucleótidos de un gen.
Obtenga la secuencia de ADN de un gen humano "SCNN1A".
In[1]:=
![Click for copyable input](assets.es/string-decomposition/In_9.png)
dnasequence = GenomeData["SCNN1A", "FullSequence"];
Use StringPartition para construir la correspondiente lista de codones.
In[2]:=
![Click for copyable input](assets.es/string-decomposition/In_10.png)
codons = StringPartition[dnasequence, 3];
In[3]:=
![Click for copyable input](assets.es/string-decomposition/In_11.png)
Take[codons, 10]
Out[3]=
![](assets.es/string-decomposition/O_8.png)
Calcule la frecuencia relativa de cada codón en este gen.
In[4]:=
![Click for copyable input](assets.es/string-decomposition/In_12.png)
frequencies = N[Counts[codons]/Length[codons]];
Existen 64 posibles codones formados a partir de los nucleótidos A, C, G, T, y aparecen en el gen seleccionado.
In[5]:=
![Click for copyable input](assets.es/string-decomposition/In_13.png)
frequencies // Length
Out[5]=
![](assets.es/string-decomposition/O_9.png)
Encuentre los tres codones con las frecuencias más altas.
In[6]:=
![Click for copyable input](assets.es/string-decomposition/In_14.png)
TakeLargest[frequencies, 3]
Out[6]=
![](assets.es/string-decomposition/O_10.png)
Encuentre los tres codones con las frecuencias más bajas.
In[7]:=
![Click for copyable input](assets.es/string-decomposition/In_15.png)
TakeSmallest[frequencies, 3]
Out[7]=
![](assets.es/string-decomposition/O_11.png)
Visualice todas las frecuencias en un Grid.
muestre la entrada completa de Wolfram Language
Out[8]=
![](assets.es/string-decomposition/O_12.png)