문자열 분해
유전자의 염기 목록의 코돈 (연속 3개의 뉴클레오티드 그룹)의 상대 빈도를 조사합니다.
인간 유전자 "SCNN1A"의 DNA 서열을 얻습니다.
In[1]:=
![Click for copyable input](assets.ko/string-decomposition/In_9.png)
dnasequence = GenomeData["SCNN1A", "FullSequence"];
StringPartition을 사용하여 대응하는 코돈의 목록을 구축합니다.
In[2]:=
![Click for copyable input](assets.ko/string-decomposition/In_10.png)
codons = StringPartition[dnasequence, 3];
In[3]:=
![Click for copyable input](assets.ko/string-decomposition/In_11.png)
Take[codons, 10]
Out[3]=
![](assets.ko/string-decomposition/O_8.png)
이 유전자의 각 코돈의 상대 빈도를 계산합니다.
In[4]:=
![Click for copyable input](assets.ko/string-decomposition/In_12.png)
frequencies = N[Counts[codons]/Length[codons]];
A, C, G, T 뉴클레오티드에서 형성된 64개의 가능한 코돈이 있으며, 이들 모두는 선택한 유전자에 포함되어 있습니다.
In[5]:=
![Click for copyable input](assets.ko/string-decomposition/In_13.png)
frequencies // Length
Out[5]=
![](assets.ko/string-decomposition/O_9.png)
빈도가 가장 높은 세개의 코돈을 구합니다.
In[6]:=
![Click for copyable input](assets.ko/string-decomposition/In_14.png)
TakeLargest[frequencies, 3]
Out[6]=
![](assets.ko/string-decomposition/O_10.png)
빈도가 가장 낮은 세개의 코돈을 구합니다.
In[7]:=
![Click for copyable input](assets.ko/string-decomposition/In_15.png)
TakeSmallest[frequencies, 3]
Out[7]=
![](assets.ko/string-decomposition/O_11.png)
전체 상대 빈도를 Grid를 사용하여 시각화합니다.
전체 Wolfram 언어 입력 표시하기
Out[8]=
![](assets.ko/string-decomposition/O_12.png)