文字の頻度と頭文字
英語の辞書の中で,単語の頭文字として最もよく使われる文字と,単語全体で最もよく使われる文字は一致しない
よく使われる英単語のリストをWordListから取り出す.
In[1]:=
![Click for copyable input](assets.ja/frequencies-of-letters-vs-first-letters/In_26.png)
Length[words = WordList[]]
Out[1]=
![](assets.ja/frequencies-of-letters-vs-first-letters/O_21.png)
各単語の頭文字を取り出す.
In[2]:=
![Click for copyable input](assets.ja/frequencies-of-letters-vs-first-letters/In_27.png)
firstchars = StringTake[words, 1];
各文字で始まっている単語数を数える.
In[3]:=
![Click for copyable input](assets.ja/frequencies-of-letters-vs-first-letters/In_28.png)
Counts[firstchars]
Out[3]=
![](assets.ja/frequencies-of-letters-vs-first-letters/O_22.png)
WordCloudを生成して各文字の相対的な頻度を可視化する.頭文字として最もよく使われるのは,子音のs,c,p,dである.
In[4]:=
![Click for copyable input](assets.ja/frequencies-of-letters-vs-first-letters/In_29.png)
WordCloud[firstchars]
Out[4]=
![](assets.ja/frequencies-of-letters-vs-first-letters/O_23.png)
LetterCountsを使って全単語のすべての文字の相対的な頻度を計算する.
In[5]:=
![Click for copyable input](assets.ja/frequencies-of-letters-vs-first-letters/In_30.png)
allchars = LetterCounts[StringJoin[words], IgnoreCase -> True]
Out[5]=
![](assets.ja/frequencies-of-letters-vs-first-letters/O_24.png)
こうすると,最も頻度が高いのは母音のe,i,aになる.
In[6]:=
![Click for copyable input](assets.ja/frequencies-of-letters-vs-first-letters/In_31.png)
WordCloud[allchars]
Out[6]=
![](assets.ja/frequencies-of-letters-vs-first-letters/O_25.png)