Computação com listas de palavras multilíngues
Compare a distrubuição de números de caracteres por palavras em diferentes idiomas.
In[1]:=
![Click for copyable input](assets.pt-br/computation-with-multilingual-word-lists/In_43.png)
languages = {"German", "English", "Italian", "Dutch", "Russian"};
Obtenha a lista disponível de palavras desses idiomas e agrupe-as em uma associação.
In[2]:=
![Click for copyable input](assets.pt-br/computation-with-multilingual-word-lists/In_44.png)
words = Association[# -> WordList[Language -> #] & /@ languages];
Calcule o comprimento de cada uma dessas palavras.
In[3]:=
![Click for copyable input](assets.pt-br/computation-with-multilingual-word-lists/In_45.png)
wordLengths = StringLength /@ words;
Estes são os comprimentos mínimos e máximos.
In[4]:=
![Click for copyable input](assets.pt-br/computation-with-multilingual-word-lists/In_46.png)
MinMax /@ wordLengths
Out[4]=
![](assets.pt-br/computation-with-multilingual-word-lists/O_36.png)
Mostre histogramas sobrepostos de frequências relativas em cada idioma. Russo e inglês tem uma fração maior de palavras curtas, enquanto holandês e alemão tem a fração maior de palavras mais longas.
In[5]:=
![Click for copyable input](assets.pt-br/computation-with-multilingual-word-lists/In_47.png)
Histogram[wordLengths, Automatic, "PDF", ChartLegends -> Automatic]
Out[5]=
![](assets.pt-br/computation-with-multilingual-word-lists/O_37.png)
Combine os histogramas para mostrar a contagem total de comprimento para os todos os idiomas juntos.
In[6]:=
![Click for copyable input](assets.pt-br/computation-with-multilingual-word-lists/In_48.png)
Histogram[wordLengths, ChartLegends -> Automatic,
ChartLayout -> "Stacked"]
Out[6]=
![](assets.pt-br/computation-with-multilingual-word-lists/O_38.png)