Examine as características de idiomas, alfabetos, e sistemas de escrita
A versão 11 disponibiliza acesso ao amplo conhecimento integrado de idiomas, sistemas de escrita, e alfabetos.
Idiomas diferentes podem compartilhar o mesmo sistema de escrita, mas usam alfabetos com diferentes caracteres. Este exemplo explora a grande variabilidade no número de caracteres nos idiomas usando o sistema de escrita latino.
Pegue a lista de alfabetos que utilizam o sistema de escrita latino.
![Click for copyable input](assets.pt-br/examine-characteristics-of-languages-alphabets-and/In_57.png)
alphabets =
EntityList[
EntityClass["Alphabet",
"WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];
![Click for copyable input](assets.pt-br/examine-characteristics-of-languages-alphabets-and/In_58.png)
Length[alphabets]
![](assets.pt-br/examine-characteristics-of-languages-alphabets-and/O_39.png)
Existem 131 alfabetos desse tipo. Mostre uma pequena amostra deles.
![Click for copyable input](assets.pt-br/examine-characteristics-of-languages-alphabets-and/In_59.png)
RandomSample[alphabets, 15]
![](assets.pt-br/examine-characteristics-of-languages-alphabets-and/O_40.png)
Construia uma associação armazenando a lista de caracteres de cada alfabeto.
![Click for copyable input](assets.pt-br/examine-characteristics-of-languages-alphabets-and/In_60.png)
letters =
EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];
O alfabeto mais curto é o Mohawk, com 12 letras.
![Click for copyable input](assets.pt-br/examine-characteristics-of-languages-alphabets-and/In_61.png)
letters[Entity["Alphabet", "Mohawk::p8wq4"]]
![](assets.pt-br/examine-characteristics-of-languages-alphabets-and/O_41.png)
O alfabeto mais longo é o eslovaco, com 46 caracteres.
![Click for copyable input](assets.pt-br/examine-characteristics-of-languages-alphabets-and/In_62.png)
letters[Entity["Alphabet", "Slovak::kj62d"]]
![](assets.pt-br/examine-characteristics-of-languages-alphabets-and/O_42.png)
Este histograma mostra que a quantidade mais comum é de 26 letras, como o inglês, embora nem todos oscalfabetos de 26 letras contêm as mesmas letras.
![Click for copyable input](assets.pt-br/examine-characteristics-of-languages-alphabets-and/In_63.png)
Histogram[Length /@ letters, 30]
![](assets.pt-br/examine-characteristics-of-languages-alphabets-and/O_43.png)
Agora, conte o número de alfabetos em que uma determinada letra está presente. Apenas três letras estão presentes em todos os 131 alfabetos latinos: a, i, n.
![Click for copyable input](assets.pt-br/examine-characteristics-of-languages-alphabets-and/In_64.png)
TakeLargest[Counts[Flatten[Values[letters]]], 10]
![](assets.pt-br/examine-characteristics-of-languages-alphabets-and/O_44.png)
Mohawk não contém a letra m, e o alfabeto havaiano é o único que não possui t.
![Click for copyable input](assets.pt-br/examine-characteristics-of-languages-alphabets-and/In_65.png)
letters[Entity["Alphabet", "Hawaiian::p38r5"]]
![](assets.pt-br/examine-characteristics-of-languages-alphabets-and/O_45.png)