Изучение характеристик языков, алфавитов и письменностей
Версия 11 предоставляет доступ к обширному встроенному знанию о языках, письменностях и алфавитах.
Различные языки могут разделять одну и ту же письменность (письменную систему), но в то же время использовать разные алфавитные знаки. Данный пример демонстрирует большое разнообразие в количестве письменных знаков в языках, которые используют латиницу.
Составить список алфавитов, которые используют латиницу.
![Click for copyable input](assets.ru/examine-characteristics-of-languages-alphabets-and/In_57.png)
alphabets =
EntityList[
EntityClass["Alphabet",
"WritingScripts" -> Entity["WritingScript", "Latin::6tr5q"]]];
![Click for copyable input](assets.ru/examine-characteristics-of-languages-alphabets-and/In_58.png)
Length[alphabets]
![](assets.ru/examine-characteristics-of-languages-alphabets-and/O_39.png)
Всего 131 таких алфавита. Показать некоторые из них.
![Click for copyable input](assets.ru/examine-characteristics-of-languages-alphabets-and/In_59.png)
RandomSample[alphabets, 15]
![](assets.ru/examine-characteristics-of-languages-alphabets-and/O_40.png)
Создать ассоциацию, содержащую список всех знаков каждого алфавита.
![Click for copyable input](assets.ru/examine-characteristics-of-languages-alphabets-and/In_60.png)
letters =
EntityValue[alphabets, "CommonAlphabet", "EntityAssociation"];
Самый короткий алфавит, могавк, содержит всего 12 букв.
![Click for copyable input](assets.ru/examine-characteristics-of-languages-alphabets-and/In_61.png)
letters[Entity["Alphabet", "Mohawk::p8wq4"]]
![](assets.ru/examine-characteristics-of-languages-alphabets-and/O_41.png)
Самый длинный алфавит, словацкий, содержит 46 букв.
![Click for copyable input](assets.ru/examine-characteristics-of-languages-alphabets-and/In_62.png)
letters[Entity["Alphabet", "Slovak::kj62d"]]
![](assets.ru/examine-characteristics-of-languages-alphabets-and/O_42.png)
Данная гистограмма показывает, что самая частая длина алфавита - 26 букв, как, например, в английском языке, хотя не все алфавиты с 26 буквами имеют одинаковые буквы.
![Click for copyable input](assets.ru/examine-characteristics-of-languages-alphabets-and/In_63.png)
Histogram[Length /@ letters, 30]
![](assets.ru/examine-characteristics-of-languages-alphabets-and/O_43.png)
Сосчитать, сколько алфавитов содержат заданную букву. Только три буквы присутствуют во всех 131 алфавитах, а именно a, i, n.
![Click for copyable input](assets.ru/examine-characteristics-of-languages-alphabets-and/In_64.png)
TakeLargest[Counts[Flatten[Values[letters]]], 10]
![](assets.ru/examine-characteristics-of-languages-alphabets-and/O_44.png)
В языке могавк нет буквы m, а гавайский язык является единственным, в котором нет буквы t.
![Click for copyable input](assets.ru/examine-characteristics-of-languages-alphabets-and/In_65.png)
letters[Entity["Alphabet", "Hawaiian::p38r5"]]
![](assets.ru/examine-characteristics-of-languages-alphabets-and/O_45.png)