Генерирование и проверка основ слов
Версия 11 включает в себя новые инструменты для поиска основ слов, избавления от множественного числа, склонения и т.д. Основа слова всё также несёт в себе значение изначального слова, но чаще всего сама по себе не является словом из словаря.
Сгенерируйте список из 30 случайных английских слов с помощью RandomWord.
In[1]:=
![Click for copyable input](assets.ru/generate-and-verify-stemmed-words/In_64.png)
Short[words = RandomWord[30]]
Out[1]//Short=
![](assets.ru/generate-and-verify-stemmed-words/O_49.png)
Создайте их соответствующие основы слов с помощью WordStem.
In[2]:=
![Click for copyable input](assets.ru/generate-and-verify-stemmed-words/In_65.png)
Short[wordstems = WordStem[words]]
Out[2]//Short=
![](assets.ru/generate-and-verify-stemmed-words/O_50.png)
Удалите слова, которые идентичны своим основам.
In[3]:=
![Click for copyable input](assets.ru/generate-and-verify-stemmed-words/In_66.png)
list = DeleteCases[Transpose[{words, wordstems}], {w_, w_}];
Выделите синим цветом основы слов, которые также являются словами в английском словаре при помощи новой функции DictionaryWordQ.
In[4]:=
![Click for copyable input](assets.ru/generate-and-verify-stemmed-words/In_67.png)
list = Replace[
list, {w_, sw_?DictionaryWordQ} :> {w, Style[sw, Blue]}, {1}];
Визуализируйте каждую пару в текстовой сетке.
код на языке Wolfram Language целиком
Out[5]=
![](assets.ru/generate-and-verify-stemmed-words/O_51.png)