어간 생성 및 증명
버전 11은 단어의 어간을 찾고, 복수형, 어형 변화 등을 제거하는 새로운 도구를 포함하고 있습니다. 단어의 어간은 그 본래의 의미를 가지고 있지만, 그 자체가 사전에 포함되어 있지 않은 경우를 흔히 볼 수 있습니다. 이 예에서는 그 두 경우를 살펴봅니다.
RandomWord를 사용하여 임의의 영어 단어 30개의 목록을 생성합니다.
In[1]:=
![Click for copyable input](assets.ko/generate-and-verify-stemmed-words/In_64.png)
Short[words = RandomWord[30]]
Out[1]//Short=
![](assets.ko/generate-and-verify-stemmed-words/O_49.png)
WordStem을 사용하여 각 단어의 어간을 구축합니다.
In[2]:=
![Click for copyable input](assets.ko/generate-and-verify-stemmed-words/In_65.png)
Short[wordstems = WordStem[words]]
Out[2]//Short=
![](assets.ko/generate-and-verify-stemmed-words/O_50.png)
어간과 형태가 동일한 단어를 삭제합니다.
In[3]:=
![Click for copyable input](assets.ko/generate-and-verify-stemmed-words/In_66.png)
list = DeleteCases[Transpose[{words, wordstems}], {w_, w_}];
새로운 함수 DictionaryWordQ에서 사용되고 영어 사전에 있는 단어이기도 한 어간을 파란색으로 강조합니다.
In[4]:=
![Click for copyable input](assets.ko/generate-and-verify-stemmed-words/In_67.png)
list = Replace[
list, {w_, sw_?DictionaryWordQ} :> {w, Style[sw, Blue]}, {1}];
각 쌍을 텍스트 그리드로 시각화합니다.
전체 Wolfram 언어 입력 표시하기
Out[5]=
![](assets.ko/generate-and-verify-stemmed-words/O_51.png)