Crie um corpus de Shakespeare com FileSystemScan
Para este exemplo, um diretório é utilizado incluindo arquivos de texto de todas as obras de Shakespeare. Comece importando o conteúdo textual dos livros com FileSystemMap, coletando apenas o conteúdo textual.
mostre o input completo da Wolfram Language
In[2]:=
![Click for copyable input](assets.pt-br/create-a-shakespearean-corpus-with-filesystemscan/In_67.png)
works = Values[
FileSystemMap[Import, FileNameJoin[{$HomeDirectory, "Books"}], 2,
FileNameForms -> "*.txt"][[1]]]
Out[2]=
![](assets.pt-br/create-a-shakespearean-corpus-with-filesystemscan/O_51.png)
Construa apenas um corpus usando StringJoin.
In[3]:=
![Click for copyable input](assets.pt-br/create-a-shakespearean-corpus-with-filesystemscan/In_68.png)
corpus = StringJoin[works]
Out[3]=
![](assets.pt-br/create-a-shakespearean-corpus-with-filesystemscan/O_52.png)
O corpus pode agora ser tratado como uma única cadeia de caracteres de busca, permitindo o uso de aplicações avançadas de processamento de texto. Determine quais países são citados nestas obras usando TextCases, enquanto filtra duplicações e diferenças entre maiúsculas e minúsculas.
In[4]:=
![Click for copyable input](assets.pt-br/create-a-shakespearean-corpus-with-filesystemscan/In_69.png)
countries =
ToLowerCase[TextCases[corpus, "Country"]] // DeleteDuplicates
Out[4]=
![](assets.pt-br/create-a-shakespearean-corpus-with-filesystemscan/O_53.png)
mostre o input completo da Wolfram Language
Construa um GeoListPlot dos países citados nas obras de Shakespeare.
In[6]:=
![Click for copyable input](assets.pt-br/create-a-shakespearean-corpus-with-filesystemscan/In_71.png)
GeoListPlot[Interpreter["Country"] /@ countries]
Out[6]=
![](assets.pt-br/create-a-shakespearean-corpus-with-filesystemscan/O_54.png)