Cree un corpus de Shakespeare con FileSystemScan
Para este ejemplo, un directorio es utilizado incluyendo archivos de texto de todas las obras de Shakespeare. Comience por importar el contenido textual de los libros con FileSystemMap, recolectando solamente el contenido textual.
muestre la entrada completa de Wolfram Language
In[2]:=
![Click for copyable input](assets.es/create-a-shakespearean-corpus-with-filesystemscan/In_67.png)
works = Values[
FileSystemMap[Import, FileNameJoin[{$HomeDirectory, "Books"}], 2,
FileNameForms -> "*.txt"][[1]]]
Out[2]=
![](assets.es/create-a-shakespearean-corpus-with-filesystemscan/O_51.png)
Construya un único corpus usando StringJoin.
In[3]:=
![Click for copyable input](assets.es/create-a-shakespearean-corpus-with-filesystemscan/In_68.png)
corpus = StringJoin[works]
Out[3]=
![](assets.es/create-a-shakespearean-corpus-with-filesystemscan/O_52.png)
El corpus ahora puede ser tratado como una sola cadena de caracteres de búsqueda, permitiendo el uso de aplicaciones avanzadas de procesamiento de texto de forma trivial. Determine de cuales países se hace referencia en estas obras usando TextCases, mientras filtra los duplicados y problemas de envoltura.
In[4]:=
![Click for copyable input](assets.es/create-a-shakespearean-corpus-with-filesystemscan/In_69.png)
countries =
ToLowerCase[TextCases[corpus, "Country"]] // DeleteDuplicates
Out[4]=
![](assets.es/create-a-shakespearean-corpus-with-filesystemscan/O_53.png)
muestre la entrada completa de Wolfram Language
Construya un GeoListPlot de los países a los que se refiere en las obras de Shakespeare.
In[6]:=
![Click for copyable input](assets.es/create-a-shakespearean-corpus-with-filesystemscan/In_71.png)
GeoListPlot[Interpreter["Country"] /@ countries]
Out[6]=
![](assets.es/create-a-shakespearean-corpus-with-filesystemscan/O_54.png)