Frecuencia de nombre comunes en discursos
Use TextCases para extraer subcadenas de caracteres de una forma dada, por ejemplo verbos, así como países, correos electrónicos y muchas otras cosas.
Recupere un conjunto de datos de todos los discursos dados por los presidentes de EE.UU. durante las sesiones conjuntas con el Congreso de los Estados Unidos.
![Click for copyable input](assets.es/frequency-of-common-nouns-in-speeches/In_81.png)
data = ResourceData["State of the Union Addresses"];
Reduzca el tamaño del conjunto de datos conservando solamente los nombres de los presidentes, años de los discursos y los textos de los discursos.
![Click for copyable input](assets.es/frequency-of-common-nouns-in-speeches/In_82.png)
reduceddata = data[All, {"President", "Year", "Text"}];
Tome una muestra de discursos en intervalos de 10 años.
![Click for copyable input](assets.es/frequency-of-common-nouns-in-speeches/In_83.png)
years = Range[1965, 2015, 10];
speeches = Select[reduceddata, MemberQ[years, #Year] &]
![](assets.es/frequency-of-common-nouns-in-speeches/O_57.png)
Use TextCases para identificar los sustantivos en cada discurso.
![Click for copyable input](assets.es/frequency-of-common-nouns-in-speeches/In_84.png)
nouns = TextCases[Normal@speeches[All, "Text"], "Noun"];
Cuente las instancias de todos los sustantivos distintos en cada discurso.
![Click for copyable input](assets.es/frequency-of-common-nouns-in-speeches/In_85.png)
freqnouns = Counts /@ nouns;
Ignore algunas palabras que son muy comunes en la mayoría de los años.
![Click for copyable input](assets.es/frequency-of-common-nouns-in-speeches/In_86.png)
freqnouns =
KeyDrop[freqnouns, {"country", "people", "year", "years", "world"}];
Genere nubes de palabras mostrando la frecuencia de sustantivos en el tiempo.
![](assets.es/frequency-of-common-nouns-in-speeches/O_58.png)