Fréquence des noms communs dans les discours
Utilisez TextCases pour extraire des sous-chaînes d'une forme donnée, par exemple des noms ou des verbes, ainsi que des pays, des adresses e-mail et bien d'autres choses.
Récupérez un jeu de données contenant tous les discours prononcés par les présidents américains lors des réunions conjointes du Congrès des États-Unis.
![Click for copyable input](assets.fr/frequency-of-common-nouns-in-speeches/In_81.png)
data = ResourceData["State of the Union Addresses"];
Réduisez la taille du jeu de données en ne conservant que les noms des présidents, les années des discours et les textes des discours.
![Click for copyable input](assets.fr/frequency-of-common-nouns-in-speeches/In_82.png)
reduceddata = data[All, {"President", "Year", "Text"}];
Prenez un échantillon des discours à des intervalles de 10 ans.
![Click for copyable input](assets.fr/frequency-of-common-nouns-in-speeches/In_83.png)
years = Range[1965, 2015, 10];
speeches = Select[reduceddata, MemberQ[years, #Year] &]
![](assets.fr/frequency-of-common-nouns-in-speeches/O_57.png)
Utilisez TextCases pour identifier les noms dans chaque discours.
![Click for copyable input](assets.fr/frequency-of-common-nouns-in-speeches/In_84.png)
nouns = TextCases[Normal@speeches[All, "Text"], "Noun"];
Comptez les occurrences de tous les noms distincts dans chaque discours.
![Click for copyable input](assets.fr/frequency-of-common-nouns-in-speeches/In_85.png)
freqnouns = Counts /@ nouns;
Ignorez certains mots qui sont très courants dans la plupart des années.
![Click for copyable input](assets.fr/frequency-of-common-nouns-in-speeches/In_86.png)
freqnouns =
KeyDrop[freqnouns, {"country", "people", "year", "years", "world"}];
Générez des nuages de mots indiquant la fréquence des noms à travers le temps.
![](assets.fr/frequency-of-common-nouns-in-speeches/O_58.png)