Häufigkeit von Nomen in Reden
Extrahieren Sie mit TextCases Teilstrings einer bestimmten Wortart, z.B. Nomen oder Verben, aber auch Länder, E-Mailadressen etc.
Erstellen Sie einen Datensatz aller Reden, die je von US-Präsidenten vor dem US-Kongress gehalten wurden.
In[1]:=
![Click for copyable input](assets.de/frequency-of-common-nouns-in-speeches/In_81.png)
data = ResourceData["State of the Union Addresses"];
Reduzieren Sie die Größe des Datensatzes, indem Sie nur die Namen der Präsidenten, Jahreszahlen der Reden und Text der Reden berücksichtigen.
In[2]:=
![Click for copyable input](assets.de/frequency-of-common-nouns-in-speeches/In_82.png)
reduceddata = data[All, {"President", "Year", "Text"}];
Beschränken Sie sich auf Reden in 10-Jahres-Intervallen.
In[3]:=
![Click for copyable input](assets.de/frequency-of-common-nouns-in-speeches/In_83.png)
years = Range[1965, 2015, 10];
speeches = Select[reduceddata, MemberQ[years, #Year] &]
Out[3]=
![](assets.de/frequency-of-common-nouns-in-speeches/O_57.png)
Identifizieren Sie mit TextCases die Nomen in jeder Rede.
In[4]:=
![Click for copyable input](assets.de/frequency-of-common-nouns-in-speeches/In_84.png)
nouns = TextCases[Normal@speeches[All, "Text"], "Noun"];
Zählen Sie, wie oft die unterschiedlichen Nomen pro Rede vorkommen.
In[5]:=
![Click for copyable input](assets.de/frequency-of-common-nouns-in-speeches/In_85.png)
freqnouns = Counts /@ nouns;
Ignorieren Sie Wörter, die in den meisten Reden sehr oft vorkommen.
In[6]:=
![Click for copyable input](assets.de/frequency-of-common-nouns-in-speeches/In_86.png)
freqnouns =
KeyDrop[freqnouns, {"country", "people", "year", "years", "world"}];
Generieren Sie Schlagwortwolken zur Veranschaulichung der Häufigkeit bestimmter Nomen im Lauf der Zeit.
Den kompletten Wolfram Language-Input zeigen
Out[7]=
![](assets.de/frequency-of-common-nouns-in-speeches/O_58.png)