Skip to main content


Zutaten: Zucker, Kakaomasse (50%), Milchzucker, Weizenmehl, Vollmilchpulver, Magermilchpulver, Butterreinfett, Sahnepulver, Butter (1,4%)
Kann Spuren von Analysis und Geometrie enthalten.

57-titel-wall

Wie man mit Matrizen Effi Briest besser versteht

Heute ist der schönste Vorfrühlingstag in Lippe, Sonnenschein und 15° C. Paula und Rike treffen sich am Wall bei den Begaterassen. Paula soll heute ihre überarbeitete Hausarbeit zurückbekommen.

Paula Hi Rike! Komm, wir setzen uns hier hin. Ich habe einen Vorschlag von Herrn Grimm.

Rike Jaaaa?

Paula Er fand meine Arbeit bis jetzt ganz gut. Ob wir beide die Arbeit nicht noch erweitern wollen? Wir sollen nicht nur die Wörter zählen, sondern auch ihre Bedeutungen aus dem Zusammenhang in Effi Briest benutzen.

Rike OK

Dornseiff-Bedeutungsgruppen

Paula Herr Grimm hat gesagt, solche Bedeutungen wurden schon mal klassifiziert, das sind die Dornseiff-Bedeutungsgruppen.

Rike Ok, wart mal, ich schau mal. Ja, Dornseiff-Bedeutungsgruppen, hat die Uni Leipzig gelistet. Aber wo fangen wir an?

Paula Herr Grimm hat vorgeschlagen, vielleicht mit Effis Schwangerschaft das mal zu testen.

Rike Ok, gute Idee. Kannst Du das mal raussuchen?

Paula Klar, am besten digital, hier steht's. Fontane und Effi sagen so zu ihrer Schwangerschaft

  1. “... ich ja noch lange … auf das frohe Ereignis zu warten habe”
  2. “erwarte nun bald ein Kleines”
  3. “was ihr so bevorstehe”
  4. “was sie bei dem, was ihr bevorstände”
  5. “was ihr persönlich bevorstand”
  6. “bevorstehendes Ereignis”

Rike Hey, das ist aus mathematischer Sicht sehr interessant! Ich habe ein paar mathematisch-linguistische Untersuchungen gelesen, vielleicht testen wir mal das semantische Vektorraummodell.

Paula Was testen wir?

Rike Na, das semantische Vektorraummodell und dann schauen wir, ob wir sprachliche Strukturen in Effi Briest entdecken.

Paula Ich weiß nicht, was das ist, und ob Herr Grimm das gemeint hat. Wie geht das?

Grundbegriffe des semantischen Vektorraummodells

Rike Das geht so:  Zuerst fassen wir ähnliche Wörter zusammen. Mathematisch sind das Äquivalenzklassen, sprachwissenschaftlich sind das Lexeme. Wir nehmen Dein 1. Zitat und nehmen das Lexem WARTEN für warte, warten, wartete usw. Welche Bedeutung hat es?

Paula Die Dornseiff-Gruppen dazu sind:

  1. unentschlossen sein
  2. untätig sein
  3. vorsichtig sein
  4. erwarten/Erwartung

und noch ein paar andere, die bei uns nicht zutreffen. Im 1. Zitat meint Fontane erwarten, würde ich denken.

1. Beispiel (N=M=1)

Rike Ok, dann haben wir die Abbildung:

WARTEN \(\rightarrow\) erwarten

Wenn jetzt in einem Text jedes Mal das Lexem WARTEN im Sinne von erwarten benutzt wird, hätten wir eine 1:1-Abbildung.

57_wort-sinn-matrix_02_02

Paula Klar!

Rike Jetzt verallgemeinern wir das etwas:

Das Vektorraummodell

Und zwar nummerieren wir die Wörter (Lexeme) nach einem festen Schema durch, und bilden so eine Menge \({\cal W}\) der Wortklassen (Lexeme)  \(w^{(i)}\)

\({\cal W} = \{w^{(i)}\} = \{1,2,3,4,\dots, M\}\),

ebenso die Kontexte \(c^{(j)}\):

\({\cal C} = \{c^{(j)}\} = \{1,2,3,4,\dots, N\}\),

Wir könnten das erste Wort

\(w^{(1)} = 1\)

auch als Vektor

\(w^{(1)} = (1,0,0,\dots)\)

schreiben, das 2. Wort

\(w^{(2)} = 2\)

auch als

\(w^{(2)} = (0,1,0,\dots)\).

Und ebenso die Kontexte. Wir interpretieren \({\cal W}\) und \({\cal C}\) als lineare Vektorräume und finden eine lineare Abbildung

\(P: {\cal W} \rightarrow {\cal C}\).

Paula Mach noch mal ein kleines Beispiel.

2. Beispiel (N=M=2)

Rike Wir nehmen jetzt noch 'mal Dein 1. Zitat. Ich meine, Fontane meint statt WARTEN: ein Kind bekommen, was wir auch mit Geburt bezeichnen können.

Paula Ok, also

WARTEN \(\rightarrow\) Geburt

Rike Kommt denn das Wort GEBURT (und die Wörter, die zu dem Lexem gehören) gar nicht in Effi Briest vor?

Paula Es gibt nur einmal das Wort GEBURT, hier: “Dieses Sofa nämlich, dessen Geburt um wenigstens 50 Jahre zurückliegt,...”

Rike Ehrlich, das ist ja cool! Ein Sofa wird ja kaum geboren, was haben wir denn für eine geeignete Dornseiff-Gruppe?

Paula Ich würde sagen, im Sinne von beginnen.

GEBURT \(\rightarrow\)  beginnen

Rike Ok, dann nehmen wir die folgende Zuordnung

Nummer \(i\) bzw. \(j\)Wort \(w^{(i)}\)Kontext\(c^{(j)}\)
\(1\)GEBURT(1,0)Geburt(1,0)
\(2\)WARTEN(0,1)beginnen(0,1)

Die Wort-Kontext-Matrix \(P\) für GEBURT und WARTEN

Jetzt erstellen wir die Matrix \(P\)

\(P =(p_{ij})\)

(, das kommt von Probability) und meint, dass wir in der \(i\)-ten Zeile und \(j\)-ten Spalte die Häufigkeit des Wortes \(w^{(i)}\) im Sinne \(c^{(j)}\) für einen gegebenen Text notieren.

Paula Hmmm

Rike Nehmen wir nur das 1. Zitat und das Sofa-Geburt-Zitat. So haben wir darin das 1. Wort GEBURT  kein Mal im Sinne von Geburt und einmal im Sinne von beginnen. Das zweite Wort WARTEN haben wir 1 mal im Sinne von Geburt und kein mal im Sinne von Warten. Und dann ist

martix p 2x2

und

formel_p_2

\(P: w^{(1)} \rightarrow c^{(2)}\)

Und das 2. Wort:

formel_p_3

\(P: w^{(2)} \rightarrow c^{(1)}\)

Paula \(P\) bildet das 1. Wort auf den 2. Kontext ab und das 2. Wort auf den 1. Kontext?

Rike Dieses P “vertauscht”, könnte man sagen!

57_wort-sinn-matrix_01

Paula Das ist bestimmt kein Zufall! Lass uns noch mehr anschauen! Vielleicht finden wir noch was Interessantes!

3. Beispiel (Geburt bei Effi Briest)

Rike Ja, klar. Lass uns die Idee von Herrn Grimm aufgreifen, wir nehmen die Lexeme im Zusammenhang von Geburt und stellen denen alle möglichen Kontexte gegenüber. Für das WARTEN lass uns jetzt alle Kontexte von oben nehmen. Außerdem haben wir aus Deinen Zitaten  3-6:

  • bevorstehe
  • bevorstände
  • bevorstand
  • bevorstehendes,

also ein Lexem

BEVORSTEHEN.

Paula OK

Rike Welche Bedeutungen gibt es dazu?

Paula BEVORSTEHEN hat die Dornseiff-Gruppen

  1. Zukunft
  2. baldige Zukunft

Bei beiden steht bevorstehen als Beispiel, es ist wohl für uns kaum zu trennen.

Rike Hmmm, ok, wir schauen, wie es im gesamten Text benutzt wird.

Paula Ja.

Rike Die 3 Lexeme sind noch etwas wenig für Herrn Grimm, hmm, … und wie nennt Fontane den Tag der Geburt?

Paula  Wart mal, hier: “... Den 9. Tag aber war es mit Plaudern und Gemütlichkeit vorbei; da gab es ein Laufen und Rennen.”

Rike  Ein Laufen und Rennen? Boah! Welche Dornseiff-Gruppen haben LAUFEN und RENNEN?

Paula Geeignet sind

  • Für LAUFEN:
    sich beeilen, sich fortbewegen, schnell sein, schnell laufen, gehen lassen/gleichgültig sein
  • Für RENNEN:
    sich beeilen, sich fortbewegen,  schnell sein, schnell rennen, sich bemühen

Rike Und dann haben wir noch ERWARTEN, Dein 2. Zitat für Geburt.

Paula Da haben wir die Bedeutungen

Vermutung, Zukunft, Erwartung

Rike Dann stellen wir jetzt unsere Liste der Wörter und Kontexte zum Thema Geburt bei Effi Briest auf:

 

\( i, j\)Wörter Kontexte
\(1\)GEBURTGeburt
\(2\)WARTENbeginnen
\(3\)BEVORSTEHENZukunft
\(4\)LAUFENbaldige Zukunft
\(5\)RENNENsich beeilen
\(6\)ERWARTENsich fortbewegen
\(7\)schnell sein
\(8\)schnell laufen
\(9\)gleichgültig sein
\(10\)schnell rennen
\(11\)sich bemühen
\(12\)Vermutung
\(13\)Erwartung
\(14\)unentschlossen sein
\(15\)untätig sein
\(16\)vorsichtig sein

 

Die Wort-Kontext-Matrix \(P\) für GEBURT, WARTEN, BEVORSTEHEN,...

Paula Fontane hat ja viel mehr Bedeutungen als Wörter! Das gibt ja eine große Matrix \(P\).

Rike Ja,

\(P: {\mathbf R}^6 \rightarrow {\mathbf R}^{16}\).

Paula Vom 6-dimensionalen in den 16-dimensionalen Vektorraum?

Rike Ja! Jetzt müssen wir zu jedem Wort entscheiden, in welchem Kontext es benutzt wird. Das können wir elektronisch gut finden und entscheiden es zusammen.

Paula Ok, hier habe ich GEBURT beim Sofa, nur im Sinne von beginnen.

Rike Ja, in der 1. Zeile von \(P\) steht an der 2. Stelle eine 1.

Paula WARTEN kommt häufiger vor, Moment, das muss ich es suchen...

formel_p_matrix_01

Paula Welche Info kriegen wir nun aus der Matrix?

57_wort-sinn-matrix_03

Fazit

Rike  Wie Du schon gesagt hast, benutzt Fontane wenige Wörter und bekommt dennoch viele Bedeutungen, wie haben ein Verhältnis von 6:16. Oftmals sind die Bedeutungen nicht die, die naheliegend wären, Geburt wird nicht im Sinne von Geburt verwendet, und um Geburt zu sagen, werden andere Wörter verwendet.

Paula Stimmt, das lässt viel Interpretation zu!  Hey, jetzt haben wir herausgefunden, wie die Interpretationen zu messen sind, und meine Freunde haben die Interpretationen aufgeschrieben.

Rike Ja. Es gibt noch etwas: Kannst Du überprüfen, ob es eine 6 x 6-Unterdeterminante von \(P\) gibt, die ungleich 0 ist? Dann hätten wir keine linearen Abhängigkeiten. Wenn doch, dann finden wir eine Redundanz.

Paula Danke, Rike, das schaffe ich, mal sehen, was Herr Grimm zu diesem semantischen Vektorraummodell meint!

* * *

Übungsaufgaben

  1. Bestimme den Rang von \(P\)!
  2. Finde weitere Wort-Kontext-Listen für Effi Briest und stelle die Wort-Kontext-Matrix \(P\) dafür auf!

Lösungen

  1. 6