Viel
zu viel Intelligenz für echte Online-Experten
Können
Suchmaschinen denken? Können die mich überhaupt verstehen?
Was
ja für Schüler mehr oder weniger einfach ist,
ist für Suchmaschinen ganz und gar nicht so einfach.
Da muss ich jetzt mal
ein ganzes Referat loswerden zu diesem Thema. Denn in dieser Sache
wird so viel Unsinn geredet und geschrieben, dass man fast denken
könnte, das dieser Unsinn auch mittlerweile wahr geworden sein muss.
Das
Problem, Suchmaschinen sind dumm. Sie wissen gar nichts, weder Mehrzahl
noch Einzahl. Sie wissen noch nicht einmal, was "Hunde"
sein könnte. Es ist nur ein Wort ohne jede Bedeutung für die
Suchmaschinen.
Eigentlich
muss man wissenschaftlich sagen, sie sind noch nicht einmal dumm,
denn zum Dumm-Sein braucht man Intelligenz und zwar soviel, dass man
etwas für selbstverständlich halten könnte und darauf besteht,
dass es so sei, es aber gar nicht
selbstverständlich sein kann. Und das können eigentlich Menschen ganz
prima, aber Suchmaschinen eben nicht. Suchmaschinen können einen
nicht verstehen, weil sie gar nichts zum Verstehen haben, so wie ein
Stein einen nicht verstehen kann. Sie schummeln! Das aber ist
nichts Neues, das tun Menschen auch. Und je besser sie schummeln,
desto intelligenter wirken sie. Die Wissenschaft von der
Künstlichen Intelligenz ist scheinbar nichts anderes als die Wissenschaft vom
richtigen ordentlichen Schummeln.
Es
gibt jetzt zwei Möglichkeiten, die Suchmaschine schlauer zu machen,
als sie eigentlich ist:
Bei
der ersten Methode kann man ja einfach Wörter wie "Hund"
und "Hunde", ja auch
"Hündin" oder "Rüde"
und für die Spaßkekse der Deutschen Sprache sogar "Hünde"
oder politisch korrekt auch noch "HündInnen"
in die Stichwörter der Suchmaschineneinträge schreiben. Das
habe ich bereits im 1. Kapitel erklärt - Wo sucht
die Blinde Kuh überhaupt?
- was Stichwörter und Suchmaschineneinträge sind. Man müsste also
nur alle möglichen Wörter, die mit der Sache zu tun haben, in
diese Stichwörter schreiben, wenn sie nicht im Titel
(Überschrift) oder in der Beschreibung des
Suchmaschineneintrages stehen.
Das
ist aber ganz schön viel Schreibarbeit.
Die
zweite Methode ist das Automatische Ableiten und das ist
schon ein winziges kleines Stückchen "Künstliche
Intelligenz", das ich auch hier erklären kann.
Wenn
die Einträge für die Suchmaschine von Birgit fertig
geschrieben sind, dann wird alles durch ein kleines Progrämmchen
gejagt, das wir "Indexer" nennen. Vielleicht
erinnerst du dich, in der Suchmaschine sind all die Daten dieser
Einträge nachher in einer Datenbank, die wir "Index"
nannten. Daher heißt das Programm, das diese Daten da rein schiebt,
logischerweise "Indexer" und das klingt cool
English oder auch nicht.
Und
bevor nun die Daten mit dem Indexer in den Index der Suchmaschine
geschoben werden, können sie noch durch eine Reihe an
Übersetzungsprogrammen laufen. Eines davon übersetzt Wörter nach
einer Tabelle und ein paar kleinen Regeln in Mehrzahl und
Einzahl.
Dies
nur mit Regeln zu machen, ist in der Deutschen Sprache Unsinn. Die
Deutsche Sprache ist eben nicht regelmäßig, sondern voller
merkwürdiger Ausnahmen. So kann ich die Regel "Hänge
hinten immer schön ein -er für die Mehrzahlform an"
zwar verwenden. Aber das ist nicht alles, aus "Buch"
würde dann "Bucher"
werden, und was soll das heißen? Es muss ja "Bücher"
daraus werden. Also muss das Programm auch noch schauen, ob der
letzte Selbstlaut ein "a", "o"
oder "u" ist, und wenn ja, dann einen Umlaut
daraus basteln. Doch es gibt noch ein Problem, bei Englischen
Wörtern wie "Chat"
und "Homepage" oder
bei lateinischen Wörtern wie "Forum"
gelten ja gar keine deutschsprachigen Regeln, sondern die der
jeweiligen Sprache, also "hinten ein -s
für englische Mehrzahlformen". Um jetzt zu
entscheiden, welche Regel aus welcher Sprache hier angewendet werden
muss, müsste die Suchmaschine auch wissen, aus welcher Sprache das
jeweilige Suchwort ist. Was die Suchmaschine auch nicht weiß, ist,
ob es sich bei dem vorliegenden Wort nun um Einzahl oder Mehrzahl
handelt, selbst wenn die Sprache erkannt würde. Bei Wörtern wie
"Handy" dürfte eben auch das nicht so recht gelingen. In den USA heißen die Dinger
nämlich gar nicht Handy.
Auf
keinen Fall aber kann die Suchmaschine einfach so erkennen, ob es
sich bei dem Suchwort um einen Namen handelt, den viele Sachen
haben, oder um einen Namen, den eigentlich nur eine Sache haben
sollte, etwa "Spears"
von Britney Spears. Für die Suchmaschine sieht das aus wie
die Englische Mehrzahl von "Spear",
was immer das nun wieder sein soll. Sie würde gnadenlos auch
Eigennamen in Mehrzahl und Einzahl umwandeln wollen und auch Wörter
wie "Liebe" und "Himmel"
oder "Spielen" und
"Lernen". Und sie
würde aus mehreren Fenstern einfach mal ein "Fenst"
oder aus einem Fächer ein "Fach"
machen, wenn man nun nicht das Teil finden wollte, mit dem man sich
im Sommer kühle Luft zufächelt. Besonders cool sind lustige
Regeln, die aus einer Gabel "Gabeln"
machen, und aus einem Geheimnis "Geheimnisse",
oder aus einem Vater und einer Mutter "Väter"
und "Mütter", oder aus
einem Knie, nach welcher Regel auch immer, "Knie"
hervorzaubern, was man komischerweise aber dann plötzlich "kni-e"
ausspricht. Wehe dem, man schreibt es aber so. Das sind doch viel zu
viele Schummelregeln!
Du
siehst an diesen Beispielen:
So
etwas Einfaches wie die Mehrzahl für ein Wort zu bestimmen, ist
nicht immer so genau machbar für kleine dumme Suchmaschinen.
Noch
gemeiner wird das Ganze, wenn man noch mehr Sachen aus der Grammatik
können muss. Lehrer, die behaupten, das ist doch alles logisch mit
der Deutschen Sprache, haben von Logik und Sprache meist gar keine
Ahnung. Für Sprachforscher und Leute, die an künstlich
intelligenten Computern herumbasteln, ist die Deutsche Grammatik
alles andere als logisch und meist überhaupt nicht automatisch
nachvollziehbar. Das Anwenden von Regeln ist eher ein heiteres
Rätselraten bei Suchmaschinen, aber kein Wissen um Mehrzahl und
Einzahl.
Es
gibt aber wieder mal einen listigen Trick. Und den kennt auch die Blinde
Kuh.
Man
sagt der Suchmaschine eben einfach alles vor.
Und man bastelt ihr einen Schummelzettel,
einen richtig langen Schummelzettel.
In einer
Tabelle, ähnlich einer Vokabelliste, werden die meisten
Mehrzahl- und Einzahlformen von Birgit und Stefan einfach
reingeschrieben. Das geht nachher auch schneller beim Automatischen
Ableiten. Und es ist so, wenn man alles vorgesagt bekommt,
lernt man nicht wie es wirklich funktioniert. Aber bei Blinden
Kühen kann man ja mal eine Ausnahme machen, denn das Ziel ist
es nicht, Deutsch zu können wie ein Weltmeister, sondern
möglichst oft zu erkennen, wonach Kinder suchen. |
| Einzahl |
Mehrzahl |
| Tier |
Tiere |
| Hund |
Hunde |
| Katze |
Katzen |
| Maus |
Mäuse |
| Elefant |
Elefanten |
| Delfin |
Delfine |
| Frosch |
Frösche |
| Insekt |
Insekten |
| .. |
.. |
|
|
|
Also,
nicht nachmachen, Liebe Kinder zu Hause vor den Bildschirmen ;o)
Denn auch das funktioniert nicht immer, überall dort nämlich
nicht, wo keine solchen Einträge in die Einzahl-Mehrzahl-Tabelle
geschrieben wurden.
Das
Einzige was wir hier tun können, ist hoffen, dass es möglichst oft
klappt,
mit dem, was die Blinde Kuh als Mehrzahl oder Einzahl dem
Suchwort zuordnet. Aber Richtiges Denken, wirklich wissen, was hier
richtig ist, das können weder Blinde Kühe, noch irgendwelche anderen
Suchmaschinen in der Welt.
Wenn
du darüber nachdenkst, hast du nun ein Beispiel, das sehr gut
zeigen kann, warum Suchmaschinen dumm sind. Sie werden Menschen, die
etwas suchen, niemals verstehen können. Man glaubt es nur. Wenn die
Suchmaschine findet, was man sucht, dann denkt man, die ist aber
schlau und versteht mich. Wenn nicht, erst dann denkt man, dass sie
ein ziemlich blödes Teils ist und gar nichts versteht. Aber es ist
eben ein Irrtum, sie versteht nichts, sondern es wird mit allerhand
Schummeltricks so getan, als ob.
|