SectionPage Languages
Das Konzept von Dasher kann auf praktisch alle Sprachen angewendet werden. Derzeit werden einige Europäische Sprachen und Japanisch von Dasher unterstützt. Um Dasher mit einer anderen indoeuropäischen Sprache als Englisch zu verwenden, müssen Sie ihrem Eingabegerät Dasher erst mit einem sprachüblichen Text Ihrer Sprache antrainieren - schieben Sie diese Textdatei nach input/source oder input/source.txt. Die "Word"-Option muss ausgeschaltet sein. Alternativ kann auch die Datei input/dict ersetzt werden durch ein Wörterbuch für Ihre Sprache.
Nach der Freigabe von Version 3 planen wir nun, die Anzahl der Sprachen für Dasher mit Hilfe der Open-Source-Freunde drastisch zu erhöhen. [Version 3 arbeitet in Unicode.] Mit Version 3 (wie auch in Version 1.6) benötigt jede Sprache ihren eigenen sprachüblichen Text (ca. 300K oder mehr).
Noch mehr Ratschläge für die Trainingsvorbereitung
Ein Film beschreibt Daishoya auf Japanisch. |
Als allerersten Schritt zu einer Version, die sowohl mit Kana als auch mit Kanji umgehen kann, hat David Ward eine Hiraganaversion geschrieben, verfügbar als Version 1.6.3 von Dasher. (Spätere Versionen von Windows-Dasher, z.B. 1.6.8, unterstützen Hiragana nicht auf Grund von Problemen mit Tcl-fonts; die Linuxversion 1.6.8 funktioniert gut in Hiragana.)
Der Umbau von Dasher zu Daishoya ist einfach: Wir ersetzen das Englische Alfabet a...z durch das Hiraganaalphabet, (a,i,u,e,o, ka,ki,ku,ke,ko,...). Und wir ersetzen den Englischen Übungstext durch ein Hiraganadokument. [Leider konnten wir kein besonders langes Dokument in reinem Hiragana finden. Deshalb sind wir mit unserem Sprachmodell hier noch nicht ganz zufrieden.]
Es sind zwei Reihenfolgen des Hiraganaalfabets verfügbar (die Optionen "Japan1" and "Japan2"). In "Japan2" sind die diakritischen Lautzeichen (",o) als selbstständige Buchstaben geführt; in "Japan1" werden sie in die Kurzsilbenzeichen, z.B. ("pa", "ba") des Alfabets integriert.
Wir würden Sie gerne zur Zusammenarbeit einladen: Helfen Sie uns Daishoya auszuprobieren und es bei einem großen Benutzerpublikum einzuführen.
Weiterhin benötigen wir einen umfangreichen Hiraganatext um das Sprachmodell zu trainieren.