🇩🇪 Futo Voice Input halluziniert

Hallo,

ich las hier irgendwo von Futo (danke!), habe es installiert und bin beeindruckt, wie gut es funktioniert. Nur ist Futo eine eigene Persönlichkeit und fügt am Ende gerne nicht diktierte Kommentare an (“Wir sehen uns im nächsten Video”, “Das ist sehr schön” und besonders gerne “Copyright WDR 2020”). Lässt sich das irgendwie verhindern? In den Einstellungen habe ich nichts gefunden.

Viele Grüße,

Zwetschge

Ich habe das bei mir gerade mit den Standardeinstellungen ausprobiert und kann das Verhalten nicht bestätigen. Vielleicht musst du etwas spezifischer werden, was für Texte (und wie lang) du da rein diktierst.
Was du zitierst sieht jedenfalls für mich nach Überbleibseln aus dem Training des Sprachmodells aus, deren teilweise Herkunft damit wohl klar ist. Es könnte am spezifischen Thema liegen, dass solche Dinge dann angehangen werden.

1 Like

Hallo,

vielen Dank, dass du dich meines Themas annimmst! Ich diktiere jetzt mit Futo, um den Fehler vielleicht zu reproduzieren. Aber natürlich greift der Vorführeffekt und Futo ist brav. Es tritt auch sonst nicht immer auf. Ich diktiere normalerweise Mails in unterschiedlicher Länge. Die Ergänzungen haben nicht unbedingt mit dem Thema zu tun, jedenfalls nicht so, dass ich es erkennen könnte. “Wir sehen uns im nächsten Video” kam, ohne dass ein Video erwähnt worden wäre.

Weißt du eigentlich, ob Futo lernt, ob also meine Korrekturen in das lokal gespeicherte “Wissen” übergehen?

Viele Grüße, Zwetschge

Ich benutze normalerweise das FUTO-Keyboard mit Sprach-Eingabe für kurze Textnachrichten, aber ich habe da noch nie etwas viel längeres diktiert. Dabei ist mir dieses Problem auf jeden Fall noch nie aufgefallen. Ich habe für die Genauigkeit allerdings dort auch ein größeres (und langsameres) Sprachmodell ausgewählt. Benutzt du den Standard?
Das größere Sprachmodell (Multilingual-244) macht bei mir auf jeden Fall deutlich weniger Erkennungsfehler und hat mir auch noch nie so einen Text angedichtet. Die Prozessierung auf meinem FP4 ist zwar definitiv langsamer, aber für mich immer noch erträglich. Auf dem FP5 sollte es auch eine Ecke schneller sein. Vielleicht kannst du das ausprobieren, falls noch nicht passiert.

Nachtrag:

Ich bin sehr sicher, dass es nicht implizit aus deinem Input lernt. Das Modell wurde einmal trainiert und an der prinzipiellen Erkennung ändert sich auch nichts. Der einzige Einfluss, den du hast, ist die Eingabe von bestimmten Begriffen in den Einstellungen, die bevorzugt erkannt werden sollen.

Ah, danke! Ich hatte Multilingual 74, also den Standard, und lade jetzt mal das 244er. Besser: demnächst, im Augenblick hängt der Download. Ich bin gespannt.

Die Zusätze kamen manchmal auch nach ein oder zwei Sätzen vor, nicht nur bei längeren Passagen. Seit ich hier gepostet habe, natürlich gar nicht mehr.

Alles klar, dann weiß ich das. Und habe jetzt auch die Einstellung für bevorzugte Begriffe gefunden. Danke, jetzt schreibt es meinen Namen im ersten Anlauf richtig!

1 Like

Ich habe das Problem mit den Halluzinationen auch. Auch bei mir wurde die Qualität nach dem Installieren von “Multilingual-244” deutlich besser, aber noch nicht gut genug.

Ich konnte aber auch einen anderen Zusammenhang feststellen. Wenn ich das Handy frisch aufgeladen das erste Mal am Tag benutze, ist die Qualität fast perfekt, völlig ohne Rechtschreibefehler oder Halluzinationen. Je mehr ich das Handy nutze, desto mehr spinnt Futo plötzlich rum und schreibt mir irgendwelche unerwünschten Halbsätze am Schluss des Diktates. Könnte das am Arbeitsspeicher liegen? Oder hat jemand noch eine andere Idee? Ich muss mal ausprobieren, ob ein Neustart Abhilfe schafft.

Und manchmal scheine ich auch nicht langsam oder deutlich genug zu sprechen mit der Folge, dass sich Foto irgendwas ganz anderes ausdenkt, was dann mit dem diktierten Text auch wirklich nichts mehr zu tun hat.

Ich noch nicht, wo genau ist die?

Da, wo Du das Sprachmodell auswählst (“Model”), ist oben ein Kasten “Personal Dictionary”, in den Du Begriffe eintragen kannst. Funktioniert bei mir gut.

Bei mir hat jetzt offenbar endlich die Installation des 244er Sprachpakets geklappt. Das Halluzinieren war weniger in letzter Zeit; wie bei Dir tritt es unterschiedlich auf. Vielleicht wirklich der Arbeitsspeicher?

2 Likes