Neue KI-Chatbots machen weniger Fehler

Avatar von Marcus Schwarze

Welche immense Entwicklung Künstliche Intelligenz (KI) nimmt, zeigt ein Versuch der Entwicklungsagentur Rheinland-Pfalz (EA). Seit Populärwerden von ChatGPT Ende 2022 haben wir den diversen KI-Diensten am Markt experimentell unter anderem die umfangreiche Sammlung von Förderbestimmungen für Betroffene der Naturkatastrophe 2021 vorgelegt. Die Maschinen sollten sinnvolle Antworten auf Fragen von Betroffenen zum Antragsverfahren geben. 

Entwicklungsschritte: Besser werden

Lei­der waren die ers­ten Ergeb­nis­se ernüch­ternd. Doch jetzt, im Früh­jahr 2024, macht es die KI deut­lich bes­ser. Die KIs wer­den stän­dig wei­ter­ent­wi­ckelt, neu trai­niert, die Algo­rith­men ver­ste­hen bes­ser, was ein Mensch im Chat erfragt. Und ent­spre­chend ange­lei­tet und ein­ge­stellt, hal­lu­zi­nie­ren die Bots weni­ger, erfin­den sel­te­ner Din­ge hin­zu. Eine KI bringt zunächst ihr vom Her­stel­ler antrai­nier­tes Welt­wis­sen mit. Was ihr fehlt, ist Spe­zi­al­wis­sen für bestimm­te Zwecke.

Wissenslücken: Spezialisieren und anpassen

Zum Bei­spiel zu För­der­ver­fah­ren. Wer die Häu­fig gestell­ten Fra­gen (FAQ) zum Wie­der­auf­bau in Rhein­land-Pfalz aus­druckt, bekommt allein bei den Infor­ma­tio­nen für Pri­vat­per­so­nen an die 42 DIN-A4-Sei­ten. Das wäre viel Lek­tü­re – und eine gute Samm­lung für einen Chat­bot, der das Doku­ment kom­plett erfasst und Fra­gen dazu beant­wor­tet. Zum Bei­spiel zu der Fra­ge, wie man als Betrof­fe­ner Geld bean­tra­gen kann und wel­che Vor­aus­set­zun­gen gel­ten, um eine För­de­rung zu bekom­men. 15 Mil­li­ar­den Euro ste­hen in Rhein­land-Pfalz zur Ver­fü­gung. Damit alles gerecht und mit rech­ten Din­gen zugeht, gel­ten Regeln für vor­zu­le­gen­de Nach­wei­se, Fris­ten und Grenzen. 

Ernüchternde Anfänge: Fehler einräumen

Die ers­ten Tests der Ent­wick­lungs­agen­tur vor einem Jahr mit KI-Sys­te­men waren ernüch­ternd. Bei Diens­ten wie MyAs­kAI und Dan­te AI konn­ten wir zwar die FAQ hin­ter­le­gen. Doch die Ant­wor­ten der anschlie­ßend bereit­ge­stell­ten Chat­bots, die man in eine Web­sei­te hät­te ein­bau­en kön­nen, waren feh­ler­haft. Mal erfand die Maschi­ne Ober­gren­zen, die in den FAQ nicht genannt waren, mal ver­rech­ne­te sie sich, wenn für einen sechs­köp­fi­gen Haus­halt der zer­stör­te Haus­rat ersetzt wer­den sollte. 

Da ist etwa in den FAQ für den Ersatz von Haus­rat aus­drück­lich von 13.000 Euro für die ers­te im Haus­halt gemel­de­te Per­son die Rede, 8.500 Euro für die zwei­te Per­son und 3.500 Euro für jede wei­te­re Per­son. Bei sechs Leu­ten ergibt das 35.500 Euro – und die KI errech­ne­te statt­des­sen mal 32.000 Euro, mal 28.500 Euro. Für eine „offi­zi­el­le“ KI, waren und sind sol­che Rechen­feh­ler into­le­ra­bel, selbst wenn man dazu schreibt, dass die KI feh­ler­haf­te Ant­wor­ten lie­fern kann.

Fortschritt messen: Präziser antworten

In den ver­gan­ge­nen Mona­ten hat sich die KI stark wei­ter­ent­wi­ckelt. Die Qua­li­tät der Ant­wor­ten wur­de viel­fach ver­bes­sert. Zwar ist ChatGPT wei­ter­hin eine „Black Box“, aus der für Außen­ste­hen­de nicht ersicht­lich ist, wie sie auf ihre Ant­wor­ten kommt. Doch erge­ben sich in vie­len Ver­su­chen neu­er­dings prä­zi­se­re und zuneh­mend feh­ler­freie Ergeb­nis­se. So auch bei unse­rem expe­ri­men­tel­len „Wie­der­auf­bau­GPT“.

Dialoge testen: Umgangssprache verstehen

„Mein Haus ist hin. Wie viel Koh­le gibt’s?“ So bur­schi­kos und umgangs­sprach­lich lau­tet seit Jahr und Tag unse­re Ein­stiegs­fra­ge beim Tes­ten diver­ser KIs im Zusam­men­spiel mit den FAQ. Das Ergeb­nis nennt heu­te, im Früh­jahr 2024, rich­ti­ger­wei­se die För­der­sät­ze für den Ersatz vom ver­lo­re­nen Haus­rat und die bis zu 80 Pro­zent hohe För­de­rung für den Wie­der­auf­bau eines zer­stör­ten Hauses. 

Inter­es­sant wer­den Ant­wor­ten im wei­te­ren Ver­lauf: Auf fik­ti­ve Neu­bau­kos­ten von 500.000 Euro berech­net die KI rich­ti­ger­wei­se aus den bis zu 80 Pro­zent För­der­geld eine Sum­me von 400.000 Euro. Bei sechs gemel­de­ten Per­so­nen im Haus­halt kommt die KI zusätz­lich für den Haus­rat auf 35.500 Euro. Und selbst bei dem aus­ge­dach­ten Ereig­nis, dass einen Monat nach der Kata­stro­phe Zwil­lin­ge gebo­ren wur­den, zählt die Maschi­ne eins und eins zusam­men: Eine Bestim­mung besagt, dass jün­ge­re Kin­der hin­zu­zu­rech­nen sind, sofern sie vor dem 15. Janu­ar 2022 gebo­ren wurden.

Unterm Strich erge­ben sich durch sol­che prä­zi­se­ren KIs viel­fäl­ti­ge Mög­lich­kei­ten fürs Über­set­zen von Bestim­mun­gen und Verfahrensregeln. 

Zugangsbarrieren: Kosten aufdecken

Getrübt wird die­se Ein­schät­zung aller­dings durch die Geschäfts­mo­del­le der ame­ri­ka­ni­schen KI-Diens­te. Der oben ver­link­te Chat ist zwar zum Nach­le­sen frei zugäng­lich; wer die­se spe­zia­li­sier­te Wie­der­auf­bau­GPT-KI ein­mal selbst aus­pro­bie­ren woll­te, müss­te Abon­nent des kos­ten­pflich­ti­gen ChatGPT‑4 sein. Die Kos­ten betra­gen 20 US-Dol­lar im Monat. Dann steht die Wie­der­auf­bau­GPT-KI unter der Adres­se https://chat.openai.com/g/g‑JeZDrcxUE-wiederaufbaugpt zur Ver­fü­gung. Ach­tung, die Anwen­dung ist wei­ter­hin nur expe­ri­men­tell; die FAQ wer­den immer mal wie­der ergänzt, in unse­rem Test-Bot aller­dings nicht aktua­li­siert. Es bleibt ein Test.

Technische Hürden: Integration ermöglichen

Das Unter­neh­men Ope­nAI bie­tet für die auf sei­ner Web­sei­te ange­bo­te­nen KI-Diens­te kei­ne Mecha­nik an, den bereit­ge­stell­ten Chat­bot auf einer frem­den Web­sei­te wie wie​der​auf​bau​.rlp​.de ein­zu­bau­en. Das aller­dings wäre eine wich­ti­ge Vor­aus­set­zung für die Nut­zung die­ser KI. Über ande­re tech­ni­sche Wege, Stich­wort API-Anbin­dung und Hin­ter­le­gen von eige­nen Trai­nings­da­ten, wäre ein sol­ches Wid­get mög­lich – sei es für bestimm­te FAQ, gezielt gecrawl­te Web­sei­ten-Inhal­te und bereit­ge­stell­te PDF-Sammlungen.

Zukunftsaussichten: Weiterentwickeln und prüfen 

Nötig wird dann auch eine erprob­te Nach­ver­fol­gung: Wenn ein Bot auf einer Web­sei­te Ant­wor­ten gibt, soll­te er nicht unbe­ob­ach­tet blei­ben. Es braucht Pro­to­kol­le und nach­träg­li­che Prü­fun­gen. Gege­be­nen­falls müs­sen hin­ter­leg­te Doku­men­te auf­grund der gewon­ne­nen Erfah­rung anders for­mu­liert wer­den. Doch wenn sich die KIs so wei­ter­ent­wi­ckeln wie in den ver­gan­ge­nen Mona­ten, erge­ben sich viel­sei­ti­ge neue Bots, die sich sel­te­ner als bis­her ver­rech­nen oder Falschaus­künf­te geben. Die Tests und Bewer­tun­gen der Ergeb­nis­se gehen weiter.