Endlich Excel können ohne Excel zu können

Avatar von Marcus Schwarze

Einmal mehr gibt es durch künstliche Intelligenz (KI) faszinierende Hilfe. Ein „Code Interpreter“ hilft beim Analysieren von Daten mithilfe von ChatGPT-4. Damit lassen sich Excel-Tabellen befragen.

(Illus­tra­ti­on: Mar­cus Schwarze/Midjourney, KI-generiert)

Ein Bei­spiel: Das Sta­tis­ti­sche Lan­des­amt in Rhein­land-Pfalz bie­tet zum Down­load eine Excel-Datei zur Bevöl­ke­rungs­ent­wick­lung in den Ver­wal­tungs­be­zir­ken des Lan­des an. Lädt man sie bei ChatGPT‑4 hoch, inter­pre­tiert die Maschi­ne die Daten anhand frei gestell­ter Fragen.

Quel­le: Sta­tis­ti­sches Lan­des­amt Rheinland-Pfalz

„Wel­cher Bezirk hat­te das größ­te Bevöl­ke­rungs­wachs­tum seit 1939? (Der Rhein-Pfalz-Kreis.)

Wel­cher ver­lor die meis­ten Bewoh­ne­rin­nen und Bewoh­ner? (Pir­ma­sens.)

„Mach mir eine Lis­te der fünf Bezir­ke, die am stärks­ten gewach­sen sind.“

  • Rhein-Pfalz-Kreis – Stei­ge­rung um etwa 110,84 %
  • Ger­mers­heim – Stei­ge­rung um etwa 94,72 %
  • Mainz-Bin­gen – Stei­ge­rung um etwa 84,44 %
  • Ahr­wei­ler – Stei­ge­rung um etwa 76,33 %
  • Wes­ter­wald­kreis – Stei­ge­rung um etwa 73,39 %

„Von Hand“ gin­ge das auch in Excel, wenn man ent­spre­chen­de Spal­ten­funk­tio­nen ein­rich­tet und sor­tiert. Die sprach­li­che Anwei­sung ist jedoch schnel­ler erledigt.

Lädt man eine wei­te­re Datei hoch, etwa die über die Arbeits­lo­sen­quo­ten in den Bezir­ken, wer­den auch Ver­knüp­fun­gen zwi­schen den bei­den Tabel­len mög­lich: „Wo ist die Arbeits­lo­sen­quo­te im Ver­hält­nis zur Bevöl­ke­rungs­dich­te am höchsten?“

„Las­sen Sie uns zunächst die Arbeits­lo­sen­da­ten berei­ni­gen“, schlägt ChatGPT‑4 vor. Denn eini­ge Zei­len in dem Doku­ment sind aus KI-Sicht unsin­nig. Da wur­den Tabel­len­zel­len zusam­men­ge­fasst, um Zwi­schen­über­schrif­ten wie „Kreis­freie Städ­te“ oder „Land­krei­se“ zu gestalten.

Das Ergeb­nis nach der von ChatGPT vor­ge­nom­me­nen Berei­ni­gung: Der Land­kreis Bir­ken­feld hat im Ver­hält­nis zur Bevöl­ke­rungs­dich­te die höchs­te Arbeitslosenquote.

Im Hin­ter­grund hat ChatGPT mit der Erwei­te­rung „Code Inter­pre­ter“ eige­ne Skrip­te in der Pro­gram­mier­spra­che Python geschrie­ben. Bei Bedarf kann man den her­ge­stell­ten Code durch Auf­klap­pen der Erwei­te­rung einsehen.

Aller­dings: Die KI ist auch wei­ter­hin nicht vor Feh­lern gefeit. Weil in der einen Tabel­le von „Land­au in der Pfalz“ die Rede ist und in der ande­ren von „Land­au i. d. Pfalz“, gelingt ihr das kor­rek­te Zusam­men­füh­ren aller Daten nicht auf Anhieb. Weist man die Maschi­ne dar­auf hin, ent­schul­digt sie sich wort­reich und ver­sucht, den Feh­ler zu behe­ben. Da genügt ein ein­fa­cher Hin­weis, dass bei­de Bezir­ke iden­tisch sind, auch wenn sie unter­schied­lich geschrie­ben sind.

Der „Code Inter­pre­ter“ kann noch mehr: „Mach mir ein Chart aus den Daten“, lau­tet mei­ne Anwei­sung. Die KI stutzt, Bal­ken­dia­gramm, Tor­te oder was? Und Zack, will die Maschi­ne ein Bal­ken­dia­gramm fer­ti­gen. Zei­gen kann ich es hier aller­dings nicht: Irgend­wo in den Daten steckt wohl noch ein Logik­feh­ler. In meh­re­ren Anläu­fen ver­sucht die Maschi­ne, ihn zu behe­ben, faselt etwa von einer plötz­lich feh­len­den Pan­da-Biblio­thek, ver­schlimm­bes­sert dabei immer mehr die abge­leg­ten Tabel­len und kommt letzt­lich nicht mehr ans Ziel.

Ein neu­er Anfang für Daten­ana­ly­sen ist jeden­falls gemacht.

Bleibt nur noch die Fra­ge: Was könn­te Bevöl­ke­rungs­dich­te mit Arbeits­lo­sig­keit zu tun haben? Das ist ein ande­res The­ma. Fra­gen Sie mal die KI.