Schlagwort: Excel

  • Endlich Excel können ohne Excel zu können

    Endlich Excel können ohne Excel zu können

    (Illus­tra­ti­on: Mar­cus Schwarze/Midjourney, KI-generiert)

    Ein Bei­spiel: Das Sta­tis­ti­sche Lan­des­amt in Rhein­land-Pfalz bie­tet zum Down­load eine Excel-Datei zur Bevöl­ke­rungs­ent­wick­lung in den Ver­wal­tungs­be­zir­ken des Lan­des an. Lädt man sie bei ChatGPT‑4 hoch, inter­pre­tiert die Maschi­ne die Daten anhand frei gestell­ter Fragen.

    Quel­le: Sta­tis­ti­sches Lan­des­amt Rheinland-Pfalz

    „Wel­cher Bezirk hat­te das größ­te Bevöl­ke­rungs­wachs­tum seit 1939? (Der Rhein-Pfalz-Kreis.)

    Wel­cher ver­lor die meis­ten Bewoh­ne­rin­nen und Bewoh­ner? (Pir­ma­sens.)

    „Mach mir eine Lis­te der fünf Bezir­ke, die am stärks­ten gewach­sen sind.“

    • Rhein-Pfalz-Kreis – Stei­ge­rung um etwa 110,84 %
    • Ger­mers­heim – Stei­ge­rung um etwa 94,72 %
    • Mainz-Bin­gen – Stei­ge­rung um etwa 84,44 %
    • Ahr­wei­ler – Stei­ge­rung um etwa 76,33 %
    • Wes­ter­wald­kreis – Stei­ge­rung um etwa 73,39 %

    „Von Hand“ gin­ge das auch in Excel, wenn man ent­spre­chen­de Spal­ten­funk­tio­nen ein­rich­tet und sor­tiert. Die sprach­li­che Anwei­sung ist jedoch schnel­ler erledigt.

    Lädt man eine wei­te­re Datei hoch, etwa die über die Arbeits­lo­sen­quo­ten in den Bezir­ken, wer­den auch Ver­knüp­fun­gen zwi­schen den bei­den Tabel­len mög­lich: „Wo ist die Arbeits­lo­sen­quo­te im Ver­hält­nis zur Bevöl­ke­rungs­dich­te am höchsten?“

    „Las­sen Sie uns zunächst die Arbeits­lo­sen­da­ten berei­ni­gen“, schlägt ChatGPT‑4 vor. Denn eini­ge Zei­len in dem Doku­ment sind aus KI-Sicht unsin­nig. Da wur­den Tabel­len­zel­len zusam­men­ge­fasst, um Zwi­schen­über­schrif­ten wie „Kreis­freie Städ­te“ oder „Land­krei­se“ zu gestalten.

    Das Ergeb­nis nach der von ChatGPT vor­ge­nom­me­nen Berei­ni­gung: Der Land­kreis Bir­ken­feld hat im Ver­hält­nis zur Bevöl­ke­rungs­dich­te die höchs­te Arbeitslosenquote.

    Im Hin­ter­grund hat ChatGPT mit der Erwei­te­rung „Code Inter­pre­ter“ eige­ne Skrip­te in der Pro­gram­mier­spra­che Python geschrie­ben. Bei Bedarf kann man den her­ge­stell­ten Code durch Auf­klap­pen der Erwei­te­rung einsehen.

    Aller­dings: Die KI ist auch wei­ter­hin nicht vor Feh­lern gefeit. Weil in der einen Tabel­le von „Land­au in der Pfalz“ die Rede ist und in der ande­ren von „Land­au i. d. Pfalz“, gelingt ihr das kor­rek­te Zusam­men­füh­ren aller Daten nicht auf Anhieb. Weist man die Maschi­ne dar­auf hin, ent­schul­digt sie sich wort­reich und ver­sucht, den Feh­ler zu behe­ben. Da genügt ein ein­fa­cher Hin­weis, dass bei­de Bezir­ke iden­tisch sind, auch wenn sie unter­schied­lich geschrie­ben sind.

    Der „Code Inter­pre­ter“ kann noch mehr: „Mach mir ein Chart aus den Daten“, lau­tet mei­ne Anwei­sung. Die KI stutzt, Bal­ken­dia­gramm, Tor­te oder was? Und Zack, will die Maschi­ne ein Bal­ken­dia­gramm fer­ti­gen. Zei­gen kann ich es hier aller­dings nicht: Irgend­wo in den Daten steckt wohl noch ein Logik­feh­ler. In meh­re­ren Anläu­fen ver­sucht die Maschi­ne, ihn zu behe­ben, faselt etwa von einer plötz­lich feh­len­den Pan­da-Biblio­thek, ver­schlimm­bes­sert dabei immer mehr die abge­leg­ten Tabel­len und kommt letzt­lich nicht mehr ans Ziel.

    Ein neu­er Anfang für Daten­ana­ly­sen ist jeden­falls gemacht.

    Bleibt nur noch die Fra­ge: Was könn­te Bevöl­ke­rungs­dich­te mit Arbeits­lo­sig­keit zu tun haben? Das ist ein ande­res The­ma. Fra­gen Sie mal die KI.