Auf dem Weg zur Automatisierung

Avatar von Marcus Schwarze

Auch anderthalb Jahre nach der Einführung von ChatGPT überrascht mich der Dienst immer wieder aufs Neue. Jüngstes Beispiel sind Antworten zur Automation von digitalen Dingen.

Man­ches bei der digi­ta­len Arbeit ist so klein­tei­lig, da will man sich nicht lan­ge mit Details beschäf­ti­gen. Man klickt sich so durch, über die immer glei­chen Wege, und fragt sich am Ende: Kann ich das nicht auf eine der Funk­ti­ons­tas­ten legen, die auf der Mac-Tas­ta­tur 19-fach vor­han­den sind?

  • Wöchent­lich benö­ti­ge ich drei­mal eine Bild­da­tei in ein 1100 Pixel brei­tes For­mat mit 152 dpi umge­wan­delt. Also öff­ne ich das Bild in Pixel­ma­tor (frü­her war es Pho­to­shop), wand­le das Bild in 152 dpi und las­se es neu berech­nen für die gewünsch­te Brei­te. Diver­se Maus­klicks sind dafür nötig. Das geht doch schneller?
  • Für Screen­shots benö­ti­ge ich gele­gent­lich den Hell-Modus statt dem von mir bevor­zug­ten Dark­mo­dus. Irgend­wo in den Sys­tem­ein­stel­lun­gen muss man da einen Haken set­zen. Nur wo? Lässt sich die Umschal­tung auf die Tas­te F16 legen?
  • Noch simp­ler: Auf dem Mac hät­te ich ger­ne über die Tas­te F19 den Taschen­rech­ner auf­ge­ru­fen. In den Untie­fen der Sys­tem­ein­stel­lun­gen auf dem Mac ist dies hin­ter­leg­bar – nur wie?

Die Anlei­tun­gen für die­se drei Auf­ga­ben fin­den sich in den Untie­fen des Webs. Man muss dafür goo­geln, das Pro­blem mit den Fund­stel­len abglei­chen, aus­pro­bie­ren und wei­ter­for­schen. Oder man han­gelt sich durch die Sys­tem­ein­stel­lun­gen des Macs, die inzwi­schen so unüber­sicht­lich wie die Menü­füh­rung in Micro­soft Word ist.

Dank Künst­li­cher Intel­li­genz geht das jetzt schneller.

Die Auf­ga­be für die Umwand­lung der Bild­da­tei samt ange­häng­tem „-1100px“ im Datei­na­men beschrieb mir ChatGPT o3 Schritt für Schritt. Mei­ne Fra­ge lau­te­te: „Wie kann ich eine Auto­ma­ti­sie­rung erzeu­gen, um aus Bild­da­tei­en eine neue Ver­si­on mit dem Zusatz ‑1100px im Datei­na­men zu erzeu­gen? Das Bild soll 152 dpi haben und 1100 Pixel breit sein. Es soll auf die Tas­te F17 reagie­ren.“ Punkt für Punkt ging die KI mit mir das Nöti­ge durch, führ­te knapp in die Geheim­nis­se von Shell-Skrip­ten ein und gab mir den nöti­gen Code. Es folg­te eine Anlei­tung, wie man das in ein Pro­gramm Auto­ma­tor auf dem Mac ein­fügt. Und es gab eine Anlei­tung, die gewünsch­te Funk­ti­ons­tas­te der Auf­ga­be zuzuweisen.

Wie­der sind so ein paar Minu­ten am Tag gewon­nen. Und das gelingt auch mit den ande­ren zwei Auf­ga­ben minutenschnell. 

ChatGPT o3 gibt’s nur kos­ten­pflich­tig bei Ope­nAI. Das ist inzwi­schen eine bes­se­re Such­ma­schi­ne als Goog­le: Sie berück­sich­tigt den Kon­text der Fra­ge, durch­sucht Dut­zen­de und manch­mal Hun­der­te von Web­sei­ten und macht sich einen Reim darauf.

Die dabei gene­rier­ten Anlei­tun­gen sind nicht immer hun­dert­pro­zen­tig kor­rekt. Mal hei­ßen Menü­punk­te anders. Oder sie sind nicht auf­find­bar. Dann hilft ein schnel­ler Screen­shot – und, ihn bei o3 hoch­zu­la­den. Mes­ser­scharf schließt die KI dar­aus, dass offen­bar etwas nicht stimmt und der Screen­shot mit der Anlei­tung abzu­glei­chen ist. Wie­der goo­gelt o3 los, durch­sucht das Web nach pas­sen­den Infos und berei­tet eine neue Anlei­tung auf.

Wo das noch hin­füh­ren könn­te, zeigt eine neue Anwen­dung von Goog­le. Opal erstellt Pro­zess­plä­ne für Auf­ga­ben. In natür­li­chen mensch­li­chen Wor­ten beschreibt man die Auf­ga­be. Die Anwen­dung zer­legt das in ein Dia­gramm für erwar­te­te Ein­ga­ben und Uploads, eine Goog­le-Suche nach wei­te­ren Infor­ma­tio­nen und eine anschlie­ßen­de Ver­ar­bei­tung aller Erkennt­nis­se für Blog­posts und ein Video. Die Mach­art erin­nert an den deut­schen Dienst n8n, bei dem man sich ähn­li­che Work­flows zusam­men­kli­cken kann. Bei Goo­gles Opal nur eben ohne Expertentum.

Goog­le bezeich­net die KI-gestütz­te Tech­nik aus­drück­lich als Expe­ri­ment. Wer weiß, ob dar­aus ein markt­fä­hi­ges Pro­dukt in Kon­kur­renz zu n8n und dem schwe­di­schen Start­up Lova­ble wird, das eben­falls eine star­ke App zur Pro­gram­mie­rung bereit­stellt. Gegen­wär­tig ist Opal nur per VPN-Ein­wahl in die USA zugäng­lich und dort kos­ten­los. „Füge eine Funk­ti­on hin­zu, das Video auto­ma­tisch auf Social-Media-Kanä­len des Nut­zers zu ver­öf­fent­li­chen. Hole Dir für jeden Post sei­ne Freigabe.“ 

Mei­ne Tas­te F15 wäre dafür noch frei.