Schlagwort: ChatGPT

  • Ein Prompt macht mehr als tausend Bilder

    Ein Prompt macht mehr als tausend Bilder

    Gra­fi­ker müs­sen umden­ken. Wer eine Bebil­de­rung für ein schwie­ri­ges The­ma braucht, füt­tert seit ein paar Mona­ten eine Bil­der-KI mit Anwei­sun­gen. Wenn man es rich­tig macht, kommt dabei eine vor­zeig­ba­re Illus­tra­ti­on her­aus. Die­se kann foto­rea­lis­tisch oder wie eine Zeich­nung aus­se­hen, vek­to­ri­siert (wie oben) oder wie ein Ölge­mäl­de – es kommt eben auf den Prompt an, die Regie­an­wei­sung also an die KI.

    Mid­jour­ney galt bis­her als der Por­sche unter den gene­ra­ti­ven Bil­der-KIs, obwohl die Bedie­nung in Ver­knüp­fung mit der Chat-Soft­ware Dis­cord nicht eben leicht zu erler­nen war. Die Resul­ta­te aber waren und sind oft überzeugend.

    Seit weni­gen Tagen hat auch ChatGPT eine Bil­der­funk­ti­on ein­ge­baut. Sie heißt Dall‑E 3 und lässt sich bei der kos­ten­pflich­ti­gen Ver­si­on GPT‑4 über den gleich­lau­ten­den Menü­punkt akti­ve­ren. Eine Anlei­tung zu Dall‑E 3 kennt GPT‑4 nicht. Aber dafür gibt’s ja mich.

    Der Prompt für die vier Bil­der oben in GPT‑4 lau­te­te (deut­sche Über­set­zung folgt):

    Create an illustration depicting the role of a meticulous journalist summarizing a specific text according to strict guidelines. The scene should encompass the following elements: The Journalist at the Desk: Showcase a person seated at a desk equipped with a computer, notes, and books. The individual should appear focused, possibly holding a magnifying glass to symbolize attention to detail. A Marked and Annotated Text: Place a document on the desk with highlights, underlines, and annotations, emphasizing the requirements of the journalistic process, such as gendering job titles and avoiding certain words. Vivid Examples: Include small illustrations or symbols representing the themes or concepts described in the text, fulfilling the demand for vivid examples. Neutral Style and Color Scheme: Employ subdued, neutral colors to reflect the journalist's objectivity and neutrality. The goal is to craft a scene that illustrates both the complexity of the journalistic task and the simplicity and clarity of the requirements. The illustration should strike a balance between richness in detail and simplicity, highlighting the care and accuracy of the journalist.

    Erstelle eine Illustration, die die Rolle eines sorgfältigen Journalisten beim Zusammenfassen eines spezifischen Textes nach strengen Richtlinien darstellt. Die Szene sollte folgende Elemente umfassen:Der Journalist am Schreibtisch: Zeige eine Person, die an einem mit Computer, Notizen und Büchern ausgestatteten Schreibtisch sitzt. Die Person sollte konzentriert wirken, möglicherweise mit einer Lupe in der Hand, um die Liebe zum Detail zu symbolisieren.Ein markierter und annotierter Text: Platziere ein Dokument auf dem Schreibtisch, das Hervorhebungen, Unterstreichungen und Anmerkungen aufweist. Diese sollen die Anforderungen des journalistischen Prozesses hervorheben, wie zum Beispiel das Gendern von Berufsbezeichnungen und das Vermeiden bestimmter Worte.Lebendige Beispiele: Füge kleine Illustrationen oder Symbole hinzu, die die Themen oder Konzepte im Text repräsentieren und damit den Anspruch an lebendige Beispiele erfüllen.Neutraler Stil und Farbschema: Verwende zurückhaltende, neutrale Farben, um die Objektivität und Neutralität des Journalisten widerzuspiegeln.Das Ziel ist es, eine Szene zu schaffen, die sowohl die Komplexität der journalistischen Aufgabe als auch die Einfachheit und Klarheit der Anforderungen illustriert. Die Illustration sollte ein Gleichgewicht zwischen Detailreichtum und Einfachheit finden und die Sorgfalt und Genauigkeit des Journalisten hervorheben.

    Nicht ich habe die­sen Prompt so aus­ge­feilt for­mu­liert, son­dern die KI Chat-GPT bereits vor ein paar Mona­ten. Damals für Mid­jour­ney. Her­aus kam bei Mid­jour­ney die­se Illustration:

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze

    Bei­de Ergeb­nis­se hal­te ich für beachtlich.

    Einen Schritt wei­ter geht die Anwen­dung Fire­fly 2 von Ado­be. Der oben genann­te Prompt ist dafür zu lang und pro­du­ziert des­halb einen Feh­ler. Ver­kür­ze ich den Prompt, kom­men die­se Ergeb­nis­se her­aus – nach zusätz­li­chem Ein­stel­len eines Inhalts­typs Foto (statt Kunst) und Hin­zu­fü­gen der Effek­te Hyper­rea­lis­tisch und Gol­de­ne Stunde.

    Illus­tra­ti­on: KI-gene­rier­t/­Fi­re­fly Image 2 (Beta)/Schwarze

    Fin­ger und Haut wir­ken etwas unna­tür­lich. Beim Her­un­ter­la­den merkt die Soft­ware an, dass in der Datei Infor­ma­tio­nen hin­ter­legt wer­den, wonach es sich um ein KI-gene­rier­tes Bild handelt.

    Illus­tra­ti­on: KI-gene­rier­t/­Fi­re­fly Image 2 (Beta)/Schwarze

    Fire­fly erschließt erst­mals bes­ser die berüch­tig­te „Black­box“ der künst­li­chen Intel­li­genz: Bei Mid­jour­ney und Co sto­cher­te man bis­her im Nebel, war­um die Maschi­ne gewis­se Bil­der­ele­men­te gene­rier­te und wel­che Sti­le sie beherrscht und war­um die KI sie anwen­det. Bei Fire­fly ist alles fein zise­liert ein­stell­bar – fast wird man erschla­gen von den Mög­lich­kei­ten. Neben der grund­le­gen­den Fest­le­gung auf Foto oder Kunst las­sen sich zum Bei­spiel fol­gen­de Effek­te anwenden:

    Art déco, Jugend­stil, Barock, Bau­haus, Kon­struk­ti­vis­mus, Kubis­mus, Cyber­punk, Fan­ta­sy, Fau­vis­mus, Film noir, Glitch-Kunst, Impres­sio­nis­mus, Indus­trie­de­sign, May­ima­lis­mus, Mini­ma­lis­mus, Moder­ne Kunst, Moder­nism, Neo-Expres­sio­nis­mus, Poin­til­lis­mus, Psy­che­de­lisch, Sci­ence Fic­tion, Steam­punk, Sur­rea­lis­mus, Syn­the­tis­mus, Syn­thwa­ve, Vapor­wa­re, 3D, Ani­me, Car­toon, Kino, Comic, Con­cept Art, Cyber-Matrix, Digi­ta­le Kunst, Fla­che Far­ben, Geo­me­trisch, Glass­mor­phis­mus, Gra­fik-Glitch, Graf­fit­ti, Gra­fik, Hyper­rea­lis­tisch, Innen­aus­stat­tung, Lini­en­ver­lauf, Low-Poly-Art, Zei­tungs­col­la­ge, Opti­sche Täu­schung, Pixel­mus­ter, Pixel-Art, Pop-Art, Pro­dukt­fo­to­gra­fie, Psy­che­de­li­scher Hin­ter­grund, Skan­di­na­visch, Splash-Bil­der, Brief­mar­ke, Trom­pe l’oeil, Vek­tor-Look, Drahtmodell.

    Hin­zu kom­men jeweils eben­so viele

    • Tech­ni­ken von Acryl­far­be bis Gekritzelt,
    • wei­te­re Fil­ter von Fisch­au­ge bis Isometrisch,
    • Mate­ria­len wie Koh­le, Holz­schnit­ze­rei oder Marmor,
    • soge­nann­te Kon­zep­te von Chao­tisch bis Göttlich,
    • Farb­ge­bun­gen von schwarz-weiß bis Pastell,
    • Beleuch­tun­gen von Gegen­licht bis Gol­de­ne Stunde,
    • Kom­po­si­tio­nen von Nah­auf­nah­me bis Vogelperspektive.

    Die Mög­lich­kei­ten bei Fire­fly sind kom­bi­nier­bar und somit endlos.

    Illus­tra­ti­on: KI-gene­rier­t/­Fi­re­fly Image 2 (Beta)/Schwarze

    Ein bereits frü­her ver­wen­de­tes Bei­spiel einer neu­en Brü­cke über dem Mit­tel­rhein brach­te sei­ner­zeit bei Mid­jour­ney fol­gen­des Ergebnis:

    Design an elegant bridge (40 meters tall) over the River of the Rhine in the middle rhine valley, with separate lanes for pedestrians, cars and bikes, that is a finely geometrical fractal shell, nautilus regular logarithmic spiral geometrically developed fibonacci, translucent, parametric architecture grasshopper, in the golden hour time near the lorelei or Boppard
    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze, Prompt: im Alt-Text.

    Bei GPT‑4 mit Dall‑E 3 tobt sich die Maschi­ne bei dem glei­chen Prompt aus und schießt übers Ziel hinaus:

    Illus­tra­ti­on: KI-gene­rier­t/GPT‑4/­Schwar­ze

    Ado­be Fire­fly 2 dage­gen setzt stär­ker auf die Rea­li­tät, fast scheint man die Lore­ley im Hin­ter­grund zu erkennen:

    Illus­tra­ti­on: KI-gene­rier­t/­Fi­re­fly Image 2 (Beta)/Schwarze

    Bei vie­len wei­te­ren Ver­su­chen stell­te sich her­aus, dass mit Ado­be Fire­fly am bes­ten zu steu­ern ist, wie die Maschi­ne agie­ren soll. Aller­dings sind die Ein­stel­lun­gen so viel­fäl­tig, dass sie sich kaum auf Anhieb erschlie­ßen. Ver­such und Irr­tum sind die neu­en Zeit­räu­ber – wie­der ist eine Stun­de weg, ohne dass ein „per­fek­tes“ Ergeb­nis vorliegt.

    Ande­rer­seits kann mit den Werk­zeu­gen nun jeder Anfän­ger eine schnel­le Illus­tra­ti­on für eine Prä­sen­ta­ti­on zau­bern. Der Auf­wand beträgt etwas Gehirn­schmalz für den geeig­ne­ten Prompt – und gege­be­nen­falls etwas Überarbeitung.

    Für den Lokal­jour­na­lis­mus erge­ben sich so neue Mög­lich­kei­ten. Wenn dann tat­säch­lich nach Jahr­zehn­ten der Dis­kus­si­on über eine neue Brü­cke am Mit­tel­rhein eine wich­ti­ge grund­le­gen­de Ent­schei­dung gefällt wur­de – war­um soll­te man sie nicht mit einer Illus­tra­ti­on doku­men­tie­ren, die die Lese­rin­nen und Leser träu­men lässt? Ande­rer­seits wird der Jour­na­list mit einer sol­chen Dar­stel­lung zum Akteur: Kein Pla­nungs­bü­ro, kein Bau­amt hat die­se Ent­wür­fe gemacht, die Kos­ten unab­seh­bar, die Rea­li­sie­rung in jedem Fall frag­lich. Ent­spre­chend als „KI-gene­riert“ zu kenn­zeich­nen sind die­se Bil­der daher allemal.

    fashion photo of a young woman centered straight shot photo shot on Canon EOS R3 f1.8/135 mm of a woman dressed in Gucci, wearing an intricate royal blue dress, natural lighting
    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze. Prompt: sie­he Alt-Text.

    Eines mei­ner Lieb­lings­bil­der der KI, das einer Frau in Guc­ci-Kla­mot­ten (oben), lässt sich bei Fire­fly auch als „Refe­renz­bild“ für neue Krea­tio­nen fest­le­gen. Die Maschi­ne ana­ly­siert dann das Bild und nimmt grund­le­gen­de Erkennt­nis­se für eine neue Dar­stel­lung zum glei­chen Prompt auf. Das Ergebnis:

    Illus­tra­ti­on: KI-gene­rier­t/Ado­be Fire­fly 2 (Beta)/Schwarze.

    Die grund­le­gen­den Ele­men­te, Far­ben, Stim­mun­gen und Details neu auf­zu­neh­men, wird so zur neu­en Mög­lich­keit, ohne Model, Stu­dio, Schweiß und Trä­nen. Ande­rer­seits birgt die KI-Tech­nik die Gefahr, sich in den Tie­fen des Promp­tens zu ver­zet­teln. Und 100-pro­zen­tig authen­tisch wir­ken die Ergeb­nis­se wei­ter­hin nur per Zufall.

  • ChatGPT bekommt Augen: So liest die KI Fotos

    ChatGPT bekommt Augen: So liest die KI Fotos

    Da lädt jemand ein Han­dy­fo­to einer Zeich­nung von einer Kon­fe­renz­ta­fel hoch, die KI macht dar­aus eine funk­tio­nie­ren­de Webseite:

    Jemand aus Ita­li­en lädt ein Foto eines Wohn­zim­mers hoch und bit­tet um Vor­schlä­ge fürs Ver­schö­nern. Die Maschi­ne schlägt unter ande­rem Akzent­far­ben vor, inspi­riert von ita­lie­ni­schem Dekor:

    Eine ver­wir­ren­de Ansamm­lung von Stra­ßen­schil­dern inter­pre­tiert ChatGPT: Ja, Du kannst hier ab 16 Uhr an einem Diens­tag für eine Stun­de parken:

    Ein kaum durch­schau­ba­res Schau­bild zur Insta­bi­li­tät Afgha­ni­stans inter­pre­tiert die Maschi­ne nüchtern-sachlich:

    Den Screen­shot eines Dash­boards baut ChatGPT fast 1:1 nach:

    Prü­fungs­auf­ga­ben der Mathe­ma­tik und Phy­sik, hoch­ge­la­den als Foto, beant­wor­te­te die Maschi­ne mit ent­spre­chen­den For­meln (aller­dings sind die Ant­wor­ten wohl nicht in Gän­ze kor­rekt, wie die Dis­kus­si­on unter dem Tweet zeigt):

    Für eine bestimm­te Innen­ar­chi­tek­tur und das dar­ge­stell­te Design fin­det die Maschi­ne offen­sicht­lich rich­ti­ger­wei­se den Begriff des „Athe­ni­schen Moder­nis­mus“ (ein­fach mal googeln):

    Ope­nAI selbst zeigt, wie ChatGPT durch Bil­der, Anlei­tung und Ein Foto vom Werk­zeug­kof­fer bei einer Hand­wer­ker­auf­ga­be hel­fen kann:

    Und dann war da noch die­ses Video einer ganz ande­ren Bau­stel­le, von Lex Fri­d­man mit Mark Zucker­berg, das erst­mals anschau­lich das viel bespro­che­ne und von vie­len schon wie­der tot­ge­sag­te Meta­ver­se zeigt – einen vir­tu­el­len Raum, an dem die Face­book-Schmie­de Meta feilt. Die Her­ren tra­gen eigent­lich schwe­re Bril­len und Kopf­hö­rer, doch die Tech­nik lässt die Gerä­te ver­schwin­den. Mimik und Spra­che wer­den künst­lich gene­riert, man wähnt sich in einem gemein­sa­men ver­dun­kel­ten Raum:

    Das neue ChatGPT Vision

    … konn­te ich noch nicht tes­ten, die Funk­ti­on wird erst nach und nach aus­ge­rollt. Vie­le wei­te­re Bei­spie­le zei­gen die Leis­tungs­fä­hig­keit, aber auch die Feh­ler. Ope­nAI selbst hat in einem Papier bereits unter­sucht, wel­che Gefah­ren von der neu­en Seh­fä­hig­keit der Maschi­nen aus­ge­hen kön­nen. Sie rei­chen von falsch erkann­ten gif­ti­gen Pil­zen bis zur Befeue­rung von Kli­schees und Vorurteilen.

    Und noch eine Funk­ti­on wird bei ChatGPT gera­de popu­lär: die Fähig­keit, gespro­che­ne Prompts zu erken­nen und gespro­chen zu beant­wor­ten. Das ist zwar mit Blick auf die alten Damen Ale­xa und Siri kei­ne Meis­ter­leis­tung mehr, in Ver­knüp­fung mit KI-Leis­tun­gen im Hin­ter­grund aber für vie­le eben­so kras­ses Neuland.


    Vie­len Dank fürs Lesen von Mar­cus Schwar­zes News­let­ter! Die­ser Post ist öffent­lich, also zögern Sie nicht, ihn zu teilen.


    Mehr zur rasan­ten Ent­wick­lung der künst­li­chen Intel­li­genz bie­tet das Brie­fing Frank­fur­ter All­ge­mei­ne Pro D:ECONOMY. Dar­in auch der „Prompt der Woche“ mit bis­her zwei Bei­trä­gen von mir:

  • Neue Maschinen unter der KI-Motorhaube

    Neue Maschinen unter der KI-Motorhaube

    Zum Bei­spiel Dan­te AI: Neben GPT‑4 von Ope­nAI und dem Vor­gän­ger­mo­dell GPT‑3.5‑Turbo kön­nen neu­er­dings auch das Open-Source-Modell Fal­con LLM und das Modell LlaMA 2 von Face­book-Anbie­ter Meta hin­ter­legt werden.

    Zum Bei­spiel Per­ple­xi­ty AI: Hier kann statt GPT‑4 von Ope­nAI wahl­wei­se auch das Modell Clau­de 2 oder ein eige­nes Modell von Per­ple­xi­ty ein­ge­rich­tet werden.

    Mal eben die Maschi­ne wech­seln: Bei Dan­te AI ste­hen mitt­ler­wei­le meh­re­re Sprach­mo­del­le zur Aus­wahl. (Screen­shot: Schwarze)

    Hin­zu kommt, dass GPT‑4 nach Beob­ach­tung von Fach­leu­ten zuletzt an Qua­li­tät ein­ge­büßt hat. So konn­ten Anwalts­kanz­lei­en vor vier, fünf Mona­ten der Maschi­ne durch­aus brauch­ba­re Vor­la­gen fürs rechts­kon­for­me Inter­net-Impres­sum oder eine Daten­schutz­er­klä­rung ent­lo­cken. Mitt­ler­wei­le pro­du­ziert GPT‑4 häu­fi­ger Müll.

    Auch mir erging es zuletzt häu­fi­ger so: Einst gut funk­tio­nie­ren­de Prompts fürs Zusam­men­fas­sen von Sach­ver­hal­ten in mei­nem, der Maschi­ne antrai­nier­ten Duk­tus las­sen nun häu­fi­ger Anfor­de­run­gen offen. Es half, auf GPT‑3.5 statt 4 zu wechseln.

    GPT‑4 mit nachlassender Qualität

    Die nach­las­sen­de Qua­li­tät von GPT‑4 bestä­tigt in Tei­len eine Stu­die der Uni­ver­si­tä­ten Stan­ford und Ber­ke­ley: In drei von vier getes­te­ten Fel­dern nahm die Leis­tung zwi­schen März und Juni ab. Konn­te die Maschi­ne im März noch 97,6 Pro­zent an Prim­zah­len erken­nen, waren es im Juni nur noch 2,4 Prozent.

    Die KI-Welt wird somit komplizierter.

    Nun könn­te man schluss­fol­gern, dass die Viel­zahl aus Gagafra­gen aus aller Welt bei GPT‑4 in den ver­gan­ge­nen Mona­ten für Ver­wir­rung und Durch­ein­an­der sorgt. Doch hat Open AI stets betont, dass die Chat­ver­läu­fe aus Daten­schutz­grün­den nicht in das Modell ein­flie­ßen. Wahr­schein­li­cher ist, dass die Macher ihr Modell wei­ter­ent­wi­ckeln und vor allem Rechen­zeit pro Anfra­ge ein­spa­ren – nicht immer zum Besten.

    Wie einst in der Schrau­ber­sze­ne für Autos tunen heu­te Enthu­si­as­ten ihre zusam­men­ge­klick­ten KI-Maschi­nen, bau­en etwa ein ande­res Sprach­mo­dell als GPT‑4 als neu­en Motor ein. Wie sich die Moto­ren unter­schei­den, erschließt sich bei den merk­wür­di­gen Namen wie LlaMA und Fal­con aller­dings nur Spe­zia­lis­ten. Schrau­ben dann zusätz­lich die Macher von GPT‑4 im Hin­ter­grund an den Para­me­tern, ist guter Rat teu­er: War­um schwankt die Qua­li­tät der Antworten?

    Die Inge­nieu­re bei Ope­nAI hal­ten sich mit Ant­wor­ten dazu eher zurück. Doch scheint der Markt sich neu zu ori­en­tie­ren: Der Traf­fic auf der Web­sei­te ope​nai​.com ging laut Simi­lar­web von Mai (1,9 Mil­li­ar­den Visits) bis Juli (1,5 Mil­li­ar­den) deut­lich zurück.

    Wer will, baut sich viel­leicht lie­ber auf dem eige­nen Rech­ner eine eige­ne KI nach, dafür gibt es die Anwen­dung GPT4All. Auch hier kön­nen GPT‑4 und 3.5, aber auch LlaMA 2 und ande­re Model­le hin­ter­legt werden.

    Wer sind Sie und was wollen Sie?

    Hin­zu kom­men bei den kom­mer­zi­el­len Diens­ten Per­ple­xi­ty und Dan­te AI vor­zu­ge­ben­de Ran­dum­stän­de, an denen sich die jewei­li­gen KIs ori­en­tie­ren sol­len. Beim her­kömm­li­chen GPT‑4 füllt man dafür zwei Fel­der aus, in denen man zunächst die eige­ne Rol­le („Ich bin CEO und brau­che kla­re, poin­tier­te Ant­wor­ten, auch Hin­wei­se auf mög­li­che feh­ler­haf­te Ent­schei­dun­gen“) und dann die Wün­sche an die Ant­wor­ten for­mu­liert („Genaue Ant­wor­ten, erfin­de nichts“).

    Bei Per­ple­xi­ty soll man ein­ma­lig ein­stel­len, wer man ist, wo man hin­will, was man sonst so macht. (Screen­shot: Schwarze)

    Bei Per­ple­xi­ty AI wird das aus­führ­li­cher. Die Maschi­ne möch­te Infos über den eige­nen Stand­ort, in wel­cher Spra­che zu ant­wor­ten ist, eige­ne Hob­bys und Inter­es­sen, den Beruf und künf­ti­ge Ziele.

    Per­ple­xi­ty gibt dadurch genaue­re Ant­wor­ten, die auf den Fra­gen­den bes­ser abge­stimmt sind. Hin­zu­schalt­bar ist außer­dem ein „Copi­lot“: Dann ant­wor­tet Per­ple­xi­ty nicht ein­fach drauf­los, son­dern stellt durch­aus intel­li­gen­te Ver­ständ­nis­fra­gen. Oder schaut im Inter­net nach.

    Das Nut­zer­inter­face ist dabei gewöh­nungs­be­dürf­tig. So wird fürs Zusam­men­fas­sen eines län­ge­ren Tex­tes zurück­ge­fragt, wel­chen the­ma­ti­schen Schwer­punkt die Zusam­men­fas­sung haben soll – und macht auch gleich kom­ma­se­pa­rier­te Vor­schlä­ge. Will man dann zwei, drei Schwer­punk­te aus­wäh­len, ver­schwin­den sie beim Ankli­cken und müs­sen manu­ell ein­ge­tippt wer­den – lästig.

    Die Maschine schaut selbst im Internet nach

    Inter­es­sant ist Per­ple­xi­ty aber auch des­halb, weil es von Haus aus Inter­net­re­cher­chen zum Beant­wor­ten anstel­len kann. Die Quel­len wer­den ange­ge­ben. Auch ist es mög­lich, eine Datei hoch­zu­la­den und gezielt Fra­gen dazu zu beant­wor­ten. „Wor­um geht es in dem Video?“ – die Fra­ge samt benann­ter You­Tube-Adres­se bringt die Maschi­ne zu einer ordent­li­chen Zusam­men­fas­sung; wenn­gleich sie auch Din­ge aus ande­ren Quel­len hin­ein­mengt, dies aber meist trans­pa­rent macht.

    Per­ple­xi­ty kos­tet wie GPT‑4 20 Dol­lar im Monat. Vor­ein­ge­stellt ist die Nut­zung der eige­nen Chat­ver­läu­fe durch das Unter­neh­men dahin­ter, um das Per­ple­xi­ty-Sprach­mo­dell zu ver­bes­sern. Das kann man abschalten.

    Ins­ge­samt bie­tet Per­ple­xi­ty über GPT‑4 hin­aus­ge­hen­de Funk­tio­nen wie die Alter­na­ti­ve Clau­de 2 als Sprach­mo­dell, das viel län­ge­re Prompts erlaubt, und die schnel­le Live-Suche auf Inter­net­sei­ten. Beim alten GPT‑4 gelingt Ver­gleich­ba­res nur mit Plugins.

    A car in a workshop with its hood open. A female child as a mechanic stands in front of it, tool in hand, she looks into the car's motor, in the process of replacing the conventional engine with a futuristic AI unit. Medium: Photography. Style: Style: Hyper-realism, inspired by the work of Robert Bechtle. Lighting: Natural light filtering through the garage windows. Colors: Earth tones, grays, and metallic hues. Composition: Nikon D850, Nikkor 85mm f/1.4G lens, Resolution 45.7 megapixels, ISO sensitivity: 25,600, Shutter speed 1/200 second.
    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze. Prompt: sie­he Alt-Text.

    Sind Per­ple­xi­ty und Dan­te damit Aspi­ran­ten auf die Nach­fol­ge oder Wach­ab­lö­sung von GPT‑4? Nein, dazu feh­len ihnen weit­ge­hend die eige­nen Trai­nings­da­ten. Doch ist der simp­le Aus­tausch des Motors auch von frem­den Anbie­tern unter der Hau­be etwas, das ChatGPT nicht bie­tet. Und dann ist auch noch die Funk­ti­on „Advan­ced Data Ana­ly­sis“ bei GPT‑4, die das Hoch­la­den eige­ner Doku­men­te erlaubt.

    Der Markt wird unübersichtlich

    Die Funk­tio­na­li­tä­ten der KIs wer­den wei­ter rasant erwei­tert. Der Markt wird für Lai­en zuse­hends unüber­sicht­lich. Rund 7.500 KI-Diens­te ver­sam­melt die „Über­sicht“ namens There’s an AI for that. Was da jeweils unter der Motor­hau­be steckt und Erfolg hat, muss der Markt sich­ten und richten.

    Und da haben wir bis­her nicht über wei­ter­hin agie­ren­de gro­ße alter­na­ti­ve Diens­te wie von Goog­le („Bart“ und „Duet AI“) und der angeb­li­chen euro­päi­schen Alter­na­ti­ve Aleph Alpha aus Hei­del­berg gespro­chen. Für Duet AI habe ich mei­ne Frei­schal­tung zum Tes­ten bean­tragt, bei Aleph Alpha befand ich die Ant­wort­qua­li­tät nach einem Test auf deren Spiel­wie­se nicht kon­kur­renz­fä­hig. Die Ansprü­che steigen.

  • ChatGPT‑4 jetzt mit zwei starken Konkurrenten

    ChatGPT‑4 jetzt mit zwei starken Konkurrenten

    Die Welt der künst­li­chen Intel­li­genz (KI) ist seit ver­gan­ge­ner Woche eine neue. Goog­le Bard ist in Kon­kur­renz zu ChatGPT in Deutsch­land ver­füg­bar. Platz­hirsch ChatGPT hat einen star­ken „Code Inter­pre­ter“ hin­zu­ge­fügt. Und mit Clau­de 2 bringt ein drit­ter leis­tungs­star­ker Prot­ago­nist eine neue Qua­li­tät in KI-Antworten.

    Täg­lich kom­men neue KI-Diens­te hin­zu, spe­zia­li­siert auf bestimm­te Auf­ga­ben. Der wich­tigs­te gro­ße Diens­te im Hin­ter­grund war bis­her in der Regel ChatGPT. Ent­we­der in der kos­ten­lo­sen Ver­si­on 3.5 oder in der kos­ten­pflich­ti­gen Fas­sung 4 für 20 Dol­lar pro Monat. Eine neue Qua­li­tät erreich­te die Vie­rer­ver­si­on seit der ver­gan­ge­nen Woche durch ein Plug­in namens Code Inter­pre­ter. (Hier beschrieb ich, was es damit auf sich hat: End­lich Excel kön­nen ohne Excel zu kön­nen.)

    Die künst­li­che Intel­li­genz von Goog­le war unter dem Namen Bard bis­her nur in den USA und Groß­bri­tan­ni­en nutz­bar. Jetzt geht es auch in Deutsch­land und ande­ren Län­dern. Ers­te Ver­glei­che mit ChatGPT zei­gen, dass Goog­le Bard bes­ser dar­in ist, aus­führ­li­che und fak­ten­ge­treue Ant­wor­ten zu geben. ChatGPT dage­gen hat bei phan­ta­sie­vol­len Inhal­ten die Nase vorn, beson­ders in der Ver­si­on 4. Die älte­re Ver­si­on 3.5 hält sich dage­gen näher an vor­ge­ge­be­ne Fakten.

    Clau­de 2 von Anthro­pic legt dage­gen wenig Wert auf phan­ta­sie­vol­le Inhal­te. Die Maschi­ne hin­ter­ließ im Ver­gleich aller drei Diens­te in den ver­gan­ge­nen Tagen den bes­ten Ein­druck, was Akku­rat­heit und Ant­wort­qua­li­tät angeht. Zudem ist der Dienst ähn­lich wie Bard und anders als GPT‑4 kos­ten­los. Her­aus­ra­gend ist eine Funk­ti­on, eige­ne Doku­men­te hoch­zu­la­den. Bis zu fünf PDFs las­sen sich hoch­la­den und ana­ly­sie­ren. Die Maschi­ne fasst die wich­tigs­ten Inhal­te zusam­men und erlaubt geziel­te Fragen.

    Aller­dings: Clau­de 2 funk­tio­niert zur­zeit nur in den USA und Groß­bri­tan­ni­en. Euro­pä­er müs­sen sich per VPN in den USA ein­wäh­len, um sich bei Clau­de anzu­mel­den. Mög­lich wird das zum Bei­spiel über Diens­te wie Bit­de­fen­der oder NordVPN.