Ich mache gerade einen Kurs zu Claude Code und Command Line für Journalist:innen (Advanced Prompt Engineering for Journalists) und es kommen so ein paar "42-Feelings" auf.

df5hz@radiosocial.de

@stekopf Ich denke, der Testausfwand wird steigen, aber da man die Tests ebenfalls generiert und automatisiert, wird es eher akzeptiert werden

df5hz@radiosocial.de

@343max Es geht nicht um 1 oder 0. Und natürlich kann man es von Hand patchen.
Ich erwarte jedoch, dass es in etlichen Bereichen dazu kommen wird, dass man bei Fehler die Eingaben anpassen und anschließend alles neu generieren wird. Massive, automatisierte (generierte) Tests werden die Lieferung stützen.
Das Vorgehen wird ähnlich sein, wie in Regelsystemen, in denen man auch das Simulink-Modell anpasst und nicht den daraus generierten Code.

df5hz@radiosocial.de

@stekopf Um es vielleicht noch zu ergänzen: Ich bin kein Freund von Vibe-Coding. Aber ich sehe, was gerade in einigen großen Konzernen passiert.
Ich persönlich habe Software für lebenserhaltene Embedded-Systeme entwickelt und würde so etwas derzeit nicht an ein LLM abgeben.

lupinoarts@mstdn.social

@df5hz das geht doch völlig am Thema vorbei... Wenn ich in einer handgeschriebenen Software Fehler entdecke, mach ich einen Bug-Report an die MaintainerInnen und die fixen das mehr oder weniger schnell. Das kann ich von einem Vibe-Coder i.d.R. nicht erwarten, da er nur in den seltensten Fällen überhaupt versteht, was er da die "KI" hat zusammenhalluzinieren lassen. Und zum Thema "du promptest nur falsch" verweis ich mal hier drauf: https://win-vector.com/2023/04/22/the-sell-as-scam/ @well030 @343max @stekopf

df5hz@radiosocial.de

@LupinoArts @well030 @343max @stekopf Der Prozess ist mit generierter SW nur unwesentlich anders: Bug Report, MaintainerInnen checken Prompt oder Modell aus, ergänzen und ändern, was notwendig ist und generieren neu. Den Code muss man nicht verstehen, sondern die Eingabedaten. Weder den Code eines LLM noch von Simulink oder anderen Generatoren.
Man kann es nicht gut finden. Ich finde es nicht gut aber ich rechne damit, dass es bald normal sein wird.

well030@mastodon.online

@df5hz @LupinoArts @343max @stekopf Dazu muss man aber erstmal wissen, dass der Fehler da ist. Und das über den Kunden per Reifen als Bananenprodukt zu machen, fördert nicht die Kundenzufriedenheit.

df5hz@radiosocial.de

@well030 @LupinoArts @343max @stekopf Das ist klar aber leider Alltag.

well030@mastodon.online

@df5hz @343max @stekopf @LupinoArts Es geht dabei immer um die Menge und Qualität der Fehler. Und jede Verschlechterung bei diesen Werten wird von Kunden nicht geschätzt

343max@mastodon.social

@df5hz @LupinoArts @well030 @stekopf Ich bezweifle, dass das bei auch nur mäßig komplexer Software funktionieren wird. Und: warum sollte man das so machen? Es hat massive Nachteile, aber ich sehe keine wirklichen Vorteile.

df5hz@radiosocial.de

@343max @LupinoArts @well030 @stekopf mit Simulink oder Generatoren, die Modelle in Software übersetzen, arbeite ich seit rund 20 Jahren in komplexen embedded Systemen. Dort fixt man das Modell, generiert neu bzw. hat den Generator in der Pipeline integriert.

well030@mastodon.online

@df5hz @LupinoArts @343max @stekopf Mir scheint der Anfang des Threads ist aus deinem Kontextfenster raus gerutscht.

343max@mastodon.social

@df5hz @LupinoArts @well030 @stekopf Okay. Aber was hat das mit klassischer Softwareentwicklung zu tun?

moon@norden.social

@evawolfangel Was passiert, wenn man eine KI eine oder zwei andere factchecken lässt? Dann hat man zumindest schon mal Hinweise, wo man genau suchen sollte?

evawolfangel@chaos.social

@moon ja, so mache ich’s gerade, wenn ich mir unsicher bin. Ich frage zwei und frage nach Quellen und lese im Internet nach. So kommt man schon irgendwie durchs Leben, ist aber halt mühsam. 🤪

evawolfangel@chaos.social

@pantaRhei vielen Dank, das passt sehr gut zu meiner aktuellen Recherche. Ich hab so so viele Daten auf offen im Netz gefunden. Ich bin schon wieder auf 180. @steigerlegal

moon@norden.social

@evawolfangel Ja, schon, aber vor KI war es m.E. mühsamer. Wenn ich meine Fachartikel (für Unternehmensblog) alleine mit Unterstützung meiner fachkundigen Kolleg:innen und Fachliteratur schreiben müsste, käme ich im Monat vielleicht auf einen 🤪. Heute lasse ich KIs recherchieren, das Gerüst aufbauen und lasse mein Team gegenchecken. Die finden immer was, was nicht ganz rund ist. Aber es geht doch deutlich schneller, als vorher.

sl007@digitalcourage.social

@evawolfangel

Claude Code triggert sehr.
"Einige von uns" [vgl. Muntz, Nelson] coden 16 Stunden am Tag ehrenamtlich fürs fedi. Dann klauen irgendwelche KIs und machen den Code sehr schlecht, verstecken Werbung darin und what next?

Eine spannende Geschichte fände ich, warum das heimliche Zwangs-Opt-Out bei github legal sein kann …
https://digitalcourage.social/@sl007/116413574167687584

Ein schönes virtuelles Treffen vielleicht zusammen mit https://journocode.com/de/ fände ich "Frag nicht KI, vertrau lieber Dir selber." (oder andere niedrigschwellige Angebote mit besserem Titel)

taschenorakel@mastodon.green

@df5hz Uh! Ganz großer Dunning-Kruger, denn Du hier pullst!

Dein Compiler wurde gezielt entworfen, seine Aufgabe zu erfüllten. Permanent abgesichert und geprüft durch Peer-Review, Unit-Tests gegen Spezifikationen, Regressions- und Integrations-Tests.

Also alles was teuer ist und bei Vibe-Programming fehlt. Schlimmer noch: Finde einen LLM-Entwickler, der Dir erklären kann, warum Dein LLM Dir eine bestimmte Word-Completion auf Deine Vorgabe liefert.

@343max @evawolfangel

taschenorakel@mastodon.green

@df5hz Äpfel und Birnen.

@LupinoArts @343max @evawolfangel

taschenorakel@mastodon.green

@df5hz Ufff!!!

Dir ist aber schon bewusst, dass mit wachsender Context-Größe die Reaktionen eines LLM immer unvorhersagbarer und fehlerhafter werden?

Trollst Du?

@343max @stekopf @LupinoArts

CIRCLE WITH A DOT

Ich mache gerade einen Kurs zu Claude Code und Command Line für Journalist:innen (Advanced Prompt Engineering for Journalists) und es kommen so ein paar "42-Feelings" auf.

Patientendaten stehen nach «Vibe Coding» mit KI offen im Internet – Steiger Legal