Ich mache gerade einen Kurs zu Claude Code und Command Line für Journalist:innen (Advanced Prompt Engineering for Journalists) und es kommen so ein paar "42-Feelings" auf.
-
Genau, dann ist man wieder hier: https://mastodon.social/@343max/116413883282819847
Der Testaufwand dürfte ergeblich höher sein?
@stekopf Ich denke, der Testausfwand wird steigen, aber da man die Tests ebenfalls generiert und automatisiert, wird es eher akzeptiert werden
-
@df5hz @stekopf @LupinoArts Vielleicht, aber dafür muss man sich das trotzdem erst mal anschauen. Wobei ich ich es auch für Quatsch halte, dass man Fehler nur per Prompten fixen darf. Viele Probleme sind schneller per Hand gefixt als der LLM dabei zuzusehen bis der Groschen fällt.
@343max Es geht nicht um 1 oder 0. Und natürlich kann man es von Hand patchen.
Ich erwarte jedoch, dass es in etlichen Bereichen dazu kommen wird, dass man bei Fehler die Eingaben anpassen und anschließend alles neu generieren wird. Massive, automatisierte (generierte) Tests werden die Lieferung stützen.
Das Vorgehen wird ähnlich sein, wie in Regelsystemen, in denen man auch das Simulink-Modell anpasst und nicht den daraus generierten Code. -
@stekopf Ich denke, der Testausfwand wird steigen, aber da man die Tests ebenfalls generiert und automatisiert, wird es eher akzeptiert werden
@stekopf Um es vielleicht noch zu ergänzen: Ich bin kein Freund von Vibe-Coding. Aber ich sehe, was gerade in einigen großen Konzernen passiert.
Ich persönlich habe Software für lebenserhaltene Embedded-Systeme entwickelt und würde so etwas derzeit nicht an ein LLM abgeben. -
@well030 @343max @stekopf @LupinoArts Man sollte nicht so tun als würde nur fehlerfreie Software ausgeliefert werden. In der Regel wird mit Fehler behaftete Software ausgeliefert, wenn die Projekte etwas größer werden.
Die Statistik sagt für durchschnittliche Applikationssoftware im Schnitt 5-10 Bugs/kLoC. Hohe Qualität ist im Bereich 0,5-5 Bugs/kLoC.
Ich weiß, dass es besser geht, aber mit höheren Kosten verbunden ist.@df5hz das geht doch völlig am Thema vorbei... Wenn ich in einer handgeschriebenen Software Fehler entdecke, mach ich einen Bug-Report an die MaintainerInnen und die fixen das mehr oder weniger schnell. Das kann ich von einem Vibe-Coder i.d.R. nicht erwarten, da er nur in den seltensten Fällen überhaupt versteht, was er da die "KI" hat zusammenhalluzinieren lassen. Und zum Thema "du promptest nur falsch" verweis ich mal hier drauf: https://win-vector.com/2023/04/22/the-sell-as-scam/ @well030 @343max @stekopf
-
@df5hz das geht doch völlig am Thema vorbei... Wenn ich in einer handgeschriebenen Software Fehler entdecke, mach ich einen Bug-Report an die MaintainerInnen und die fixen das mehr oder weniger schnell. Das kann ich von einem Vibe-Coder i.d.R. nicht erwarten, da er nur in den seltensten Fällen überhaupt versteht, was er da die "KI" hat zusammenhalluzinieren lassen. Und zum Thema "du promptest nur falsch" verweis ich mal hier drauf: https://win-vector.com/2023/04/22/the-sell-as-scam/ @well030 @343max @stekopf
@LupinoArts @well030 @343max @stekopf Der Prozess ist mit generierter SW nur unwesentlich anders: Bug Report, MaintainerInnen checken Prompt oder Modell aus, ergänzen und ändern, was notwendig ist und generieren neu. Den Code muss man nicht verstehen, sondern die Eingabedaten. Weder den Code eines LLM noch von Simulink oder anderen Generatoren.
Man kann es nicht gut finden. Ich finde es nicht gut aber ich rechne damit, dass es bald normal sein wird. -
@LupinoArts @well030 @343max @stekopf Der Prozess ist mit generierter SW nur unwesentlich anders: Bug Report, MaintainerInnen checken Prompt oder Modell aus, ergänzen und ändern, was notwendig ist und generieren neu. Den Code muss man nicht verstehen, sondern die Eingabedaten. Weder den Code eines LLM noch von Simulink oder anderen Generatoren.
Man kann es nicht gut finden. Ich finde es nicht gut aber ich rechne damit, dass es bald normal sein wird.@df5hz @LupinoArts @343max @stekopf Dazu muss man aber erstmal wissen, dass der Fehler da ist. Und das über den Kunden per Reifen als Bananenprodukt zu machen, fördert nicht die Kundenzufriedenheit.
-
@df5hz @LupinoArts @343max @stekopf Dazu muss man aber erstmal wissen, dass der Fehler da ist. Und das über den Kunden per Reifen als Bananenprodukt zu machen, fördert nicht die Kundenzufriedenheit.
@well030 @LupinoArts @343max @stekopf Das ist klar aber leider Alltag.
-
@well030 @343max @stekopf @LupinoArts Man sollte nicht so tun als würde nur fehlerfreie Software ausgeliefert werden. In der Regel wird mit Fehler behaftete Software ausgeliefert, wenn die Projekte etwas größer werden.
Die Statistik sagt für durchschnittliche Applikationssoftware im Schnitt 5-10 Bugs/kLoC. Hohe Qualität ist im Bereich 0,5-5 Bugs/kLoC.
Ich weiß, dass es besser geht, aber mit höheren Kosten verbunden ist.@df5hz @343max @stekopf @LupinoArts Es geht dabei immer um die Menge und Qualität der Fehler. Und jede Verschlechterung bei diesen Werten wird von Kunden nicht geschätzt
-
@LupinoArts @well030 @343max @stekopf Der Prozess ist mit generierter SW nur unwesentlich anders: Bug Report, MaintainerInnen checken Prompt oder Modell aus, ergänzen und ändern, was notwendig ist und generieren neu. Den Code muss man nicht verstehen, sondern die Eingabedaten. Weder den Code eines LLM noch von Simulink oder anderen Generatoren.
Man kann es nicht gut finden. Ich finde es nicht gut aber ich rechne damit, dass es bald normal sein wird.@df5hz @LupinoArts @well030 @stekopf Ich bezweifle, dass das bei auch nur mäßig komplexer Software funktionieren wird. Und: warum sollte man das so machen? Es hat massive Nachteile, aber ich sehe keine wirklichen Vorteile.
-
@df5hz @LupinoArts @well030 @stekopf Ich bezweifle, dass das bei auch nur mäßig komplexer Software funktionieren wird. Und: warum sollte man das so machen? Es hat massive Nachteile, aber ich sehe keine wirklichen Vorteile.
@343max @LupinoArts @well030 @stekopf mit Simulink oder Generatoren, die Modelle in Software übersetzen, arbeite ich seit rund 20 Jahren in komplexen embedded Systemen. Dort fixt man das Modell, generiert neu bzw. hat den Generator in der Pipeline integriert.
-
@well030 @LupinoArts @343max @stekopf Das ist klar aber leider Alltag.
@df5hz @LupinoArts @343max @stekopf Mir scheint der Anfang des Threads ist aus deinem Kontextfenster raus gerutscht.
-
@343max @LupinoArts @well030 @stekopf mit Simulink oder Generatoren, die Modelle in Software übersetzen, arbeite ich seit rund 20 Jahren in komplexen embedded Systemen. Dort fixt man das Modell, generiert neu bzw. hat den Generator in der Pipeline integriert.
@df5hz @LupinoArts @well030 @stekopf Okay. Aber was hat das mit klassischer Softwareentwicklung zu tun?
-
Ich mache gerade einen Kurs zu Claude Code und Command Line für Journalist:innen (Advanced Prompt Engineering for Journalists) und es kommen so ein paar "42-Feelings" auf. Ihr erinnert euch? An der Schule 42 habe ich schon mal versucht, programmieren zu lernen - und das war...irgendwie krass. Auch der jetzige Kurs ist overwhelming und der Kursleiter arbeitet dran, sich selbst abzuschaffen, weil er bei jeder Frage sagt: "Frag doch KI". Hahaha wieso mache ich denn einen Kurs mit einem Menschen??
@evawolfangel Was passiert, wenn man eine KI eine oder zwei andere factchecken lässt? Dann hat man zumindest schon mal Hinweise, wo man genau suchen sollte?
-
@evawolfangel Was passiert, wenn man eine KI eine oder zwei andere factchecken lässt? Dann hat man zumindest schon mal Hinweise, wo man genau suchen sollte?
@moon ja, so mache ich’s gerade, wenn ich mir unsicher bin. Ich frage zwei und frage nach Quellen und lese im Internet nach. So kommt man schon irgendwie durchs Leben, ist aber halt mühsam. 🤪
-
@evawolfangel das Thema Vibe Coding und sensible Daten hatte @steigerlegal letztens schon mal aufgegriffen - „Patientendaten stehen nach «Vibe Coding» mit KI offen im Internet“:
Patientendaten stehen nach «Vibe Coding» mit KI offen im Internet – Steiger Legal
«Vibe Coding» mit KI führte bei einer medizinischen Leistungserbringerin in der Schweiz dazu, dass die Daten aller Patienten offen im Internet standen. Tobias Brunner, ein schweizerischer Blogger, beschreibt seine als …
Steiger Legal (steigerlegal.ch)
@pantaRhei vielen Dank, das passt sehr gut zu meiner aktuellen Recherche. Ich hab so so viele Daten auf offen im Netz gefunden. Ich bin schon wieder auf 180. @steigerlegal
-
@moon ja, so mache ich’s gerade, wenn ich mir unsicher bin. Ich frage zwei und frage nach Quellen und lese im Internet nach. So kommt man schon irgendwie durchs Leben, ist aber halt mühsam. 🤪
@evawolfangel Ja, schon, aber vor KI war es m.E. mühsamer. Wenn ich meine Fachartikel (für Unternehmensblog) alleine mit Unterstützung meiner fachkundigen Kolleg:innen und Fachliteratur schreiben müsste, käme ich im Monat vielleicht auf einen 🤪. Heute lasse ich KIs recherchieren, das Gerüst aufbauen und lasse mein Team gegenchecken. Die finden immer was, was nicht ganz rund ist. Aber es geht doch deutlich schneller, als vorher.
-
@sl007 haha danke, ja, ich fühle mich allein mit meiner KI - und bin mir noch nicht sicher, ob ich den Kurs empfehlen kann.

Gerade wurde die einzige Live-Session nach hinten verschoben und ist inzischen um 23 Uhr deutsche Zeit (obwohl die aktivsten TN aus Europa sind). Ich vermute, er hat Angat vor meinen Fragen und hofft, dass ich dann schon schlafe.
Claude Code triggert sehr.
"Einige von uns" [vgl. Muntz, Nelson] coden 16 Stunden am Tag ehrenamtlich fürs fedi. Dann klauen irgendwelche KIs und machen den Code sehr schlecht, verstecken Werbung darin und what next?Eine spannende Geschichte fände ich, warum das heimliche Zwangs-Opt-Out bei github legal sein kann …
https://digitalcourage.social/@sl007/116413574167687584Ein schönes virtuelles Treffen vielleicht zusammen mit https://journocode.com/de/ fände ich "Frag nicht KI, vertrau lieber Dir selber." (oder andere niedrigschwellige Angebote mit besserem Titel)
-
@343max @evawolfangel um ehrlich zu sein: wie oft hast Du schon einen Compiler qualifiziert, der Dein Programm in Assembler umsetzt?
Oder verlässt Du Dich darauf, dass der Compiler richtig arbeitet und die angezogen Libs auch?@df5hz Uh! Ganz großer Dunning-Kruger, denn Du hier pullst!
Dein Compiler wurde gezielt entworfen, seine Aufgabe zu erfüllten. Permanent abgesichert und geprüft durch Peer-Review, Unit-Tests gegen Spezifikationen, Regressions- und Integrations-Tests.
Also alles was teuer ist und bei Vibe-Programming fehlt. Schlimmer noch: Finde einen LLM-Entwickler, der Dir erklären kann, warum Dein LLM Dir eine bestimmte Word-Completion auf Deine Vorgabe liefert.
-
@LupinoArts @343max @evawolfangel und wenn man Menschen 2x die gleichen Anforderungen gibt, kommt 2x das gleiche Programm raus?
@df5hz Äpfel und Birnen.
-
@343max @stekopf @LupinoArts aber wenn man auf vibe-coding setzt, muss man nicht anfangen, das Zeug von Hand zu fixen, sondern muss die Fehler in der Eingabe beheben.
@df5hz Ufff!!!
Dir ist aber schon bewusst, dass mit wachsender Context-Größe die Reaktionen eines LLM immer unvorhersagbarer und fehlerhafter werden?
Trollst Du?