Ich mache gerade einen Kurs zu Claude Code und Command Line für Journalist:innen (Advanced Prompt Engineering for Journalists) und es kommen so ein paar "42-Feelings" auf.
-
@df5hz @stekopf @LupinoArts Vielleicht, aber dafür muss man sich das trotzdem erst mal anschauen. Wobei ich ich es auch für Quatsch halte, dass man Fehler nur per Prompten fixen darf. Viele Probleme sind schneller per Hand gefixt als der LLM dabei zuzusehen bis der Groschen fällt.
Genau, dann ist man wieder hier: https://mastodon.social/@343max/116413883282819847
Der Testaufwand dürfte ergeblich höher sein?
-
@343max @stekopf @LupinoArts aber wenn man auf vibe-coding setzt, muss man nicht anfangen, das Zeug von Hand zu fixen, sondern muss die Fehler in der Eingabe beheben.
@df5hz @343max @stekopf @LupinoArts Dazu muss man die Fehler erstmal bemerken, bevor der Mist beim Kunden ist.
-
Ich mache gerade einen Kurs zu Claude Code und Command Line für Journalist:innen (Advanced Prompt Engineering for Journalists) und es kommen so ein paar "42-Feelings" auf. Ihr erinnert euch? An der Schule 42 habe ich schon mal versucht, programmieren zu lernen - und das war...irgendwie krass. Auch der jetzige Kurs ist overwhelming und der Kursleiter arbeitet dran, sich selbst abzuschaffen, weil er bei jeder Frage sagt: "Frag doch KI". Hahaha wieso mache ich denn einen Kurs mit einem Menschen??
@evawolfangel So lernt man doch kein Programmieren, geschweige denn eine CL sinnvoll zu benutzen (welche btw einfach nur eine Texteingabe für Befehle ist).
Für skripting Anwendungen ist es vielleicht geeignet,
aber für längerfristige Projekte mit Verlässlichkeitsanforderungen ist Chaos vorprogrammiert, zumal keiner weiß ob das Programm das macht was es machen soll.Programmieren ist in der Informatik, wie Schreiben im Journalismus – das Werkzeug aber nicht die Kunst (Hoffe der Vergleich hilft).
-
"Frag doch KI" geht gerne mal schief. Natürlich kann man versuchen, die Auskünfte von KI factzuchecken etc. Aber das ist sehr mühsam, und je weiter man sich in ein Territorium wagt, in dem man nicht so genau bescheid weiß, auch riskant. Gerade jetzt, wo es in Richtung Vibe-Coding geht, will ich mich eben nicht darauf verlassen, dass die KI schon richtig liegt. Weil: die Scherben anderer Vibe-Coder liegen vor meinen Füßen bzw deren sensible Daten in meinen Händen. (Stay tuned, Text in the making)
@evawolfangel das Thema Vibe Coding und sensible Daten hatte @steigerlegal letztens schon mal aufgegriffen - „Patientendaten stehen nach «Vibe Coding» mit KI offen im Internet“:
Patientendaten stehen nach «Vibe Coding» mit KI offen im Internet – Steiger Legal
«Vibe Coding» mit KI führte bei einer medizinischen Leistungserbringerin in der Schweiz dazu, dass die Daten aller Patienten offen im Internet standen. Tobias Brunner, ein schweizerischer Blogger, beschreibt seine als …
Steiger Legal (steigerlegal.ch)
-
@df5hz @343max @stekopf @LupinoArts Dazu muss man die Fehler erstmal bemerken, bevor der Mist beim Kunden ist.
@well030 @343max @stekopf @LupinoArts Man sollte nicht so tun als würde nur fehlerfreie Software ausgeliefert werden. In der Regel wird mit Fehler behaftete Software ausgeliefert, wenn die Projekte etwas größer werden.
Die Statistik sagt für durchschnittliche Applikationssoftware im Schnitt 5-10 Bugs/kLoC. Hohe Qualität ist im Bereich 0,5-5 Bugs/kLoC.
Ich weiß, dass es besser geht, aber mit höheren Kosten verbunden ist. -
Genau, dann ist man wieder hier: https://mastodon.social/@343max/116413883282819847
Der Testaufwand dürfte ergeblich höher sein?
@stekopf Ich denke, der Testausfwand wird steigen, aber da man die Tests ebenfalls generiert und automatisiert, wird es eher akzeptiert werden
-
@df5hz @stekopf @LupinoArts Vielleicht, aber dafür muss man sich das trotzdem erst mal anschauen. Wobei ich ich es auch für Quatsch halte, dass man Fehler nur per Prompten fixen darf. Viele Probleme sind schneller per Hand gefixt als der LLM dabei zuzusehen bis der Groschen fällt.
@343max Es geht nicht um 1 oder 0. Und natürlich kann man es von Hand patchen.
Ich erwarte jedoch, dass es in etlichen Bereichen dazu kommen wird, dass man bei Fehler die Eingaben anpassen und anschließend alles neu generieren wird. Massive, automatisierte (generierte) Tests werden die Lieferung stützen.
Das Vorgehen wird ähnlich sein, wie in Regelsystemen, in denen man auch das Simulink-Modell anpasst und nicht den daraus generierten Code. -
@stekopf Ich denke, der Testausfwand wird steigen, aber da man die Tests ebenfalls generiert und automatisiert, wird es eher akzeptiert werden
@stekopf Um es vielleicht noch zu ergänzen: Ich bin kein Freund von Vibe-Coding. Aber ich sehe, was gerade in einigen großen Konzernen passiert.
Ich persönlich habe Software für lebenserhaltene Embedded-Systeme entwickelt und würde so etwas derzeit nicht an ein LLM abgeben. -
@well030 @343max @stekopf @LupinoArts Man sollte nicht so tun als würde nur fehlerfreie Software ausgeliefert werden. In der Regel wird mit Fehler behaftete Software ausgeliefert, wenn die Projekte etwas größer werden.
Die Statistik sagt für durchschnittliche Applikationssoftware im Schnitt 5-10 Bugs/kLoC. Hohe Qualität ist im Bereich 0,5-5 Bugs/kLoC.
Ich weiß, dass es besser geht, aber mit höheren Kosten verbunden ist.@df5hz das geht doch völlig am Thema vorbei... Wenn ich in einer handgeschriebenen Software Fehler entdecke, mach ich einen Bug-Report an die MaintainerInnen und die fixen das mehr oder weniger schnell. Das kann ich von einem Vibe-Coder i.d.R. nicht erwarten, da er nur in den seltensten Fällen überhaupt versteht, was er da die "KI" hat zusammenhalluzinieren lassen. Und zum Thema "du promptest nur falsch" verweis ich mal hier drauf: https://win-vector.com/2023/04/22/the-sell-as-scam/ @well030 @343max @stekopf
-
@df5hz das geht doch völlig am Thema vorbei... Wenn ich in einer handgeschriebenen Software Fehler entdecke, mach ich einen Bug-Report an die MaintainerInnen und die fixen das mehr oder weniger schnell. Das kann ich von einem Vibe-Coder i.d.R. nicht erwarten, da er nur in den seltensten Fällen überhaupt versteht, was er da die "KI" hat zusammenhalluzinieren lassen. Und zum Thema "du promptest nur falsch" verweis ich mal hier drauf: https://win-vector.com/2023/04/22/the-sell-as-scam/ @well030 @343max @stekopf
@LupinoArts @well030 @343max @stekopf Der Prozess ist mit generierter SW nur unwesentlich anders: Bug Report, MaintainerInnen checken Prompt oder Modell aus, ergänzen und ändern, was notwendig ist und generieren neu. Den Code muss man nicht verstehen, sondern die Eingabedaten. Weder den Code eines LLM noch von Simulink oder anderen Generatoren.
Man kann es nicht gut finden. Ich finde es nicht gut aber ich rechne damit, dass es bald normal sein wird. -
@LupinoArts @well030 @343max @stekopf Der Prozess ist mit generierter SW nur unwesentlich anders: Bug Report, MaintainerInnen checken Prompt oder Modell aus, ergänzen und ändern, was notwendig ist und generieren neu. Den Code muss man nicht verstehen, sondern die Eingabedaten. Weder den Code eines LLM noch von Simulink oder anderen Generatoren.
Man kann es nicht gut finden. Ich finde es nicht gut aber ich rechne damit, dass es bald normal sein wird.@df5hz @LupinoArts @343max @stekopf Dazu muss man aber erstmal wissen, dass der Fehler da ist. Und das über den Kunden per Reifen als Bananenprodukt zu machen, fördert nicht die Kundenzufriedenheit.
-
@df5hz @LupinoArts @343max @stekopf Dazu muss man aber erstmal wissen, dass der Fehler da ist. Und das über den Kunden per Reifen als Bananenprodukt zu machen, fördert nicht die Kundenzufriedenheit.
@well030 @LupinoArts @343max @stekopf Das ist klar aber leider Alltag.
-
@well030 @343max @stekopf @LupinoArts Man sollte nicht so tun als würde nur fehlerfreie Software ausgeliefert werden. In der Regel wird mit Fehler behaftete Software ausgeliefert, wenn die Projekte etwas größer werden.
Die Statistik sagt für durchschnittliche Applikationssoftware im Schnitt 5-10 Bugs/kLoC. Hohe Qualität ist im Bereich 0,5-5 Bugs/kLoC.
Ich weiß, dass es besser geht, aber mit höheren Kosten verbunden ist.@df5hz @343max @stekopf @LupinoArts Es geht dabei immer um die Menge und Qualität der Fehler. Und jede Verschlechterung bei diesen Werten wird von Kunden nicht geschätzt
-
@LupinoArts @well030 @343max @stekopf Der Prozess ist mit generierter SW nur unwesentlich anders: Bug Report, MaintainerInnen checken Prompt oder Modell aus, ergänzen und ändern, was notwendig ist und generieren neu. Den Code muss man nicht verstehen, sondern die Eingabedaten. Weder den Code eines LLM noch von Simulink oder anderen Generatoren.
Man kann es nicht gut finden. Ich finde es nicht gut aber ich rechne damit, dass es bald normal sein wird.@df5hz @LupinoArts @well030 @stekopf Ich bezweifle, dass das bei auch nur mäßig komplexer Software funktionieren wird. Und: warum sollte man das so machen? Es hat massive Nachteile, aber ich sehe keine wirklichen Vorteile.
-
@df5hz @LupinoArts @well030 @stekopf Ich bezweifle, dass das bei auch nur mäßig komplexer Software funktionieren wird. Und: warum sollte man das so machen? Es hat massive Nachteile, aber ich sehe keine wirklichen Vorteile.
@343max @LupinoArts @well030 @stekopf mit Simulink oder Generatoren, die Modelle in Software übersetzen, arbeite ich seit rund 20 Jahren in komplexen embedded Systemen. Dort fixt man das Modell, generiert neu bzw. hat den Generator in der Pipeline integriert.
-
@well030 @LupinoArts @343max @stekopf Das ist klar aber leider Alltag.
@df5hz @LupinoArts @343max @stekopf Mir scheint der Anfang des Threads ist aus deinem Kontextfenster raus gerutscht.
-
@343max @LupinoArts @well030 @stekopf mit Simulink oder Generatoren, die Modelle in Software übersetzen, arbeite ich seit rund 20 Jahren in komplexen embedded Systemen. Dort fixt man das Modell, generiert neu bzw. hat den Generator in der Pipeline integriert.
@df5hz @LupinoArts @well030 @stekopf Okay. Aber was hat das mit klassischer Softwareentwicklung zu tun?
-
Ich mache gerade einen Kurs zu Claude Code und Command Line für Journalist:innen (Advanced Prompt Engineering for Journalists) und es kommen so ein paar "42-Feelings" auf. Ihr erinnert euch? An der Schule 42 habe ich schon mal versucht, programmieren zu lernen - und das war...irgendwie krass. Auch der jetzige Kurs ist overwhelming und der Kursleiter arbeitet dran, sich selbst abzuschaffen, weil er bei jeder Frage sagt: "Frag doch KI". Hahaha wieso mache ich denn einen Kurs mit einem Menschen??
@evawolfangel Was passiert, wenn man eine KI eine oder zwei andere factchecken lässt? Dann hat man zumindest schon mal Hinweise, wo man genau suchen sollte?
-
@evawolfangel Was passiert, wenn man eine KI eine oder zwei andere factchecken lässt? Dann hat man zumindest schon mal Hinweise, wo man genau suchen sollte?
@moon ja, so mache ich’s gerade, wenn ich mir unsicher bin. Ich frage zwei und frage nach Quellen und lese im Internet nach. So kommt man schon irgendwie durchs Leben, ist aber halt mühsam. 🤪
-
@evawolfangel das Thema Vibe Coding und sensible Daten hatte @steigerlegal letztens schon mal aufgegriffen - „Patientendaten stehen nach «Vibe Coding» mit KI offen im Internet“:
Patientendaten stehen nach «Vibe Coding» mit KI offen im Internet – Steiger Legal
«Vibe Coding» mit KI führte bei einer medizinischen Leistungserbringerin in der Schweiz dazu, dass die Daten aller Patienten offen im Internet standen. Tobias Brunner, ein schweizerischer Blogger, beschreibt seine als …
Steiger Legal (steigerlegal.ch)
@pantaRhei vielen Dank, das passt sehr gut zu meiner aktuellen Recherche. Ich hab so so viele Daten auf offen im Netz gefunden. Ich bin schon wieder auf 180. @steigerlegal