OpenAI hat gestern GPT-5 veröffentlicht mit dem Fokus auf Coding. GPT-5 ist (noch) nicht AGI, aber es soll praktisch über alle Benchmarks eine klare Verbesserung zu GPT-4o und o3 darstellen.
Witzig ist auch, dass GPT-5 anscheinend einen Benchmark-Chart zu seinen Gunsten manipuliert hat. Oder war es doch OpenAI?
Auch die Halluzinations-Rate soll sich bei manchen Benchmarks stark verbessert haben. Von etwa 5% auf knapp 1%.
Habe gerade die Programmierkenntnisse von GPT-5 getestet, und habe gleich eine halluzinierte Antwort auf eine Frage nach online C64-Emulatoren bekommen. GPT-5 hat einfach nicht existierende URLs erfunden. Also Halluzinationen sind noch nicht gelöst.
Aber Coding soll sich noch einmal verbessert haben. Generell können GPTs immer längere Aufgaben autonom lösen. Kann mich noch an ChatGPT 3.5 erinnern, wo man gerade einmal 10 Zeilen Code generieren konnte und dieser war auch oft fehlerhaft.
Mittlerweile können die aktuellen LLMs kleinere Demo-Programme und Games mit ein paar Hundert Zeilen Code in einem Shot programmieren und erzeugen in der Regel sogar ausführbaren Code. In wenigen Sekunden bis Minuten.
Das wird das Coding dramatisch verändern, man wird in Zukunft immer mehr Code-Snippets von einer KI generieren lassen und den Code dann anpassen und (hoffentlich) noch einmal überprüfen. Das kann tatsächlich Zeit ersparen. Ist eine ziemlich heftige Entwicklung. Wenn das so weitergeht, braucht man vielleicht bald wirklich viel weniger Developer.
Für KI-basiertes Programmieren mit Hilfe einer KI gibt es mittlerweile sogar einen Ausdruck. Vibe Coding.
Generell stellt uns die Weiterentwicklung der KI vor ein Dilemma. Soll ich den Skill x wie zum Beispiel Coding jetzt überhaupt noch mühsam erlernen und perfektionieren, wenn in ein paar Jahren eine KI den Skill vielleicht sowieso 10x oder 100x besser und schneller kann als die meisten Menschen? Werden wir durch die KI-Entwicklung viele Fähigkeiten verlernen oder haben wir dann mehr Zeit uns anderen Challenges zu widmen?
Was sagt ihr dazu? Habt ihr GPT-5 schon ausprobiert? GPT-5 ist bereits auch für Non-Plus-User verfügbar.
OpenAI finally released GPT-5
https://x.com/OpenAI/status/1953504357821165774
Manipulated (probably AI-generated) Software Engineering Benchmark Chart
https://x.com/DailyXplorer/status/1953511776605061568
GPT-5 Presentation
Video credit: OpenAI
English
OpenAI released GPT-5 yesterday with a focus on coding. GPT-5 is not (yet) AGI, but it is a clear improvement over GPT-4o and o3 across virtually all benchmarks.
It's also funny that GPT-5 apparently manipulated a benchmark chart in its favor. Or was it OpenAI after all?
The hallucination rate is also said to have improved significantly in some benchmarks. From about 5% to just under 1%.
I just tested GPT-5's programming skills and immediately got a hallucinated answer to a question about online C64 emulators. GPT-5 simply invented URLs that don't exist. So hallucinations are not yet solved.
But coding is said to have improved once again. In general, GPTs can solve increasingly longer tasks autonomously. I can still remember ChatGPT 3.5 era, where you could only generate 10 lines of code, and even that was often flawed.
Now, the current LLMs can program smaller demo programs and games with a few hundred lines of code in one shot and usually even generate executable code. In a matter of seconds to minutes.
This will dramatically change coding. In the future, more and more code snippets will be generated by AI, and the code will then be adapted and (hopefully) checked by human software engineers. This can actually save time. It's quite a dramatic development. If this continues, we may soon need far fewer developers, indeed.
There is now even a term for AI-based coding with the help of an AI assistant. Vibe coding.
In general, the further development of AI presents a dilemma. Should I still bother learning and perfecting skill x, such as coding, when in a few years AI may be able to do the skill 10x or 100x better and faster than most humans anyway? Will AI development cause us to lose many skills, or will we have more time to devote our time and intelligence to other challenges?
What do you think? Have you tried GPT-5 yet? GPT-5 is already available also for non-Plus users.