Die Leistung von GPT-4,5 zu stillschweigenden Kenntnissen und Fragen zur Fehlerbehebung im Vergleich zu GPT-4 spiegelt Fortschritte bei der Behandlung von komplexen und nuancierten Abfragen wider. Während spezifische Metriken für stillschweigendes Wissen und Fehlerbehebung in den verfügbaren Informationen nicht detailliert sind, können mehrere wichtige Verbesserungen in GPT-4,5 hervorgehoben werden:
1. Anweisungshierarchie und Sicherheit: GPT-4.5 wurde geschult, um eine Unterrichtshierarchie zu halten, die das Risiko von schnellen Injektionen und anderen Angriffen mindert. Dies bedeutet, dass es besser ist, Systemanweisungen über widersprüchliche Benutzernachrichten zu folgen und die Fähigkeit zu verbessern, komplexe Szenarien zu verarbeiten, die möglicherweise Fehlerbehebung erfordern [1]. Im Gegensatz dazu hat GPT-4 diese spezifische Verbesserung nicht in der Literatur erwähnt.
2. Mehrdeutige Fragen: GPT-4,5 zeigt eine geringfügige Genauigkeit bei mehrdeutigen Fragen im Vergleich zu GPT-4O (einer Version von GPT-4) mit einer Genauigkeit von 0,95 für GPT-4O gegenüber 0,95 für GPT-4 und 0,95 für GPT-4,5. Die Leistung von GPT-4.5 bei eindeutigen Fragen ähnelt jedoch dem GPT-4O, was darauf hinweist, dass beide Modelle klare Abfragen effektiv umgehen [1].
3.. Stillschweigende Kenntnisse und Fehlerbehebung: Während bestimmte Metriken für stillschweigende Kenntnisse und Fehlerbehebung nicht bereitgestellt werden, deuten die verbesserte Fähigkeit von GPT-4.5, widersprüchliche Nachrichten und der verbesserten Anweisungshierarchie zu handhaben, und deuten darauf hin, dass sie in Szenarien, die nuanciertes Verständnis und Fehlerbehebung erfordern, besser abschneiden. GPT-4 hingegen ist bekannt für sein verbessertes Sprachverständnis und die Fähigkeit, genauere Antworten auf komplexe Abfragen zu geben [2].
4. Multimodale Funktionen: GPT-4, die die Basis für GPT-4,5 ist, bietet erhebliche Verbesserungen gegenüber GPT-3,5 in multimodalen Funktionen und Umgang mit komplexen Abfragen. GPT-4 kann einen breiteren Bereich von Dateneingaben verarbeiten und reagieren, sodass sie für Aufgaben vielseitiger sind, bei denen möglicherweise Fehlerbehebung oder stillschweigendes Wissen beinhaltet [2] [6].
Zusammenfassend lässt sich sagen, dass GPT-4,5 auf den Stärken von GPT-4 aufbaut, insbesondere bei der Behandlung komplexer Anweisungen und Sicherheitsprotokolle, seine spezifische Leistung für stillschweigende Kenntnisse und Fehlerbehebungsfragen ist nicht ausführlich detailliert. Die verbesserte Unterrichtshierarchie und die verbesserte Handhabung widersprüchlicher Nachrichten deuten jedoch darauf hin, dass sie bei nuancierten Fehlerbehebungsszenarien effektiver sein könnte.
Zitate:
[1] https://assets.ctfassets.net/kftzwdyauwt9/7eadv6oawhhxlaehuyu7db/64e9f7916d3581ba4b5d0f0a6c5098d1/GPT-4-5_System_CARD_2272025.PDF
[2] https://datasciencedojo.com/blog/gpt-3-5-vs-gpt-4-debate/
[3] https://www.opastpublishers.com/open-access-articles/evaluating-error-and-impulting-performance-of-chatgpt.pdf
[4] https://pmc.ncbi.nlm.nih.gov/articles/pmc11197181/
[5] https://community.openai.com/t/gpt-performance-is-not-not-noxe-plow-in-instructions-and-tasks/613298
[6] https://www.aubergine.co/insights/gpt-3-5-vs-gpt-4-an-in-depth-analysis-oopenais-language-models
[7] https://www.marketingaiinstitute.com/blog/the-ai-show-episode-137
[8] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-differenz-to-consider