GPT-4.5: Fortschritte bei der Ausrichtung der KI, Steuern und emotionaler Intelligenz

Welche neuen Ausrichtungstechniken werden in GPT-4,5 verwendet, um die Zusammenarbeit der Menschen zu verbessern

GPT-4.5 enthält neue, skalierbare Ausrichtungstechniken zur Verbesserung der menschlichen Zusammenarbeit, indem das Verständnis des Modells für menschliche Bedürfnisse und Absichten verbessert wird. Diese Techniken ermöglichen das Training größerer und leistungsfähigerer Modelle unter Verwendung von Daten, die aus kleineren Modellen abgeleitet wurden. Dies ist entscheidend, da AI -Modelle immer komplexer werden und breitere Probleme lösen [1] [3] [7].

Schlüsselverbesserungen

1. Steerability: Die neuen Ausrichtungstechniken verbessern die Denerabilität von GPT-4.5 und ermöglichen es den Benutzern, das Modell effektiver zu den gewünschten Ergebnissen zu führen. Dies ist besonders wichtig für Aufgaben, die eine präzise Kontrolle über die Antworten des Modells erfordern [1] [3].

2. Verständnis von Nuance: GPT-4.5 zeigt ein besseres Verständnis der Nuance und ermöglicht es, komplexe und subtile Aspekte der menschlichen Kommunikation effektiver zu behandeln. Diese Verbesserung ist für Aufgaben von entscheidender Bedeutung, die Empathie und emotionale Intelligenz erfordern [1] [3].

3. Natürliches Gespräch: Die Fähigkeit des Modells, sich auf natürliche Gespräche zu führen, wurde erheblich verbessert. Es kann jetzt intuitiver und einfühlsamer reagieren, wodurch sich die Interaktionen menschlicher anfühlen. Dies ist für Anwendungen wie Kundendienst, Beratung und kollaborative kreative Projekte von Vorteil [1] [3] [7].

Trainingsprozess

GPT-4,5 wurde unter Verwendung einer Kombination herkömmlicher Methoden wie beaufsichtigter Feinabstimmung (SFT) und Verstärkungslernen aus menschlichem Feedback (RLHF) entwickelt, ähnlich wie bei GPT-4O. Das Modell wurde auf verschiedenen Datensätzen vorgebreitet und nach dem Ausbildungsbereich nachgebildet, einschließlich öffentlich verfügbarer Daten, proprietärer Daten aus Partnerschaften und benutzerdefinierten Datensätzen, die intern entwickelt wurden. Diese vielfältigen Schulungsdaten tragen zu ihren robusten Konversationsfähigkeiten und dem breiten Wissen über die Welt bei [1] [3].

emotionale Intelligenz

Das Modell zeigt eine verbesserte emotionale Intelligenz und ermöglicht es, soziale Hinweise angemessen zu erkennen und angemessen zu reagieren. Dies macht Interaktionen natürlicher und einfühlsamer, was für Anwendungen, die eine nuancierte Kommunikation erfordern, besonders vorteilhaft ist [7].

Insgesamt zielen die neuen Alignment-Techniken in GPT-4,5 darauf ab, ein kollaborativeres und intuitiveres KI-Tool zu schaffen, das besser mit menschlicher Absicht und Bedürfnissen übereinstimmt und es für eine breite Palette von Anwendungen geeignet ist.

Zitate:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.13775v1
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-chatgpt-4-5
[4] https://community.openai.com/t/how-to-improve-gpt-4-api-output-lgth-and-structure/1025132
[5] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-4-5
[6] https://proceedings.neurips.cc/paper_files/paper/2024/file/a51a74b2d71387dc71cc29181b5519bb-Paper-conference.pdf
[7] https://topmestads.com/openai-release-gpt-4-5/
[8] https://arxiv.org/html/2408.06837v1