GPT-4.5 zawiera nowe, skalowalne techniki wyrównania zaprojektowane w celu poprawy współpracy ludzi poprzez poprawę zrozumienia przez ludzkie potrzeby i zamiarów. Techniki te pozwalają na szkolenie większych i mocniejszych modeli z wykorzystaniem danych pochodzących z mniejszych modeli, co jest kluczowe, ponieważ modele AI stają się coraz bardziej złożone i rozwiązują szersze problemy [1] [3] [7].
Kluczowe ulepszenia
1. Kierowalność: Nowe techniki wyrównania zwiększają sterowalność GPT-4.5, umożliwiając użytkownikom skuteczniejsze kierowanie modelem w kierunku pożądanych wyników. Jest to szczególnie ważne dla zadań wymagających precyzyjnej kontroli nad odpowiedziami modelu [1] [3].
2. Zrozumienie niuansów: GPT-4.5 wykazuje lepsze zrozumienie niuansów, pozwalając mu skuteczniej obsługiwać złożone i subtelne aspekty komunikacji ludzkiej. Ta poprawa jest niezbędna dla zadań wymagających empatii i inteligencji emocjonalnej [1] [3].
3. Naturalna rozmowa: Zdolność modelu do angażowania się w naturalną rozmowę została znacznie ulepszona. Może teraz reagować bardziej intuicyjnie i empatycznie, dzięki czemu interakcje wydają się bardziej ludzkie. Jest to korzystne w przypadku aplikacji, takich jak obsługa klienta, poradnictwo i wspólne projekty kreatywne [1] [3] [7].
Proces szkolenia
GPT-4.5 został opracowany przy użyciu kombinacji tradycyjnych metod, takich jak nadzorowane dopracowanie (SFT) i uczenie się wzmocnienia na podstawie ludzkich informacji zwrotnych (RLHF), podobnych do metod stosowanych w GPT-4O. Model został wstępnie wyszkolony i wyszkolony na różnych zestawach danych, w tym publicznie dostępnych danych, zastrzeżonych danych z partnerstwa oraz niestandardowych zestawów danych opracowanych wewnętrznie. Te różnorodne dane szkoleniowe przyczyniają się do solidnych możliwości konwersacji i szerokiej wiedzy na świecie [1] [3].
Inteligencja emocjonalna
Model wykazuje zwiększoną inteligencję emocjonalną, umożliwiając jej odpowiednio wykrywanie i reagowanie na wskazówki społeczne. To sprawia, że interakcje są bardziej naturalne i empatyczne, co jest szczególnie korzystne dla zastosowań wymagających dopracowanej komunikacji [7].
Ogólnie rzecz biorąc, nowe techniki wyrównania w GPT-4.5 mają na celu stworzenie bardziej wspólnego i intuicyjnego narzędzia AI, które może lepiej dostosować się do ludzkich intencji i potrzeb, co czyni je odpowiednim do szerokiej gamy zastosowań.
Cytaty:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.13775v1
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-chatgpt-4-5
[4] https://community.openai.com/t/how-to-improve-gpt-4-api -utput długość-andructure/1025132
[5] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-reneases-gpt-4-5
[6] https://proceedings.neurips.cc/paper_files/paper/2024/file/a51a74b2d71387dc71cc29181b5519bb-paper-conference.pdf
[7] https://topistadads.com/openai-release-gpt-4-5/
[8] https://arxiv.org/html/2408.06837v1