GPT-4.5 zahrnuje nové, škálovatelné techniky vyrovnání navržených pro zlepšení spolupráce člověka zlepšením chápání lidských potřeb a záměru modelu. Tyto techniky umožňují školení větších a výkonnějších modelů využívajících data odvozená z menších modelů, což je zásadní, protože modely AI se stávají stále složitějšími a řeší širší problémy [1] [3] [7].
Klíčová vylepšení
1.. Řízení: Nové techniky zarovnání zvyšují řízení GPT-4.5, což uživatelům umožňuje efektivněji vést model k požadovaným výsledkům. To je zvláště důležité pro úkoly vyžadující přesnou kontrolu nad reakcemi modelu [1] [3].
2. porozumění nuanci: GPT-4.5 ukazuje lepší pochopení nuance, což mu umožňuje efektivněji zvládnout složité a jemnější aspekty lidské komunikace. Toto zlepšení je nezbytné pro úkoly, které vyžadují empatii a emoční inteligenci [1] [3].
3. přirozená konverzace: Schopnost modelu zapojit se do přirozené konverzace byla výrazně zlepšena. Nyní může intuitivněji a empaticky reagovat, takže interakce se cítí více lidským. To je výhodné pro aplikace, jako jsou zákaznické služby, poradenství a kolaborativní kreativní projekty [1] [3] [7].
Proces tréninku
GPT-4.5 byl vyvinut pomocí kombinace tradičních metod, jako je podřízené jemné doladění (SFT) a posílení učení z lidské zpětné vazby (RLHF), podobné těm, které se používají pro GPT-4o. Model byl předem vyškolený a post-vyškolený na různých datových sadách, včetně veřejně dostupných údajů, vlastnických údajů z partnerství a vlastní datové sady vyvinuté vlastní. Tato rozmanitá údaje o školení přispívají k jeho robustním konverzačním schopnostem a široké světové znalosti [1] [3].
Emoční inteligence
Model vykazuje zvýšenou emoční inteligenci, což mu umožňuje detekovat a reagovat přiměřeně na sociální podněty. Díky tomu jsou interakce přirozenější a empatičtější, což je obzvláště výhodné pro aplikace vyžadující nuanční komunikaci [7].
Celkově lze říci, že nové techniky zarovnání v GPT-4.5 si kladou za cíl vytvořit více spolupracující a intuitivnější nástroj AI, který může lépe sladit s lidským záměrem a potřebami, což je vhodné pro širokou škálu aplikací.
Citace:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.13775v1
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-chatgpt-4-5
[4] https://community.openai.com/t/how-to-improve-gpt-4-api-utput-length-and-structure/1025132
[5] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
[6] https://proceedings.neurips.cc/paper_files/paper/2024/file/a51a74b2d71387dc71cc29181b5519bb-paper-conference.pdf
[7] https://topstemads.com/openai-renease-gpt-4-5/
[8] https://arxiv.org/html/2408.06837v1