GPT-4.5: Avansuri în alinierea AI, Steerabilitate și inteligență emoțională

Ce noi tehnici de aliniere sunt utilizate în GPT-4.5 pentru a îmbunătăți colaborarea umană

GPT-4.5 încorporează noi tehnici de aliniere scalabile, concepute pentru a spori colaborarea umană prin îmbunătățirea înțelegerii modelului și a intenției umane a modelului. Aceste tehnici permit instruirea unor modele mai mari și mai puternice, folosind date derivate din modele mai mici, ceea ce este crucial, deoarece modelele AI devin din ce în ce mai complexe și rezolvă probleme mai largi [1] [3] [7].

Îmbunătățiri cheie

1.. Steerabilitate: Noile tehnici de aliniere îmbunătățesc rezistența GPT-4.5, permițând utilizatorilor să ghideze modelul mai eficient spre rezultatele dorite. Acest lucru este deosebit de important pentru sarcinile care necesită un control precis asupra răspunsurilor modelului [1] [3].

2. Înțelegerea nuanței: GPT-4.5 demonstrează o mai bună înțelegere a nuanței, permițându-i să gestioneze mai eficient aspecte complexe și subtile ale comunicării umane. Această îmbunătățire este vitală pentru sarcinile care necesită empatie și inteligență emoțională [1] [3].

3. Conversație naturală: Capacitatea modelului de a se angaja în conversația naturală a fost îmbunătățită semnificativ. Acum poate răspunde mai intuitiv și mai empatic, făcând interacțiunile să se simtă mai asemănătoare omului. Acest lucru este benefic pentru aplicații precum serviciul pentru clienți, consiliere și proiecte creative de colaborare [1] [3] [7].

Procesul de instruire

GPT-4.5 a fost dezvoltat folosind o combinație de metode tradiționale precum reglarea fină supravegheată (SFT) și învățarea de întărire din feedback-ul uman (RLHF), similar cu cele utilizate pentru GPT-4O. Modelul a fost instruit în prealabil și post-instruit pe seturi de date diverse, inclusiv date disponibile public, date proprii din parteneriate și seturi de date personalizate dezvoltate în casă. Aceste date diverse de instruire contribuie la capacitățile sale de conversație robuste și la cunoștințele largi ale lumii [1] [3].

Inteligență emoțională

Modelul prezintă o inteligență emoțională îmbunătățită, permițându -i să detecteze și să răspundă în mod corespunzător la indicii sociale. Acest lucru face ca interacțiunile să fie mai naturale și mai empatice, ceea ce este deosebit de benefic pentru aplicațiile care necesită o comunicare nuanțată [7].

În general, noile tehnici de aliniere din GPT-4.5 urmăresc să creeze un instrument AI mai colaborativ și mai intuitiv, care să se poată alinia mai bine cu intenția și nevoile umane, ceea ce îl face potrivit pentru o gamă largă de aplicații.

Citări:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.13775v1
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-relăase-chatgpt-4-5
[4] https://community.openai.com/t/how-to-improve-gpt-4-api-output-length-and-structure/1025132
[5] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-relăase-gpt-4-5
[6] https://proceedings.neurips.cc/paper_files/paper/2024/file/a51a74b2d71387dc71cc29181b5519bb-paper-conference.pdf
[7] https://topostads.com/openai-relăse-gpt-4-5/
[8] https://arxiv.org/html/2408.06837v1