GPT-4.5 apima naujus, keičiamo mastelio suderinimo būdus, skirtus sustiprinti žmonių bendradarbiavimą, pagerinant modelio supratimą apie žmogaus poreikius ir ketinimus. Šie metodai leidžia mokyti didesnius ir galingesnius modelius, naudojant duomenis, gautus iš mažesnių modelių, o tai yra labai svarbus, nes AI modeliai tampa vis sudėtingesni ir išsprendžia platesnes problemas [1] [3] [7].
Pagrindiniai patobulinimai
1. Tai ypač svarbu atliekant užduotis, kurioms reikia tiksliai kontroliuoti modelio atsakymus [1] [3].
2. Nuanso supratimas: GPT-4.5 rodo geresnį niuanso supratimą, leidžiantį jam efektyviau elgtis sudėtingais ir subtiliais žmogaus bendravimo aspektais. Šis patobulinimas yra gyvybiškai svarbus atliekant užduotis, kurioms reikia empatijos ir emocinio intelekto [1] [3].
3. Natūralus pokalbis: modelio sugebėjimas įsitraukti į natūralų pokalbį buvo žymiai pagerintas. Dabar tai gali reaguoti intuityviau ir empatiškai, todėl sąveika jaustųsi labiau panaši į žmogų. Tai naudinga tokioms programoms kaip klientų aptarnavimas, konsultacijos ir bendradarbiavimo kūrybiniai projektai [1] [3] [7].
Mokymo procesas
GPT-4.5 buvo sukurtas naudojant tradicinių metodų, tokių kaip prižiūrimas, derinimas (SFT) ir armatūros mokymasis iš žmonių atsiliepimų (RLHF), panašiai kaip ir GPT-4O. Šis modelis buvo iš anksto apmokytas ir po apmokytas įvairiuose duomenų rinkiniuose, įskaitant viešai prieinamus duomenis, patentuotus partnerystės duomenis ir pasirinktinius duomenų rinkinius, sukurtus įmonėje. Šie įvairūs mokymo duomenys prisideda prie tvirtų pokalbio galimybių ir plačių pasaulio žinių [1] [3].
Emocinis intelektas
Modelis demonstruoja sustiprintą emocinį intelektą, leidžiantį jam tinkamai aptikti ir tinkamai reaguoti į socialines užuominas. Dėl to sąveika tampa natūraliau ir empatiškesnė, o tai ypač naudinga programoms, kurioms reikalingas niuansuotas bendravimas [7].
Apskritai naujiems GPT-4.5 suderinimo būdams siekiama sukurti labiau bendradarbiavimo ir intuityvų AI įrankį, kuris galėtų geriau suderinti su žmogaus ketinimais ir poreikiais, todėl jis yra tinkamas įvairiausioms programos.
Citatos:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.13775v1
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-chatgpt-4-5
[4] https://community.openai.com/t/how-to-improve-gpt-4-api-outptpth-length--Trocture/1025132
[5] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
[6] https://prouveringings.neurips.cc/paper_files/paper/2024/file/a51a74b2d71387dc71cc29181b5519bbbbppaper-conference.pdf
[7] https://topostads.com/openai-release-gpt-4-5/
[8] https://arxiv.org/html/2408.06837v1