GPT-4.5 bevat nieuwe, schaalbare uitlijningstechnieken die zijn ontworpen om de menselijke samenwerking te verbeteren door het begrip van het model van menselijke behoeften en intentie te verbeteren. Deze technieken zorgen voor de training van grotere en krachtigere modellen met behulp van gegevens die zijn afgeleid van kleinere modellen, wat cruciaal is naarmate AI -modellen steeds complexer worden en bredere problemen oplossen [1] [3] [7].
Belangrijkste verbeteringen
1. Bestuurbaarheid: de nieuwe uitlijningstechnieken verbeteren de stuurbaarheid van GPT-4.5, waardoor gebruikers het model effectiever kunnen begeleiden naar de gewenste resultaten. Dit is met name belangrijk voor taken die nauwkeurige controle vereisen over de antwoorden van het model [1] [3].
2. Inzicht in nuance: GPT-4.5 toont een beter begrip van nuance, waardoor het complexe en subtiele aspecten van menselijke communicatie effectiever kan verwerken. Deze verbetering is van vitaal belang voor taken die empathie en emotionele intelligentie vereisen [1] [3].
3. Natuurlijk gesprek: het vermogen van het model om een natuurlijk gesprek aan te gaan, is aanzienlijk verbeterd. Het kan nu intuïtiever en empathischer reageren, waardoor interacties menselijker aanvoelen. Dit is gunstig voor applicaties zoals klantenservice, counseling en samenwerkingscreatieve projecten [1] [3] [7].
Trainingsproces
GPT-4.5 werd ontwikkeld met behulp van een combinatie van traditionele methoden zoals begeleide verfijning (SFT) en versterking leren van menselijke feedback (RLHF), vergelijkbaar met die welke worden gebruikt voor GPT-4O. Het model was vooraf getraind en post-getraind op verschillende datasets, waaronder openbaar beschikbare gegevens, eigen gegevens van partnerschappen en aangepaste datasets die in eigen huis zijn ontwikkeld. Deze diverse trainingsgegevens dragen bij aan zijn robuuste conversatiemogelijkheden en brede wereldkennis [1] [3].
Emotionele intelligentie
Het model vertoont verbeterde emotionele intelligentie, waardoor het op de juiste manier kan worden gedetecteerd en op sociale signalen kan reageren. Dit maakt interacties natuurlijker en empathischer, wat vooral gunstig is voor toepassingen die genuanceerde communicatie vereisen [7].
Over het algemeen zijn de nieuwe uitlijningstechnieken in GPT-4.5 tot doel een meer collaboratieve en intuïtieve AI-tool te creëren die beter kan worden afgestemd op menselijke intentie en behoeften, waardoor het geschikt is voor een breed scala aan toepassingen.
Citaten:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.13775v1
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-chatgpt-4-5
[4] https://community.openai.com/t/how-to-improve-gpt-4-api output-lengte-and-structure/1025132
[5] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
[6] https://proceedings.neurips.cc/paper_files/paper/2024/file/a51a74b2d71387dc71cc29181b5519bb-paper-conference.pdf
[7] https://topmostads.com/openai-release-gpt-4-5/
[8] https://arxiv.org/html/2408.06837v1