El rendimiento de GPT-4.5 sobre el conocimiento tácito y las preguntas de solución de problemas, en comparación con GPT-4, refleja los avances en el manejo de consultas complejas y matizadas. Si bien las métricas específicas para el conocimiento tácito y la solución de problemas no se detallan en la información disponible, se pueden resaltar varias mejoras clave en GPT-4.5:
1. Jerarquía de instrucciones y seguridad: GPT-4.5 ha sido entrenado para adherirse a una jerarquía de instrucciones, que ayuda a mitigar el riesgo de inyecciones rápidas y otros ataques. Esto significa que es mejor para seguir las instrucciones del sistema sobre los mensajes de usuario conflictivos, mejorando su capacidad para manejar escenarios complejos que podrían requerir la solución de problemas [1]. En contraste, GPT-4 no tiene esta mejora específica mencionada en la literatura.
2. Preguntas ambiguas: GPT-4.5 muestra una precisión ligeramente menor en preguntas ambiguas en comparación con GPT-4O (una versión de GPT-4), con una precisión de 0.95 para GPT-4O versus 0.95 para GPT-4 y 0.95 para GPT-4.5. Sin embargo, el rendimiento de GPT-4.5 en preguntas inequívocas es similar a GPT-4O, lo que indica que ambos modelos manejan consultas claras de manera efectiva [1].
3. Conocimiento tácito y resolución de problemas: aunque no se proporcionan métricas específicas para el conocimiento tácito y la solución de problemas, la capacidad mejorada de GPT-4.5 para manejar mensajes conflictivos y su jerarquía de instrucciones mejorada sugieren que podría funcionar mejor en escenarios que requieren una comprensión y solución de problemas nacionales. GPT-4, por otro lado, es conocido por su mejor comprensión del lenguaje y su capacidad para proporcionar respuestas más precisas a consultas complejas [2].
4. Capacidades multimodales: GPT-4, que es la base para GPT-4.5, ofrece mejoras significativas sobre GPT-3.5 en capacidades multimodales y manejo de consultas complejas. GPT-4 puede procesar y responder a una gama más amplia de entradas de datos, por lo que es más versátil para las tareas que pueden implicar la resolución de problemas o el conocimiento tácito [2] [6].
En resumen, mientras que GPT-4.5 se basa en las fortalezas de GPT-4, particularmente en el manejo de instrucciones complejas y protocolos de seguridad, su rendimiento específico sobre el conocimiento tácito y las preguntas de solución de problemas no se detallan ampliamente. Sin embargo, su jerarquía de instrucciones mejorada y su mejor manejo de mensajes conflictivos sugieren que podría ser más efectivo en escenarios de solución de problemas matizados.
Citas:
[1] https://assets.ctfassets.net/kftzwdyauwt9/7eadv6oawhxlaehuyu7db/64e9f7916d3581ba4b5d0f0a6c5098d1/gpt-4-5_system_card_22272025.pdff
[2] https://datascienedojo.com/blog/gpt-3-5-vs-gpt-4-debate/
[3] https://www.opastpublishers.com/open-access-articles/evaluating-errors-and-improving-performance-of-chatppt.pdf
[4] https://pmc.ncbi.nlm.nih.gov/articles/pmc11197181/
[5] https://community.openai.com/t/gpt-performance-is-not-follow-up-to-instructions--tasks/613298
[6] https://www.aubergine.co/insights/gpt-3-5-vs-gpt-4-an-ing-depth-analysis-of-openais-language-models
[7] https://www.marketingaiinstitute.com/blog/the-ai-show-episode-137
[8] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-Diferences-to-consider