Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Як продуктивність GPT-4.5 порівнюється з GPT-4O з точки зору галюцинацій


Як продуктивність GPT-4.5 порівнюється з GPT-4O з точки зору галюцинацій


GPT-4.5 та GPT-4O-це вдосконалені модні моделі, розроблені OpenAI, кожен з яких має чіткі вдосконалення порівняно з попередниками. Порівнюючи свою ефективність з точки зору галюцинацій, GPT-4,5 демонструє значне зниження частоти галюцинації порівняно з GPT-4O.

Галюцинація зменшення GPT-4.5

-Швидкість галюцинації: GPT-4,5 має рівень галюцинації приблизно 19% при тестуванні на набір даних PersonQA, що є суттєвим поліпшенням порівняно з показником GPT-4O близько 52% [2] [5]. Це зменшення вказує на те, що GPT-4.5 є більш надійним і менш схильним до генерування інформації, яка не обґрунтована фактичними даними.
-Методи вдосконалення: Зменшення галюцинацій у GPT-4.5 пояснюється новими методами нагляду в поєднанні з традиційними методами, такими як нагляд за тонкою настройкою (SFT) та підкріпленням навчання з зворотного зв’язку людини (RLHF) [1]. Ці методи допомагають підвищити фактичну точність та надійність моделі.

порівняння продуктивності

-Точність: Що стосується точності набору даних PersonQA, GPT-4,5 досягає більшої точності 78%, порівняно з 28%GPT-4O [2] [5]. Це говорить про те, що не тільки GPT-4.5 галюцинують менше, але й надають більш точні відповіді.
- Загальна надійність: Нижня галюцинація та більша точність GPT-4.5 роблять його більш надійним вибором для додатків, що потребують точної та надійної інформації. Однак обидві моделі виконують аналогічно в певних оцінках, таких як оцінки справедливості та зміщення [5].

Підсумовуючи, GPT-4.5 перевершує GPT-4O з точки зору галюцинації та точності, що робить його більш надійним варіантом для завдань, які потребують точної та фактичної інформації. Однак обидві моделі мають свої сильні та слабкі сторони в різних областях та оцінках.

Цитати:
[1] https://toppperads.com/openai-release-gpt-4-5/
.
[3] https://www.reddit.com/r/openai/comments/1izq37r/gpt45s_low_hallucination_rate_is_a_gamechanger/
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-compare
[5] https://cdn.openai.com/gpt-4-5-system-card.pdf
[6] https://community.openai.com/t/gpt-4-vs-gpt-4o-which-is-the-better/746991
[7] https://mashable.com/article/openai-gpt-4-5-relase-how-to-try
[8] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-differences-to-consider