GPT-4.5 и GPT-4 сталкиваются с проблемами при работе с языками с низким ресурсом, но есть некоторые различия в их подходах и производительности.
Производительность GPT-4 на языках с низким ресурсом
GPT-4, как и другие крупные языковые модели, показали впечатляющие возможности на языках с высоким разрешением, но борется с языками с низким ресурсом. Исследования показали, что производительность GPT-4 на этих языках не так надежна, как на английском или других хорошо представленных языках [1] [3]. Отчасти это связано с ограниченными учебными данными, доступными для этих языков, что приводит к менее эффективной токенизации и пониманию лингвистических нюансов [1]. Кроме того, было обнаружено, что фильтры GPT-4 менее эффективны при работе с входами, переведенными на языки с низким разрешением, что облегчает обход гарантий [5].
GPT-4.5 Улучшения для языков с низким разрешением
GPT-4.5 стремится улучшить возможности GPT-4, включая его обработку языков с низким разрешением. Хотя конкретные улучшения языков с низким ресурсом не являются подробными, GPT-4.5 отмечается, что GPT-4 превосходит GPT-4 в многоязычных оценках. Например, в оценках с использованием тестового набора MMLU, переведенного на 14 языков, включая языки с низким ресурсом, такие как йоруба, GPT-4.5 показал лучшую производительность по сравнению с GPT-4 [9]. Это говорит о том, что GPT-4.5 может повысить многоязычную поддержку и потенциально лучшую обработку лингвистических нюансов на языках с низким ресурсом.
Тем не менее, улучшения в GPT-4.5 больше связаны с общей многоязычной производительностью, а не конкретными улучшениями для языков с низким разрешением. Использование человеческих переводчиков для оценки многоязычных возможностей указывает на внимание на обеспечении точных переводов, которые могут косвенно принести пользу языкам с низким ресурсом, предоставляя более надежные данные для будущих улучшений [9].
Проблемы и будущие направления
Несмотря на эти улучшения, как GPT-4, так и GPT-4.5 по-прежнему сталкиваются с значительными проблемами с языками с низким разрешением. Часто рекомендуется для повышения производительности на этих языках [7]. Неравенство в безопасности и производительности между языками с высоким ресурсом и низким ресурсом подчеркивает необходимость в более инклюзивных данных обучения и протоколах безопасности, которые объясняют лингвистическое разнообразие [5].
Таким образом, в то время как GPT-4.5 предлагает некоторые улучшения по сравнению с GPT-4 в многоязычных контекстах, конкретные улучшения для языков с низким разрешением не являются подробными. Дальнейшие исследования и разработки необходимы для решения постоянных проблем на этих языках.
Цитаты:
[1] https://aclanthology.org/2024.findings-emnlp.920.pdf
[2] https://topstaids.com/gpt-4-5-vs-gpt-5-release/
[3] https://www.asianlp.sg/conferences/ialp2024/proceedings/papers/ialp2024_p027.pdf
[4] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-diffferences-to-consider
[5] https://arxiv.org/pdf/2310.02446.pdf
[6] https://teamai.com/blog/large-language-models-llms/undersding-different-chatgpt-models/
[7] https://aclanthology.org/2025.coling-main.559.pdf
[8] https://www.reddit.com/r/claudeai/comments/1dqj1lg/claude_35_sonnet_vs_gpt4_a_programmers/
[9] https://cdn.openai.com/gpt-4-5-system-card.pdf