GPT-4.5とGPT-4はどちらも低リソース言語を扱う際に課題に直面していますが、そのアプローチとパフォーマンスにはいくつかの違いがあります。
GPT-4低リソース言語でのパフォーマンス
GPT-4は、他の大規模な言語モデルと同様に、高リソース言語で印象的な機能を示していますが、リソースの低い言語には苦労しています。研究では、これらの言語でのGPT-4のパフォーマンスは、英語や他のよく表された言語ほど堅牢ではないことが示されています[1] [3]。これは、これらの言語で利用可能なトレーニングデータが限られていることの一部であり、その結果、言語ニュアンスの効果的なトークン化と理解が生じます[1]。さらに、GPT-4の安全フィルターは、リソースの低い言語に翻訳された入力を扱う場合、安全性が低く、セーフガードを簡単にバイパスできるようになっています[5]。
GPT-4.5低リソース言語の改善
GPT-4.5は、低リソース言語の処理など、GPT-4の機能を改善することを目指しています。低リソース言語の特定の改善は広範囲に詳細ではありませんが、GPT-4.5は多言語評価でGPT-4を上回ることが認められています。たとえば、MMLUテストセットを使用した評価では、Yoruba、GPT-4.5などの低リソース言語を含む14の言語に翻訳された言語に翻訳されました。GPT-4と比較してパフォーマンスが向上しました[9]。これは、GPT-4.5が多言語サポートを強化し、低リソース言語で言語ニュアンスの潜在的により良い処理を強化した可能性があることを示唆しています。
ただし、GPT-4.5の改善は、低リソース言語の特定の強化というよりも、全体的な多言語パフォーマンスに関するものです。多言語機能を評価するために人間の翻訳者を使用することは、正確な翻訳の確保に焦点を当てていることを示しています。これは、将来の改善のためにより信頼できるデータを提供することにより、間接的に低リソース言語に利益をもたらす可能性があります[9]。
###課題と将来の方向
これらの改善にもかかわらず、GPT-4とGPT-4.5の両方は、リソースの低い言語で依然として大きな課題に直面しています。これらの言語のパフォーマンスを向上させるために、微調整と特殊なプロンプト技術をお勧めします[7]。高リソースと低リソースの言語の安全性とパフォーマンスの格差は、言語の多様性を説明するより包括的なトレーニングデータと安全プロトコルの必要性を強調しています[5]。
要約すると、GPT-4.5は多言語のコンテキストでGPT-4よりもいくつかの改善を提供しますが、低リソース言語の特定の強化は広範囲に詳細ではありません。 Further research and development are necessary to address the persistent challenges in these languages.
引用:
[1] https://aclanthology.org/2024.findings-emnlp.920.pdf
[2] https://topmostads.com/gpt-4-5-vs-gpt-5-release/
[3] https://www.asianlp.sg/conferences/ialp2024/proceedings/papers/ialp2024_p027.pdf
[4] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-giggest-differences to-sonsider
[5] https://arxiv.org/pdf/2310.02446.pdf
[6] https://teamai.com/blog/large-language-models-llms/understanding-different-chatgpt-models/
[7] https://aclanthology.org/2025.Coling-main.559.pdf
[8] https://www.reddit.com/r/claudeai/comments/1dqj1lg/claude_35_sonnet_vs_gpt4_a_programmers/
[9] https://cdn.openai.com/gpt-4-5-system-card.pdf