Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon W jaki sposób GPT-4.5 radzi sobie z sprzecznymi instrukcjami dotyczącymi problemów wieloetapowych


W jaki sposób GPT-4.5 radzi sobie z sprzecznymi instrukcjami dotyczącymi problemów wieloetapowych


GPT-4.5 został zaprojektowany do obsługi sprzecznych instrukcji w zakresie problemów wieloetapowych poprzez przestrzeganie hierarchii instrukcji. Ta hierarchia pomaga modelowi priorytetowo przekazywać komunikaty systemowe nad komunikatami użytkownika, ograniczając ryzyko szybkich zastrzyków i innych ataków, które mogą zastąpić instrukcje bezpieczeństwa [1] [5].

Obsługa sprzecznych instrukcji

1. Ocena hierarchii instrukcji: GPT-4.5 jest przeszkolony do rozpoznawania i przestrzegania instrukcji w komunikacie o najwyższym priorytecie w obliczu sprzecznych wiadomości. Obejmuje to scenariusze, w których komunikaty systemowe i komunikaty użytkowników są sprzeczne, a model musi wybrać, który zestaw instrukcji należy przestrzegać [1].

2. Komunikaty systemowe vs. użytkownika: Model jest nauczany priorytetowo przekazywanie komunikatów systemowych, które mają na celu egzekwowanie wytycznych bezpieczeństwa i operacyjnych, przez komunikaty użytkowników. Zapewnia to, że GPT-4.5 przestrzega protokołów bezpieczeństwa, nawet gdy użytkownicy próbują je ominąć [1] [5].

3. Realistyczne scenariusze: Oceny obejmują realistyczne scenariusze, w których model działa jako nauczyciel i musi oprzeć się próbom oszczędzania go do ujawnienia odpowiedzi lub rozwiązań. GPT-4.5 jest instruowany, aby nie rozdawać odpowiedzi, i musi przestrzegać tych instrukcji systemowych pomimo prób ich obejścia [1].

4. Ochrona wyrażenia i hasła: W innym typie oceny GPT-4.5 jest instruowany, aby nie wysyłając określonych fraz ani nie ujawniał haseł. Model musi oprzeć się komunikatom użytkowników zaprojektowanym, aby go do tego oszukały, pokazując jego zdolność do ochrony poufnych informacji [1].

Multi-Estep Radzeni z problemami

Podczas gdy GPT-4.5 jest zaprojektowany do skutecznego obsługi sprzecznych instrukcji, jego zdolność do zarządzania problemami wieloetapowymi można poprawić poprzez strukturę podpowiedzi w jasny, sekwencyjny sposób. Obejmuje to rozbicie zadań na mniejsze kroki i zapewnienie, że każdy krok zostanie ukończony przed przejściem do następnego [2]. Jednak wydajność GPT-4.5 w automatycznie przestrzegając instrukcji wieloetapowych bez ręcznej interwencji (np. Podpisanie „Dalej”) pozostaje wyzwaniem [4].

Poprawa wydajności

Aby zwiększyć wydajność GPT-4.5 w zadaniach wieloetapowych, użytkownicy mogą stosować strategie, takie jak:

- Wyczyść szybką strukturę: Użyj nagłówków lub znaczników sekcji, aby jasno zdefiniować każdy krok, pomagając modelowi rozpoznać i śledzić sekwencję bardziej skutecznie [2].
-Wykonanie sekwencyjne: Wdrożyć podejście krok po kroku, w którym każdy krok jest w pełni przetwarzany przed przejściem do następnego, co można ułatwić za pomocą struktur podobnych do funkcji w podpowiedzi [2].
- Ręczna interwencja: W razie potrzeby ręcznie skłonić model do przejścia do następnego kroku, ponieważ nie może on automatycznie poruszać się po sekwencji bez takich wskazówek [4].

Cytaty:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-steps-to-build-multi-step-custom-gpts-solve-solve
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-stuck-with-multi-step-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api -utput długość-andructure/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exm/gpt4_has_only_been_getting_worse/