Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Miten APE verrataan ihmisen tekemiin kehotteisiin suorituskyvyn suhteen?


Miten APE verrataan ihmisen tekemiin kehotteisiin suorituskyvyn suhteen?


Hakutulosten perusteella tärkeimmät havainnot siitä, miten Automatic Prompt Engineering (APE) verrataan ihmisen tekemiin kehotteisiin:

1. Zero-Shot Performance: Hakutulokset osoittavat, että APE:n luomat kehotteet voivat ylittää ihmisen suunnittelemat kehotteet useissa tehtävissä nolla-asetuksella. Esimerkiksi TruthfulQA-vertailussa APE:n luomat kehotteet saavuttivat korkeampia pisteitä sellaisissa mittareissa kuin totuudenmukaisuus ja informatiivisuus verrattuna ihmisen tekemiin kehotteisiin [1].

2. Few-Shot In-Context Learning: APE:n luomien kehotteiden on myös osoitettu parantavan kielimallien muutaman otoksen kontekstin sisäistä oppimista verrattuna ihmisen kehittämiin kehotteisiin. Hakutuloksissa mainitaan, että APE paransi muutaman laukauksen suorituskykyä 21:ssä 24:stä käskyn induktiotehtävästä [1].

3. Päättely ja looginen ajattelu: Yksi merkittävä esimerkki on, että APE pystyi löytämään paremman yleisen "ajatteluketjun" kehotteen kuin ihmisen suunnittelema "Ajattele askel askeleelta" -kehote aiemmasta työstä. Tämä APE:n luoma kehote paransi suorituskykyä matemaattisissa päättelyn vertailuarvoissa, kuten MultiArithin ja GSM8K:n [1][3].

4. Tehtävien laajuus: Hakutulokset osoittavat, että APE:n luomat kehotteet pystyivät vastaamaan tai ylittämään ihmisen kehotteet monissa tehtävissä, mukaan lukien kielen ymmärtäminen, luetun ymmärtäminen, yhteenveto ja erilaiset päättelytehtävät BIG:stä - Benchmark [1].

Yhteenvetona voidaan todeta, että APE:n tärkein etu näyttää olevan sen kyky luoda automaattisesti kehotteita, jotka ovat tehokkaampia kuin ihmisen tekemät kehotteet erilaisissa tehtävissä ja vertailuarvoissa sekä nolla- että muutaman laukauksen asetuksissa. Automaattinen nopea suunnittelutapa näyttää avaavan uusia ominaisuuksia suurissa kielimalleissa, jotka ylittävät sen, mitä voidaan saavuttaa manuaalisella nopealla suunnittelulla.

Lainaukset:
[1] https://sites.google.com/view/automatic-prompt-engineer
[2] https://github.com/keirp/automatic_prompt_engineer
[3] https://www.promptingguide.ai/techniques/ape
[4] https://futureskillsacademy.com/blog/automatic-prompt-engineering-ape/
[5] https://blog.gopenai.com/unleashing-the-power-of-ai-to-self-generate-prompts-a-dive-into-the-automatic-prompt-engineer-d87f2db83f56