Az Alexa érzelemérzékelő technológiája, amelyet az Amazon fejlesztett ki, elsősorban a hangbemenetek elemzésére összpontosít az érzelmi állapotok meghatározása érdekében. Ezt fejlett algoritmusok révén érik el, amelyek felmérik a hangmagasságot, a hangerőt és a hanghangot, hogy azonosítsák az olyan érzelmeket, mint a boldogság, a harag vagy a szomorúság [1] [7]. Míg más érzelmek felismerési rendszerei, például az Affectiva, a Google Vision API és a Microsoft érzelmi API gyakran az arckifejezésekre és a testbeszédre támaszkodnak, a hangelemzés mellett, az Alexa megközelítése inkább a hang-alapú interakciókra összpontosít [2] [3] [4].
kulcsfontosságú különbségek
1. Bemeneti módszerek:
- Alexa: Elsősorban hangelemzést, mikrofonok és hangtisztító szoftverek kihasználását használják az érzelmi állapotok észlelésére [4] [7].
- Egyéb rendszerek: gyakran beépítik a többféle módszert, például az arckifejezéseket, a testbeszédet és a szöveges elemzést. Például az Affectiva arc algoritmusokat és beszédelemzést használ, míg a Google Vision API a vizuális útmutatásokra összpontosít [2] [3] [8].
2. Alkalmazás és integráció:
- Alexa: Integrált az intelligens otthoni eszközökbe és a hangsegédekbe, amelynek célja a felhasználói interakció javítása az érzelmi útmutatások megfelelő reagálásával [1] [9].
- Egyéb rendszerek: széles körben alkalmazzák a különféle ágazatokban, beleértve a reklámot, az oktatást és az autóipari vállalkozást. Például az Affectiva technológiáját autóipari beállításokban használják a vezető érzelmek figyelésére [3] [4].
3. Technológiai megközelítés:
- Alexa: Az öntanító AI algoritmusokat használja, amelyek idővel javulnak, javítva az érzelmek észlelésének pontosságát [1]. Neurális TTS (NTTS) technológiát is alkalmaz a természetes hangosabb érzelmi reakciókhoz [9].
- Egyéb rendszerek: használhat különböző AI modelleket és gépi tanulási technikákat. A Microsoft érzelmi API -ja például nagy pontosságot mutatott a konkrét érzelmek, például a félelem észlelésében [2].
4. Cél és felhasználási esetek:
- Alexa: Elsősorban a felhasználói élmény javítására irányult személyre szabott interakciók révén. A válaszokat az észlelt érzelmek alapján módosíthatja, például nyugtató tartalmat kínálva, ha a felhasználó bosszúsan hangzik [3] [7].
- Egyéb rendszerek: gyakran szélesebb alkalmazásokhoz, például a piackutatáshoz, a célzott reklámozáshoz és még a politikai szavazásokhoz is használják [4] [8].
Összefoglalva: míg Alexa érzelmek felismerése elsősorban hang-központú, és a felhasználói interakciók fokozására összpontosít, más rendszerek sokkal változatosabbak a bemeneti modalitásaikban és alkalmazásaikban, tükrözve a különféle iparágakban a felhasználási esetek szélesebb körét.
Idézetek:[1] https://futurism.com/the-byte/amazon-alexa-analyzing-emotions
[2] https://www.aies-conference.com/2019/wp-content/papers/main/aies-19_paper_161.pdf
[3] https://thenextweb.com/news/emotion-deting-technology-is-every-but-it-it-oT-o- Off-date
[4] https://voicebot.ai/2019/05/28/amazon-stesting-emotion-recognition-gadget/
[5] https://scholarworks.uno.edu/cgi/viewcontent.cgi?article=4347&context=td
[6] https://www.mdpi.com/2071-1050/16/7/2721
[7] https://www.theatlantic.com/technology/archive/2018/10/alexa-emotion-detection-ai-surveillance/572884/
[8] https://brand24.com/blog/emotion-detection-software/
[9] https://developer.amazon.com/en-us/blogs/alexa/alexa-skills-kit/2019/11/new-alexa-emotions-and-speaking-styles