Alexa sử dụng một số công nghệ để phân tích và phản ứng với cảm xúc của người dùng, mặc dù nó không được thiết kế cụ thể như một hệ thống AI trí tuệ cảm xúc. Dưới đây là một số công nghệ chính liên quan:
1. Phân tích giọng nói: Nhóm của Alexa đang làm việc để phân tích âm thanh của giọng nói của người dùng để nhận ra tâm trạng hoặc trạng thái cảm xúc của họ. Điều này liên quan đến việc phát hiện những thay đổi về sân, khối lượng và giai điệu để suy ra những cảm xúc như hạnh phúc, sự tức giận hoặc buồn bã [1] [9]. Công ty đã nộp bằng sáng chế cho công nghệ có thể giám sát cảm xúc của người dùng bằng cách phân tích cao độ và khối lượng lệnh của loa [9].
2. Thông tin âm thanh và từ vựng: Amazon đang phát triển một hệ thống phát hiện tình cảm sử dụng cả thông tin âm thanh (như âm và âm lượng) và thông tin từ vựng (các từ thực tế được nói) để xác định tình cảm của một cách nói. Công nghệ này có thể được sử dụng để cá nhân hóa các phản hồi dựa trên trạng thái cảm xúc của người dùng [4].
3. Công nghệ Text-Text-Speech (NTTS) thần kinh: Alexa sử dụng NTTS để cho phép lời nói âm thanh tự nhiên hơn. Các nhà phát triển có thể lập trình Alexa để đáp ứng với những cảm xúc như hạnh phúc hoặc sự đồng cảm bằng cách sử dụng các thẻ SSML cụ thể. Ví dụ, Alexa có thể trả lời với giọng điệu phấn khích khi người dùng thắng trò chơi hoặc với giọng điệu thất vọng khi đội yêu thích của họ thua [10].
4. Tiện ích nhận dạng cảm xúc: Amazon đã thử nghiệm một thiết bị đeo được, có tên mã Dylan, nhận ra cảm xúc của con người thông qua giọng nói và micrô. Thiết bị này nhằm mục đích cải thiện sự tương tác với người khác bằng cách phát hiện trạng thái cảm xúc [7].
5. Hợp tác với các công ty phát hiện cảm xúc: Amazon đã quan tâm đến việc tích hợp các công nghệ từ các công ty như Affectiva, nơi phân tích lời nói cho những cảm xúc như tiếng cười, sự tức giận và kích thích. Công nghệ của ảnh hưởng có thể cung cấp những hiểu biết sâu sắc hơn về các biểu hiện cảm xúc của con người bằng cách phân tích paralinguistic, giai điệu, âm thanh, nhịp độ và chất lượng giọng nói [1] [7].
Những công nghệ này là một phần trong nỗ lực rộng lớn hơn của Amazon để tăng cường khả năng hiểu và phản ứng với người dùng một cách đồng cảm hơn, có khả năng dẫn đến các tương tác cá nhân hóa và hấp dẫn hơn.
Trích dẫn:[1] https://vives
[2] https://www.researchgate.net/publication/388890260_beyond_voice_recognition_integrating_alexa's and_chatgpt's_langage_processing_for_efl_learners'_development_and_anxiety_reduction _-_ a_comparative_analysis/download
[3] https://www.mdpi.com/2071-1050/16/7/2721
.
[5] https://www.nytimes.com/2025/02/26/technology/amazon-alexa-plus-generative-ai.html
[6] https://www.amazon.science/latest-news/the-engineering-behind-alexas-contextual-speech-recognition
.
[8] https://www.linkedin.com/pulse/amazons-ai-reboot-how-nlu-enhancements-shaping-alexas-tony-carlin-nulze
.
[10] https://developer.amazon.com/en-US/blogs/alexa/alexa-skills-kit/2019/11/new-alexa-emotions-and-speaking-styles
.