Vỹ Nguyễn và GS. Xiaohui Zhang, Đại học RMIT
Thạc sĩ Trí tuệ Nhân tạo
Đạt giải Nhì tại SemEval 2024 – cuộc thi quốc tế với sự tham gia của 84 đội từ khắp nơi trên thế giới
Cảm xúc là yếu tố quan trọng trong giao tiếp con người, không chỉ phản ánh trạng thái tâm lý mà còn ảnh hưởng đến cách chúng ta cảm nhận, lý giải và đưa ra quyết định. Dự án này khai thác khả năng của các mô hình ngôn ngữ lớn (LLMs) trong việc nhận diện và lý giải sự chuyển biến cảm xúc trong hội thoại — đặc biệt là hiện tượng “đảo chiều cảm xúc” (Emotion Flip Reasoning).
Khác với các mô hình truyền thống chỉ đơn thuần nhận diện cảm xúc, phương pháp tiếp cận mới này sử dụng chiến lược tinh chỉnh theo chuỗi hướng dẫn (stacked-instruction) để giúp mô hình không chỉ xác định cảm xúc mà còn phân tích nguyên nhân và hậu quả của sự thay đổi cảm xúc trong quá trình đối thoại.
Mô hình gồm ba giai đoạn chính:
Luồng huấn luyện được xây dựng từ các bộ dữ liệu hội thoại tiếng Anh - Hindi và tiếng Anh - Anh có cảm xúc đảo chiều, sử dụng GPT làm mô hình nền tảng.
Nghiên cứu đề xuất một chiến lược tinh chỉnh mô hình ngôn ngữ lớn (LLMs) theo chuỗi hướng dẫn (stacked-instruction fine-tuning) nhằm giải quyết bài toán Lý giải cảm xúc đảo chiều (Emotion Flip Reasoning – EFR) trong hội thoại.
Các kết quả thực nghiệm cho thấy phương pháp này mang lại hiệu quả vượt trội so với các cách tiếp cận hiện có.