An Đo, Nhân Trần, Quan Vũ, Anh Nguyễn, Phong Hà
Cử nhân Công nghệ Thông tin
Được tài trợ bởi cuộc thi Đổi mới Sáng tạo RMIT Vietnam Grand Challenge; Lọt vào vòng chung kết Vietnam AI4VN 2024; Là một trong các dự án tiêu biểu của RMIT trong lĩnh vực Chăm sóc sức khỏe và Công nghệ
Việc ghi chép và quản lý hồ sơ bệnh án chính xác đóng vai trò then chốt trong hoạt động điều trị, chẩn đoán và chăm sóc người bệnh. Tuy nhiên, trong môi trường thực tế tại bệnh viện, bác sĩ và nhân viên y tế thường gặp khó khăn khi phải vừa khám chữa bệnh, vừa ghi âm hoặc ghi chú bằng tay, dễ dẫn đến sai sót hoặc mất dữ liệu. Đặc biệt, các quy trình nhập liệu thủ công không chỉ tốn thời gian mà còn ảnh hưởng đến hiệu suất và chất lượng dịch vụ y tế.
Dự án MedVoice được triển khai nhằm cải thiện hiệu quả của việc ghi chép y tế bằng cách sử dụng công nghệ trí tuệ nhân tạo để tự động chuyển đổi giọng nói thành văn bản. Nhóm phát triển xây dựng một hệ thống xử lý ngôn ngữ tích hợp hai thành phần chính: (1) pipeline chuyển giọng nói thành văn bản (ASR) và (2) chatbot RAG (Retrieval-Augmented Generation) để tra cứu dữ liệu y tế.
Bên cạnh hiệu quả kỹ thuật, nhóm cũng chú trọng đến yếu tố bảo mật, tuân thủ quy trình nghiệp vụ y tế và nâng cao trải nghiệm người dùng thông qua thiết kế giao diện trực quan, dễ sử dụng cho bác sĩ và nhân viên y tế.
Hệ thống được xây dựng với cấu trúc chia tầng rõ ràng, gồm ba thành phần chính:
Dự án bao gồm hai thử nghiệm chính:
Đánh giá độ chính xác của mô hình chuyển đổi giọng nói sang văn bản phục vụ ghi chép y tế
Google Whisper, Meta SeamlessM4T, và các mô hình mã nguồn mở cho phiên âm y tế tiếng Anh – tiếng Việt
Tăng khả năng phản hồi chính xác và hiệu quả của hệ thống chatbot truy vấn y tế bằng kiến trúc RAG