Sống an toàn với AI: mối nguy từ thiên kiến tự động hóa

Sống an toàn với AI: mối nguy từ thiên kiến tự động hóa

“Chúng ta đang dần tin tưởng máy móc quá dễ dàng”, Tiến sĩ Trần Nhật Quang, giảng viên Công nghệ thông tin và nghiên cứu viên về đạo đức AI tại RMIT Việt Nam, cảnh báo về một rủi ro ngày càng gia tăng trong thế giới AI.

Bạn nhắn tin cho bác sĩ quen và được trả lời đầy thấu cảm. Tin nhắn tư vấn đọc thấy rất đáng tin nhưng thực ra lại chứa những sai sót có thể gây hậu quả nghiêm trọng. Trước giờ bác sĩ của bạn chưa từng mắc sai lầm như vậy. Vậy chuyện gì đã xảy ra?

Hóa ra các tin nhắn này được soạn thảo bởi AI, sau đó được bác sĩ của bạn phê duyệt và gửi đi. Đây không phải là một tình huống giả định mà đã thực sự xảy ra trong một nghiên cứu công bố trên tạp chí khoa học uy tín npj Digital Medicine vào năm 2025.

Nhưng sai sót nghiêm trọng trong tin nhắn không bắt nguồn từ năng lực của bác sĩ mà từ việc họ đã quá tin tưởng AI. Các bác sĩ đã có lúc phê duyệt những tin nhắn do AI soạn thảo mà không kiểm chứng kỹ. Hiện tượng này ngày càng trở nên phổ biến và được gọi là “thiên kiến tự động hóa” (automation bias).

Năm 2025, một luật sư tại Mỹ đã bị tòa án bang xử phạt sau khi nộp một văn bản pháp lý có chứa trích dẫn án lệ chưa từng tồn tại. Nó do AI “bịa” ra. Vị luật sư này đã nhận trách nhiệm cho sai sót và cho biết một trợ lý của ông đã sử dụng ChatGPT để soạn thảo văn bản mà không kiểm chứng lại kỹ càng.

Trong lĩnh vực giáo dục, vấn đề tương tự cũng đã xảy ra. Năm 2024, một trường đại học tại Australia đã cáo buộc hàng ngàn sinh viên gian lận học thuật dựa vào kết luận của công cụ phát hiện AI mà nhà trường sử dụng. Đến khi nhận nhiều khiếu nại từ sinh viên và kiểm tra thấy công cụ này không hiệu quả, nhà trường đã quyết định ngừng sử dụng.

Tất cả những trường hợp trên đều là vấn đề thiên kiến tự động hóa: xu hướng con người tin tưởng các đề xuất của máy tính hơn cả phán đoán của bản thân, ngay cả khi có những bằng chứng rõ ràng rằng các đề xuất đó là sai.

Nghe có vẻ khó tin, nhưng đây là một hiện tượng tâm lý nguy hiểm có thật trong thời đại AI: Khi AI càng chính xác thì sự cẩn thận chú ý của con người càng suy giảm. Nói cách khác, khi hệ thống AI trông đáng tin cậy hơn thì kỹ năng tư duy phản biện của chúng ta dễ bị mai một do ít được sử dụng. Thế là, thay vì đóng vai trò “canh gác” đầy cảnh giác, con người có nguy cơ trở thành những “dấu mộc hình thức” mặc định phê duyệt những gì máy móc đưa ra.

Ứng dụng chatbot AI trên điện thoạiKhi các hệ thống AI trông đáng tin cậy hơn, khả năng tư duy phản biện của con người có thể bị mai một do ít được sử dụng. (Hình: Pexels)

Hiện tượng này liên quan đến một vấn đề đạo đức nan giải mà nhà nhân loại học người Mỹ Madeleine Clare Elish gọi là “vùng hấp thụ trách nhiệm” (moral crumple zone) trong bài báo khoa học công bố năm 2019.

Trong ngành kỹ thuật ô tô, vùng hấp thụ lực (crumple zone) được thiết kế để hấp thụ ngoại lực trong các vụ va chạm, nhằm giảm tác động lên hành khách để bảo vệ họ. Còn trong các hệ thống AI hỗ trợ ra quyết định, con người lại trở thành “vùng hấp thụ” đó.

Cụ thể, khi hệ thống AI ra quyết định sai trong các lĩnh vực quan trọng như y tế, quân sự, thì con người thường bị quy trách nhiệm vì không can thiệp kịp thời. Quả thật, tuy có người được giao nhiệm vụ giám sát các hệ thống này, nhưng sau thời gian dài nhận thấy hệ thống ít sai sót thì họ sẽ dần mất cảnh giác. Điều đó làm cho khả năng phát hiện sai sót của họ giảm đáng kể, trong khi vẫn phải chịu trách nhiệm nếu có sai sót xảy ra.

“Vùng hấp thụ trách nhiệm” không phải là một khái niệm lý thuyết, nó thật sự đã xảy ra. Như trong một vụ tai nạn năm 2018 ở Tempe, bang Arizona, một người đi bộ đã thiệt mạng khi bị xe tự hành thử nghiệm của Uber đâm trúng khi băng qua đường vào ban đêm. Sau vụ tai nạn, người tài xế giám sát an toàn của xe lúc đó đã bị truy tố tội vô ý làm chết người dù sau đó chỉ nhận tội gây nguy hiểm. Quá trình điều tra cho thấy có nhiều lỗi nghiêm trọng từ cả hệ thống tự lái của xa và sự chú ý của tài xế. Đây là một ví dụ rõ nét và đau lòng của vấn đề “vùng hấp thụ trách nhiệm”. Trong thời đại AI, thiên kiến tự động hóa có khả năng làm cho “vùng hấp thụ trách nhiệm” trở nên phổ biến và nghiêm trọng hơn. 

Tiến sĩ Trần Nhật QuangTiến sĩ Trần Nhật Quang, giảng viên Công nghệ thông tin, Khoa Khoa học, Kỹ thuật và Công nghệ, Đại học RMIT Việt Nam (Hình: RMIT)

Để giải quyết vấn đề thiên kiến tự động hóa, chúng ta cần một giải pháp kết hợp cả ba yếu tố: kỹ thuật, con người và pháp lý.

Về mặt kỹ thuật,để ngăn ngừa thiên kiến tự động hóa, các hệ thống AI cần được thiết kế với “cơ chế bắt buộc tư duy”. Ví dụ, trong môi trường giáo dục hoặc công việc, hệ thống phải yêu cầu người dùng tự đưa ra lời giải trước khi cung cấp câu trả lời do AI tạo ra. Với cách này, người dùng sẽ coi AI như một nguồn tham khảo hơn là câu trả lời chính xác hoàn chỉnh ngay từ đầu.

Về mặt con người,cần triển khai các chương trình đào tạo toàn diện giúp người dùng biết đến sự tồn tại của vấn đề thiên kiến tự động hóa và luyện tập tương tác với AI bằng tư duy phản biện. Để làm được điều đó, các chương trình huấn luyện về AI không nên chỉ nói về ưu điểm của AI mà còn phải nêu các hạn chế của nó, như ảo giác, tự tin quá mức hoặc lập luận sai lệch. Điều đó sẽ giúp người dùng điều chỉnh sự tin tưởng AI phù hợp với hiệu suất thực tế của nó hơn.

Về mặt pháp lý, cần có các luật và khung pháp lý quy định chặt chẽ về việc phát triển AI, đảm bảo rằng các công ty liên quan tuân thủ tiêu chuẩn an toàn và chịu trách nhiệm khi gây ra thiệt hại.

Một số khuôn khổ pháp lý về AI gần đây đã bắt đầu xử lý trực tiếp vấn đề thiên kiến tự động hóa, như Đạo luật AI của Liên minh châu Âu, trong đó Điều 14 quy định rõ về việc giám sát của con người và yêu cầu các hệ thống AI phải được thiết kế sao cho người dùng có thể nhận thức đầy đủ về các hạn chế của nó, đặc biệt là các hệ thống có tính rủi ro cao như y tế và quân sự.

Một ví dụ khác là Sắc lệnh hành pháp 14110 của Mỹ nhấn mạnh về việc ngăn ngừa sự phụ thuộc quá mức vào AI trong các lĩnh vực hệ trọng như y tế, tư pháp hình sự và việc làm, nhằm đảm bảo vai trò của con người trong việc phán định và chịu trách nhiệm.

Tại Việt Nam, Luật Trí tuệ nhân tạo có hiệu lực từ ngày 1/3/2026 cũng nhấn mạnh việc bảo đảm duy trì sự kiểm soát và khả năng can thiệp của con người đối với mọi quyết định và hành vi của hệ thống AI. Quy định này tuy không đề cập trực tiếp nhưng đã bao gồm xử lý vấn đề thiên kiến tự động hóa.

Các biện pháp vừa nêu, từ kỹ thuật, con người, đến pháp lý, thật ra đều nhắm vào một nguyên tắc chung: AI chỉ nên hỗ trợ chứ không nên thay thế phán đoán của con người.

Có thể nói, AI giống với nước ở khía cạnh: nó có thể mang lại lợi ích to lớn, nhưng cũng có thể gây ra tổn thất nghiêm trọng. Vì vậy, chúng ta cần hiểu biết và cảnh giác với các rủi ro từ AI trước khi bị “nhấn chìm” trong những tác động tiêu cực của nó.

Thiên kiến tự động hóa là một trong những mối nguy đang âm thầm làm thay đổi cách con người sử dụng và phụ thuộc vào các hệ thống máy móc. Để chung sống an toàn với AI, chúng ta cần duy trì một đầu óc tỉnh táo, luôn kiểm chứng kỹ lưỡng các thông tin được tạo bởi AI trước khi chấp nhận chúng.

Bài: Tiến sĩ Trần Nhật Quang, giảng viên Công nghệ thông tin, Khoa Khoa học, Kỹ thuật và Công nghệ, Đại học RMIT Việt Nam

---

Hình đầu trang: ipopba – stock.adobe.com | Hình đại diện: Andrii – stock.adobe.com

Chia sẻ

Tin tức liên quan