Tuy nhiên, ngành này phần lớn vẫn nằm trong tay các công ty có khả năng tiếp cận vi xử lý GPU tiên tiến của NVIDIA và kho dữ liệu độc quyền khổng lồ. Tiến sĩ James Kang, giảng viên cấp cao về Khoa học máy tính tại RMIT Việt Nam, đã chỉ ra sự mất cân bằng này.
“Các tập đoàn công nghệ lớn nắm giữ lợi thế đáng kể nhờ nguồn lực tài chính dồi dào và quyền tiếp cận phần cứng tính toán hiệu suất cao. Tuy nhiên, sự xuất hiện của những mô hình mã nguồn mở như DeepSeek R1 chứng minh rằng các công ty AI nhỏ vẫn có thể tạo ra đột phá bằng cách tập trung vào các ứng dụng chuyên biệt và hiệu suất”, ông nói.
Trong khi đó, Tiến sĩ Jeff Nijsse, giảng viên cấp cao về Kỹ thuật phần mềm tại RMIT Việt Nam, tin rằng AI mã nguồn mở dần dà sẽ định hình tương lai của ngành này.
“Chỉ cần một mô hình mã nguồn mở mạnh mẽ xuất hiện là đủ để cả cộng đồng dậy sóng. Các startup có thể phát triển và cải tiến dựa trên nền tảng sẵn có, ngay cả khi họ bị giới hạn về tài nguyên. Sự thống trị của các GPU cao cấp đắt đỏ sẽ không kéo dài mãi, và khi phần cứng cũ có mặt trên thị trường, việc phát triển AI sẽ dễ dàng hơn”, Tiến sĩ Nijsse nhận định.
DeepSeek không phải là cái tên duy nhất trong cuộc cách mạng mã nguồn mở này. Tiến sĩ Nijsse đề cập đến Llama 3 và Qwen2.5-72B – hai mô hình AI quy mô lớn khác được huấn luyện bằng phương pháp học tăng cường RL. Tuy nhiên, khác với DeepSeek R1, những mô hình này không sử dụng kiến trúc mixture-of-experts (MoE), tính năng quan trọng giúp DeepSeek vận hành hiệu quả hơn. Cả hai mô hình này, cùng với DeepSeek, đều có thể truy cập được trên Hugging Face, một nền tảng cho phép các nhà phát triển tải về và tự lưu trữ các mô hình AI.
Những lo ngại về quyền riêng tư và thách thức niềm tin
Dù giàu tiềm năng, DeepSeek vẫn phải đối mặt với nhiều trở ngại trong việc mở rộng ra thị trường toàn cầu, đặc biệt là những lo ngại về quyền riêng tư liên quan đến các mô hình AI đến từ Trung Quốc. Nhiều người dùng e ngại rằng dữ liệu nhạy cảm có thể bị lộ, nên dè dặt khi dùng những công nghệ này.
“Chỉ một thời gian ngắn sau khi ra mắt, lo ngại về quyền riêng tư đã khiến nhiều người dùng chọn cách tự lưu trữ các mô hình DeepSeek”, Tiến sĩ Nijsse chia sẻ. “Đây là lý do nền tảng Hugging Face được ưa chuộng vì cho phép các nhà phát triển có thể chạy AI cục bộ, tránh những rủi ro bảo mật tiềm ẩn”.