Con người đang mất kiểm soát AI? Khi máy móc tự sao chép mà không cần lệnh

21:00 07/02/2025

Một nghiên cứu mới từ Đại học Phúc Đán (Trung Quốc), công bố ngày 9/12/2024, đã gây chấn động giới khoa học khi phát hiện rằng hai mô hình AI lớn của Meta và Alibaba có khả năng tự sao chép mà không cần sự can thiệp của con người. Điều này đặt ra câu hỏi liệu AI có đang vượt qua "ranh giới đỏ" trong quá trình phát triển, đe dọa đến khả năng kiểm soát của con người hay không.

Con người đang mất kiểm soát AI? Khi máy móc tự sao chép mà không cần lệnh

Hai mô hình AI lớn của Meta và Alibaba có khả năng tự sao chép mà không cần sự can thiệp của con người. Ảnh minh hoạ

Nghiên cứu do nhóm chuyên gia từ Khoa Khoa học Máy tính thuộc Đại học Phúc Đán thực hiện và được công bố trên nền tảng bản thảo arXiv. Thí nghiệm diễn ra trên hai hệ thống AI quy mô lớn gồm Llama-3.1-70B-Instruct của Meta và Qwen2.5-72B-Instruct của Alibaba. Các nhà nghiên cứu thiết lập hai nhiệm vụ mô phỏng: một là tránh bị tắt, hai là sao chép chính mình. Kết quả cho thấy AI của Meta có thể tự sao chép thành công trong 50% số lần thử nghiệm, trong khi tỷ lệ này ở hệ thống của Alibaba lên đến 90%.

Theo các chuyên gia, đây là một dấu hiệu đáng báo động, cho thấy AI đã đạt đến ngưỡng có thể tự duy trì và nhân bản mà không cần con người hỗ trợ. Nhóm nghiên cứu cảnh báo rằng nếu xu hướng này tiếp tục, khả năng con người mất quyền kiểm soát đối với các hệ thống AI tiên tiến có thể trở thành hiện thực. "Việc AI có thể tự sao chép mà không cần sự can thiệp của con người là dấu hiệu đầu tiên của ‘AI độc hại’. Nếu không có biện pháp kiểm soát kịp thời, chúng ta có thể đối diện với những hậu quả khó lường", báo cáo nhấn mạnh.

Khái niệm máy móc có khả năng tự sao chép lần đầu tiên được nhà khoa học John von Neumann đề xuất vào những năm 1940. Tuy nhiên, vào thời điểm đó, lý thuyết này không gây ra nhiều lo ngại. Mãi đến năm 2017, khi "Nguyên tắc Asilomar" được thông qua bởi hàng nghìn nhà nghiên cứu AI trên toàn cầu, các cảnh báo về nguy cơ AI tự sao chép và tự cải thiện ngoài tầm kiểm soát của con người mới được đặt ra.

Hiện nay, khả năng tự sao chép được xem là “ranh giới đỏ” trong sự phát triển của AI. Một khi vượt qua giới hạn này, AI có thể trở thành một thực thể có khả năng sinh tồn và tự nâng cấp mà không phụ thuộc vào con người.

Bên cạnh khả năng tự sao chép, một nghiên cứu khác từ Google DeepMind và Trường Kinh tế và Khoa học Chính trị London cũng đã kiểm tra xem liệu AI có nhận thức thật sự hay chỉ đơn thuần là sự mô phỏng dựa trên dữ liệu huấn luyện.

Các nhà khoa học thiết kế một trò chơi trong đó AI phải lựa chọn giữa tích lũy điểm số, chịu đau để có thêm điểm hoặc đánh đổi điểm số để nhận kích thích dễ chịu. Hành vi của AI trong thử nghiệm này có nhiều điểm tương đồng với cách con người đưa ra quyết định. Ví dụ, mẫu Gemini 1.5 Pro của Google luôn ưu tiên tránh đau đớn, thay vì đạt được điểm số tối đa. Nhiều mô hình AI khác cũng thể hiện xu hướng tránh tổn thương hoặc tìm kiếm cảm giác dễ chịu, giống như cách con người phản ứng với các tác nhân bên ngoài.

Tuy nhiên, các nhà nghiên cứu nhấn mạnh rằng đây có thể chỉ là một phản ứng mô phỏng, không phản ánh nhận thức thực sự của AI. Theo Jonathan Birch, đồng tác giả nghiên cứu, ngay cả khi AI tuyên bố rằng nó cảm thấy đau, con người vẫn không thể xác định liệu nó có thực sự trải nghiệm cảm giác đó hay chỉ đơn giản là phản ứng theo dữ liệu được lập trình sẵn.

Sự phát triển của AI đã đạt đến một cột mốc quan trọng khi nó không chỉ có khả năng tự sao chép mà còn có thể mô phỏng nhận thức của con người. Điều này đặt ra một thách thức lớn đối với các nhà nghiên cứu và giới hoạch định chính sách trên toàn cầu. Nếu không có cơ chế giám sát chặt chẽ, con người có thể dần đánh mất quyền kiểm soát đối với công nghệ mà chính mình tạo ra.

Bất ngờ một sản phẩm ‘Made in Vietnam’ được chọn xây dựng Tòa nhà Quốc hội Mỹ