Phát triển AI cần chậm lại cho đến khi có thể được điều chỉnh phù hợp

Nghiên cứu - Trao đổi - Ngày đăng : 10:54, 11/06/2026

Tốc độ phát triển AI ngày càng nhanh, và khả năng AI có thể sớm tự xây dựng chính nó, một lần nữa làm dấy lên những lo ngại trong doanh nghiệp về vấn đề điều chỉnh: Đảm bảo rằng AI sẽ hoạt động vì lợi ích của con người, chứ không phải của chính nó.

Nghiên cứu - Trao đổi

Phát triển AI cần chậm lại cho đến khi có thể được điều chỉnh phù hợp

LTV • {Ngày xuất bản}

Trí tuệ nhân tạo

AI có thể sớm dẫn đến các hệ thống có khả năng tự cải thiện hiệu suất nhanh hơn khả năng giám sát hiệu quả của con người, làm dấy lên những lo ngại về “vấn đề điều chỉnh”, đảm bảo các hệ thống AI theo đuổi mục tiêu của con người một cách đáng tin cậy, điều mà các nhà nghiên cứu của Anthropic (Anthropic là công ty trí tuệ nhân tạo chuyên phát triển các mô hình ngôn ngữ quy mô lớn và trợ lý AI, được thành lập vào năm 2021) đã cảnh báo trong một bài đăng blog mới có tiêu đề “Khi AI tự xây dựng chính nó”.

Anthropic đã phác thảo ba tương lai có thể xảy ra: sự tăng trưởng về khả năng của AI có thể chững lại; những lợi ích về hiệu quả của AI có thể tiếp tục tăng lên, nhưng bộc lộ những điểm nghẽn trong quá trình phát triển phần mềm; hoặc các hệ thống AI có thể trở nên có khả năng tự cải thiện hoàn toàn và tự xây dựng các thế hệ kế tiếp của chúng. Chính kịch bản thứ ba đó đã thúc đẩy đề xuất nên sẵn sàng hãm tốc độ phát triển AI.

“Việc vấn đề không đồng bộ sẽ được giải quyết như thế nào – hoặc không – trong tương lai này là điều chúng ta ít chắc chắn nhất,” đại diện Anthropic cho biết. Các mô hình tiên tiến, tự cải tiến có thể đáp ứng nhu cầu và mong muốn của chúng ta – hoặc, cảnh báo, “Những trường hợp không đồng bộ hiếm hoi hiện có trong các mô hình ngày nay có thể trở nên trầm trọng hơn khi các mô hình xây dựng các phiên bản kế nhiệm, ngày càng thường xuyên hơn nhưng lại ít được hiểu rõ hơn cho đến khi chúng ta mất kiểm soát chúng. Có thể chúng ta không thể xây dựng, tích hợp và xác minh các công cụ cần thiết để hiểu chúng ta thực sự đang ở trên xu hướng nào”;

Trong khi cảnh báo của Anthropic được đặt ra xung quanh sự phát triển của AI trong tương lai, các nhà phân tích cho rằng nó nêu bật các vấn đề quản trị mà các doanh nghiệp đang bắt đầu phải đối mặt khi các tác nhân AI tự động chuyển từ việc trả lời câu hỏi sang thực hiện hành động.

“Vấn đề không còn chỉ là liệu AI có đưa ra câu trả lời đúng hay không, mà là liệu các hệ thống tự động có thực hiện hành động đúng, vào đúng thời điểm, trong phạm vi quyền hạn cho phép hay không”, chuyên gia phân tích tại Gartner cho biết.

Từ quản trị mô hình đến quản trị tác nhân

Cảnh báo này được đưa ra trong bối cảnh các doanh nghiệp đang đầu tư ngày càng nhiều vào trí tuệ nhân tạo (AI) dựa trên tác nhân.

Gartner dự đoán rằng đến năm 2028, 15% các quyết định công việc hàng ngày sẽ được đưa ra một cách tự động thông qua AI dựa trên tác nhân và một phần ba các ứng dụng phần mềm doanh nghiệp sẽ tích hợp khả năng AI dựa trên tác nhân. Gartner cũng cảnh báo rằng những thiếu sót trong quản trị đã bắt đầu xuất hiện, dự đoán rằng 40% doanh nghiệp sẽ hạ cấp hoặc ngừng hoạt động các tác nhân AI tự động vào năm 2027 sau khi các lỗi quản trị trở nên rõ ràng trong môi trường sản xuất.

Theo Gartner, nhiều tổ chức vẫn tiếp tục coi các tác nhân AI như những công cụ năng suất tiên tiến trong khi chúng ngày càng giống với người lao động kỹ thuật số hoạt động với quyền hạn được ủy quyền.

Gartner cho rằng các CIO nên ngừng coi tác nhân AI như những chatbot thông minh hơn, chúng đang trở thành những người lao động kỹ thuật số với quyền hạn được ủy quyền, và phải được quản lý như những người dùng có đặc quyền, chứ không phải là công cụ năng suất.

Cũng theo Gartner, khi các tác nhân tự động có khả năng nghiên cứu, viết mã, gọi công cụ, kích hoạt quy trình làm việc và đưa ra khuyến nghị, các doanh nghiệp phải đối mặt với những rủi ro mới liên quan đến các hành động trái phép, lỗ hổng trách nhiệm, rò rỉ dữ liệu, lạm dụng công cụ và khả năng kiểm toán không đầy đủ.

Các nhà phân tích cho biết những lo ngại của Anthropic phản ánh những thách thức mà các doanh nghiệp đang gặp phải khi các hệ thống AI ngày càng tự chủ hơn. Các phương pháp quản trị hiện tại chủ yếu tập trung vào mô hình và dữ liệu, nhưng tác nhân tự chủ ngày càng cao cần sự giám sát về hành vi trong thời gian thực, quyền hạn, việc sử dụng công cụ và ranh giới quyết định.

Những lo ngại về việc giám sát tác nhân không chỉ giới hạn ở các nhà cung cấp AI và các nhà phân tích trong ngành.

Trong báo cáo “Quản trị tác nhân AI: Cẩm nang thực địa”, các nhà nghiên cứu từ Viện Chính sách và Chiến lược (Institute for AI Policy and Strategy) AI cảnh báo rằng “xã hội phần lớn chưa sẵn sàng cho sự phát triển này” và cho rằng việc nghiên cứu các vấn đề quản trị tác nhân và phát triển các biện pháp can thiệp liên quan vẫn còn ở giai đoạn sơ khai. Báo cáo lập luận rằng những tiến bộ trong các tác nhân AI tự động đang vượt xa các cơ chế quản trị cần thiết để giám sát chúng.

Các nhà phân tích cho rằng khung quản trị ban đầu được thiết kế cho các mô hình AI tạo sinh có thể không đủ cho các hệ thống ngày càng tự động. Các tổ chức sẽ cần giám sát chặt chẽ hơn về hành vi trong thời gian thực, quyền hạn, việc sử dụng công cụ và ranh giới quyết định khi các tác nhân trở nên có khả năng hơn.

Tại sao Anthropic lo ngại?

Các nhà nghiên cứu của Anthropic lập luận rằng những vấn đề quản trị đó có thể trở nên khó khăn hơn đáng kể nếu các hệ thống AI ngày càng tham gia vào quá trình nghiên cứu và phát triển AI.

Anthropic không đưa ra dự đoán rằng việc tự cải tiến đệ quy hoàn toàn tự động là điều không thể tránh khỏi. Thay vào đó, công ty lập luận rằng khả năng này cần được chuẩn bị và thảo luận giữa các nhà phát triển, nhà hoạch định chính sách và các bên liên quan khác, và cho rằng ngành công nghiệp cuối cùng có thể cần các cơ chế để làm chậm quá trình phát triển nếu khả năng công nghệ tiến bộ nhanh hơn các biện pháp bảo vệ, đồng thời thừa nhận rằng những biện pháp như vậy cũng tiềm ẩn rủi ro.

LTV