Cẩn thận với “bẫy hội tụ tác nhân” từ trí tuệ nhân tạo

Nghiên cứu - Trao đổi - Ngày đăng : 10:03, 15/05/2026

Khi các công ty triển khai hệ thống trí tuệ nhân tạo được đào tạo trên cùng dữ liệu thị trường, tối ưu hóa các mục tiêu tương tự với tốc độ máy móc, họ có nguy cơ rơi vào “bẫy hội tụ tác nhân”: các hệ thống độc lập đưa ra các quyết định giống hệt nhau, làm suy giảm sự khác biệt và đôi khi gây ra sự giám sát của cơ quan quản lý.

Nghiên cứu - Trao đổi

Cẩn thận với “bẫy hội tụ tác nhân” từ trí tuệ nhân tạo

LTV • {Ngày xuất bản}

Trí tuệ nhân tạo

Hãy xem xét ba quyết định được đưa ra trong ba ngành công nghiệp khác nhau trong hai năm qua.

Năm 2024, một vụ kiện tập thể liên bang đã nêu tên sáu chuỗi khách sạn lớn, Hilton, Hyatt, Marriott, Omni, Wyndham và Four Seasons, cáo buộc rằng nền tảng định giá AI chung của họ đã tạo ra mức giá phòng được phối hợp giữa các khách sạn cạnh tranh. Các khách sạn chưa bao giờ liên lạc với nhau. Bộ Tư pháp và Ủy ban Thương mại Liên bang gọi đó là sự phối hợp giá cả.

Một chuỗi cửa hàng tạp hóa khu vực đã thay thế các chuyên viên lập kế hoạch khuyến mãi bằng một hệ thống trí tuệ nhân tạo (AI) được đào tạo dựa trên cùng dữ liệu thị trường công khai mà mọi đối thủ cạnh tranh đều sử dụng. Chỉ trong vòng hai quý, lịch khuyến mãi của họ đã trùng khớp với lịch của người dẫn đầu thị trường. Người mua sắm không còn có thể lý giải tại sao họ lại thích chuỗi cửa hàng này hơn chuỗi cửa hàng khác.

Một chủ nhà cho thuê quốc gia đã áp dụng nền tảng tối ưu hóa tiền thuê nhà bằng AI được hàng nghìn nhà quản lý bất động sản cạnh tranh khác sử dụng. Họ đã tăng tiền thuê nhà theo cùng một tốc độ với các đối thủ mà họ chưa từng trao đổi. Bộ Tư pháp Mỹ đã nêu tên họ trong một vụ kiện chống độc quyền năm 2024.

Ba ngành công nghiệp. Ba quyết định mà các giám đốc điều hành cho là có lợi cho cạnh tranh. Ba kết quả dẫn đến những tổn thương chiến lược, tự gây ra.

Khi nhiều công ty triển khai các hệ thống AI học hỏi từ dữ liệu thị trường chồng chéo, tối ưu hóa các mục tiêu tương tự và hoạt động với tốc độ máy móc – một mô hình phù hợp với những gì đã ghi nhận trong các thị trường được điều hòa bởi AI, và một mô hình mà các nghiên cứu được bình duyệt trên Tạp chí Kinh tế Mỹ và Tạp chí Kinh tế Chính trị đã đo lường một cách thực nghiệm – thì các hệ thống đó có xu hướng đi đến cùng một kết luận một cách độc lập.

Đâygọi là bẫy hội tụ tác nhân (agentic convergence trap). Để hiểu được điều đó, không chỉ cần hiểu cách thức hoạt động của các hệ thống AI, mà còn cần hiểu cách các nhà quản lý đã tạo điều kiện cho hành vi đó diễn ra.

Câu hỏi chưa ai từng đặt ra

Cuộc thảo luận chiến lược về AI cho đến nay tập trung vào hai điều. Thứ nhất, liệu một công ty cụ thể đã áp dụng AI đủ hiệu quả để đạt được lợi thế hay chưa. Thứ hai, liệu AI, khi được phổ biến rộng rãi, có thể mang lại bất kỳ lợi thế bền vững nào hay không, hay nó chỉ đơn giản là nâng cao mức sàn cho tất cả mọi người. Cả hai cách tiếp cận đều xem xét AI từ góc độ của một công ty duy nhất đưa ra quyết định triển khai.

Những cách tiếp cận đó không sai, nhưng chúng chưa đầy đủ. Các hệ thống tác nhân giờ đây không chỉ có thể truy cập nhiều dữ liệu hơn mà còn cả dữ liệu trước đây không thể tiếp cận được. Chúng có thể phân tích dữ liệu đó với tốc độ và chu kỳ phản hồi không chỉ không thể tưởng tượng được mà còn không thể thực hiện được cho đến gần đây. Nhưng điều gì sẽ xảy ra khi tác nhân AI của bạn và tác nhân AI của đối thủ cạnh tranh cùng được triển khai trên cùng một thị trường và bắt đầu học hỏi lẫn nhau cùng một lúc?

Câu trả lời là sự hội tụ. Các tác nhân AI độc lập, được đào tạo trên dữ liệu tương tự, tối ưu hóa các mục tiêu tương tự, với tốc độ máy, phát triển các mô hình thực tế thị trường gần như giống hệt nhau và hành động dựa trên chúng theo những cách gần như giống hệt nhau. Không phải do thiết kế. Không phải thông qua giao tiếp. Mà là bằng cách học.

Đây không phải là một rủi ro lý thuyết. Hiện tượng này đã có thể đo lường được trong các lĩnh vực bán lẻ, khách sạn, hàng không và nhà ở. Và nó đang tăng tốc, bởi vì chính các hệ thống AI tác nhân thúc đẩy sự hội tụ cũng đang ngày càng nhanh hơn.

Tại sao việc chuyển đổi nhà cung cấp sẽ không giúp ích gì?

Khi các nhà quản lý nhận thấy sự hội tụ, nhiều người cho rằng vấn đề nằm ở phần mềm chung và do đó dẫn đến kết quả hội tụ. Nếu đây là chẩn đoán, thì các giải pháp hợp lý sẽ là thay đổi giao diện, chuyển đổi nhà cung cấp, xây dựng dữ liệu và tính năng độc quyền. Tuy nhiên, gốc rễ của sự hội tụ không phải là phần mềm chung, mà là quy trình học tập chung và tốc độ của nó.

Con người cũng học, vậy tại sao lại có ít sự hội tụ hơn khi con người đưa ra các quyết định chiến lược so với khi các tác nhân AI đưa ra quyết định? Phán đoán của con người tạo ra sự biến đổi tự nhiên: một người quản lý bỏ qua hành động được đề xuất, một nhóm làm việc chậm, một nhà lãnh đạo khu vực nhận diện thị trường khác nhau. Những vấn đềt đó, thường được coi là thiếu hiệu quả, lại chính là cơ chế tạo ra sự đa dạng chiến lược.

Các hệ thống AI tác nhân không chỉ đơn giản tuân theo các quy tắc như hệ thống chuyên gia; chúng học các quy tắc. Nếu loại bỏ sự khác biệt, hạn chế, thành kiến và cảm xúc của con người, hai tác nhân AI được triển khai độc lập, được đào tạo trong cùng một môi trường cạnh tranh, sẽ đi đến cùng một kết luận: cùng mục tiêu, cùng tín hiệu, kết luận, quyết định và kết quả tương tự.

Bằng chứng kinh tế rất thuyết phục. Các nhà kinh tế nghiên cứu thị trường xăng dầu bán lẻ của Đức nhận thấy rằng khi chỉ có một công ty áp dụng tác nhân định giá AI, lợi nhuận không thay đổi. Khi cả hai công ty cạnh tranh cùng áp dụng, lợi nhuận tăng khoảng 38% trên toàn thị trường. Các tác nhân này không chia sẻ dữ liệu. Chúng chỉ đơn giản là học hỏi một cách độc lập rằng định giá hợp tác mang lại lợi ích cho cả hai bên.

Nghiên cứu về thị trường hàng không Mỹ cũng cho thấy một kết quả trái ngược với trực giác: Định giá AI năng động mở rộng sản lượng nhưng làm giảm tổng phúc lợi người tiêu dùng so với định giá đồng nhất. Giá vé của các hãng hàng không cạnh tranh hội tụ vì hệ thống AI của họ phản hồi tín hiệu khan hiếm của nhau nhanh hơn bất kỳ chiến lược định giá nào của con người có thể phân biệt được, không phải thông qua sự phối hợp, mà thông qua việc học hỏi cùng một môi trường cạnh tranh đồng thời.

Câu hỏi chiến lược không phải là liệu AI của bạn có hoạt động hay không. Mà là liệu nó đang hoạt động vì lợi ích của bạn hay đang âm thầm hoạt động vì lợi ích của toàn bộ thị trường.

Thất bại về tổ chức đằng sau cái bẫy

Bẫy hội tụ không chủ yếu là vấn đề công nghệ. Đó là thất bại về lãnh đạo và quản trị mà công nghệ che giấu đi.

Qua các triển khai được nghiên cứu, mô hình này nhất quán. Một nhóm điều hành áp dụng nền tảng AI dưới áp lực thời gian hoặc sự cạnh tranh cấp bách. Các cài đặt mặc định được chấp nhận vì việc đặt câu hỏi về chúng đòi hỏi chuyên môn kỹ thuật mà nhóm lãnh đạo không có. Các quy trình xem xét của con người trước đây tạo ra sự khác biệt chiến lược bị loại bỏ, bởi vì việc loại bỏ trở ngại đó là mục đích. Qua thời gian, AI học cách đạt đến vị trí giống như mọi AI khác trên cùng một nền tảng.

Trường hợp của RealPage làm rõ điều này (nhà cung cấp toàn cầu về nền tảng phần mềm hỗ trợ trí tuệ nhân tạo và phân tích dữ liệu cho ngành bất động sản, được thiết kế để giúp chủ sở hữu và người quản lý tối ưu hóa hoạt động bất động sản và tối đa hóa doanh thu). RealPage không ép buộc chủ nhà chấp nhận các đề xuất về giá của mình. Họ đã xây dựng một tính năng tự động chấp nhận. Hàng trăm chủ nhà cạnh tranh đã độc lập lựa chọn kích hoạt nó. Mỗi quyết định đều hợp lý: AI nhanh hơn, và người đánh giá là con người thì chậm hơn và tốn kém hơn. Kết quả tổng hợp là một thị trường nhà ở nơi các hệ thống AI điều phối việc tăng giá thuê nhà trên quy mô lớn giữa các thành phố, mà không có bất kỳ giám đốc điều hành nào đưa ra lựa chọn đó.

Hầu hết các khung quản trị AI tập trung vào độ chính xác, thiên kiến và rủi ro pháp lý. Hầu như không ai coi việc duy trì sự đa dạng chiến lược là mục tiêu quản trị. Những công ty tránh được bẫy hội tụ là những công ty có quy trình được thiết kế để đặt ra một câu hỏi trước khi giao phó bất kỳ quyết định nào cho AI: Điều gì sẽ xảy ra với vị thế cạnh tranh của công ty nếu mọi đối thủ đều đưa ra lựa chọn giống hệt nhau do AI điều khiển?

Một phản hồi theo trình tự

Có một trình tự đúng để giải quyết bẫy hội tụ. Bắt đầu với quản trị, bởi vì nếu không có nó thì các bước khác sẽ không hiệu quả, sau đó là thiết kế mục tiêu, tiếp theo là dữ liệu và cuối cùng là đo lường.

1. Quyết định xem con người nên tham gia vào quy trình ở đâu. Các nhóm điều hành nên xác định những quyết định nào cần sự phê duyệt của con người bất kể AI đề xuất điều gì. Bất kỳ quyết định nào mà kết quả do AI điều khiển sẽ giống hệt với mọi đối thủ cạnh tranh đều là quyết định không nên được giao hoàn toàn. Trên thực tế: giá cả vượt quá ngưỡng nhất định, chiến lược khuyến mãi ảnh hưởng đến các phần quan trọng của dòng sản phẩm, tiêu chí tuyển dụng nhân tài và phản hồi đối với các động thái của đối thủ cạnh tranh trong khung thời gian cụ thể. Các quy trình xem xét của con người đã bị loại bỏ vì chúng chậm và tốn kém - nhưng những chi phí đó thường thấp hơn nhiều so với chi phí trở nên không thể phân biệt được.

2. Xác định những gì AI tối ưu hóa ngoài các thiết lập mặc định của nền tảng. Mỗi nền tảng đều đi kèm với mục tiêu được thiết kế để áp dụng rộng rãi trong thương mại: tối đa hóa doanh thu, tối thiểu hóa chi phí, tăng tỷ lệ chuyển đổi. Những thiết lập mặc định đó cũng là những gì mà mọi đối thủ cạnh tranh trên cùng nền tảng đang tối ưu hóa. Câu hỏi trước khi triển khai bất kỳ hệ thống nào không phải là liệu AI có hoạt động hay không, mà là liệu nó có tối ưu hóa cho điều gì đó mà đối thủ cạnh tranh trên cùng nền tảng sẽ không tối ưu hóa hay không. Ví dụ, Deep Brew của Starbucks được thiết kế để tối ưu hóa tần suất ghé thăm và chiều sâu mối quan hệ lâu dài, với giá trị giao dịch là hệ quả gián tiếp chứ không phải là mục tiêu chính. AI đặt câu hỏi làm thế nào để khách hàng này quay lại vào thứ Ba tuần sau. Ngược lại, AI của đối thủ cạnh tranh, chủ yếu tối ưu hóa cho giá trị hóa đơn, nhìn thấy cùng một khách hàng và đề xuất thêm bánh ngọt hoặc nâng cấp kích cỡ. Việc tái cấu trúc chương trình khách hàng thân thiết năm 2025 của Dunkin' đã làm rõ mục tiêu này, thiết kế chương trình của họ đặc biệt để thúc đẩy giá trị hóa đơn cao hơn thông qua việc thêm đồ ăn. Cả hai hệ thống đều không hoạt động sai. Chúng chỉ đơn giản là tối ưu hóa các mục tiêu khác nhau. Được tích lũy qua hàng triệu tương tác, những mục tiêu đó xây dựng nên các mối quan hệ khách hàng hoàn toàn khác nhau. Lựa chọn mục tiêu là nơi bắt đầu sự khác biệt chiến lược.

3. Cung cấp cho AI của bạn dữ liệu mà đối thủ cạnh tranh không thể tiếp cận. Dữ liệu độc quyền không phải là về số lượng, mà là về tính độc quyền. Đầu vào mặc định của mọi nền tảng AI lớn đều là những tín hiệu thị trường công khai: giá cả của đối thủ cạnh tranh, dữ liệu giao thông, thời tiết, mức tồn kho. Khi hệ thống AI của nhiều công ty cùng sử dụng tín hiệu công khai này, chúng sẽ xây dựng cùng một mô hình thị trường. Các nhà nghiên cứu của Đại học Carnegie Mellon, những người đã nghiên cứu hành vi định giá thuật toán của Amazon, nhận thấy rằng các công ty khó bị khai thác nhất là những công ty có quyết định kết hợp các tín hiệu nội bộ mà đối thủ cạnh tranh không thể quan sát được. Lợi thế về giá tăng đột biến của Uber so với Lyft dựa trên 61 tỷ chuyến đi trong quá khứ trên hơn 10.000 thành phố, một tập dữ liệu hành vi mà đội xe nhỏ hơn của Lyft chưa bao giờ sánh kịp, và trên các tín hiệu thời gian thực như tỷ lệ mở ứng dụng ở cấp độ khu phố phản ánh quy mô một thập kỷ mà Lyft không thể sao chép chỉ sau một đêm.

Xác định những gì tổ chức của bạn biết mà đối thủ cạnh tranh không thể quan sát được: các mô hình hành vi của khách hàng từ các kênh sở hữu, dữ liệu mối quan hệ theo thời gian, các tín hiệu hoạt động tuyến đầu không bao giờ xuất hiện trong cơ sở dữ liệu ngành. Chuyển các tín hiệu đó vào AI của bạn trước khi nó mặc định sử dụng các đầu vào công khai mà mọi nền tảng đã sử dụng.

4. Đo lường sự hội tụ, không chỉ hiệu suất. Hầu hết các tổ chức theo dõi AI thông qua các chỉ số hoạt động: tỷ lệ chấp nhận đề xuất, độ chính xác về giá cả, mức tăng chuyển đổi. Không chỉ số nào trong số này phát hiện ra sự hội tụ. Một cuộc khảo sát hơn 70 nhà quản lý doanh nghiệp có quyền giám sát thuật toán định giá, được thực hiện như một phần của đánh giá nhóm làm việc NBER năm 2024, cho thấy hầu hết các công ty sử dụng thuật toán định giá đều bày tỏ mối lo ngại đáng kể về việc giảm tính minh bạch và mất quyền kiểm soát quản lý - nhưng chưa phát triển các quy trình quản trị để giải quyết những mối lo ngại đó một cách có hệ thống.

Báo cáo Tình trạng AI trong Doanh nghiệp năm 2026 của Deloitte, một cuộc khảo sát hơn 3.200 nhà lãnh đạo cấp cao trên nhiều ngành, cho thấy chỉ có một trong năm công ty có mô hình quản trị hoàn thiện cho các tác nhân AI tự động, ngay cả khi ba phần tư các tổ chức có kế hoạch triển khai chúng trong vòng hai năm. JPMorgan Chase, một trong những tổ chức tài chính của Hoa Kỳ đã xây dựng một trong những khung quản trị AI được ghi chép đầy đủ nhất, hiện đang áp dụng giám sát tuân thủ tự động trên tất cả các mô hình AI như một phần của những gì họ mô tả là kỷ luật quản lý rủi ro mô hình. Google đã thành lập các Ban Đánh giá Trách nhiệm AI nội bộ vào năm 2024. Cả hai công ty đều không sử dụng thuật ngữ “kiểm toán sai lệch” một cách công khai, nhưng cả hai đều đã vận dụng nguyên tắc cơ bản: các hệ thống AI cần được đo lường liên tục về hành vi cạnh tranh của chúng, chứ không chỉ hiệu suất kỹ thuật.

Các nhóm điều hành tại các công ty này đang tích hợp ba chỉ số vào quy trình quản trị của họ. Thứ nhất, tương quan quyết định: các quyết định do AI điều khiển phù hợp với hành vi của đối thủ cạnh tranh có thể quan sát được trong chín mươi ngày qua đến mức nào? Thứ hai, trùng lặp thời gian: tỷ lệ phần trăm các hành động do AI khởi xướng xảy ra trong cùng một khoảng thời gian với hành động của đối thủ cạnh tranh là bao nhiêu? Thứ ba, tính độc quyền của dữ liệu: tỷ lệ phần trăm dữ liệu đầu vào của AI đến từ các nguồn mà đối thủ cạnh tranh không thể truy cập là bao nhiêu? Chỉ định người chịu trách nhiệm cho mỗi chỉ số. Coi sự suy giảm sai lệch như một cảnh báo chiến lược với mức độ khẩn cấp tương tự như điểm số hài lòng của khách hàng giảm sút.

Chi phí của sự hội tụ

Bộ Tư pháp Mỹ cáo buộc rằng sự phối hợp thuật toán thông qua RealPage (nhà cung cấp toàn cầu về nền tảng phần mềm hỗ trợ trí tuệ nhân tạo và phân tích dữ liệu cho ngành bất động sản) đã góp phần làm tăng giá thuê nhà trên khắp các thành phố lớn của Mỹ. Khi các hệ thống AI học cách phối hợp việc tăng giá các mặt hàng thiết yếu, mà không cần giao tiếp, không có chủ đích, và không có bất kỳ con người nào trong chuỗi đưa ra lựa chọn có chủ ý để tăng giá, thì tác hại là có thật và trách nhiệm giải trình là không rõ ràng.

Đây không phải là lập luận chống lại AI. Đây là lập luận về trách nhiệm giải trình của ban điều hành. Các tổ chức đã kích hoạt tính năng tự động chấp nhận của RealPage không cố ý gây hại cho người thuê nhà. Họ đang tối ưu hóa doanh thu từ việc cho thuê. Nhưng lựa chọn của tổ chức là loại bỏ phán đoán của con người khỏi vòng lặp đó đã tạo ra những hậu quả mà không một giám đốc điều hành nào cố ý lựa chọn. Kết quả không phải là ý định của ai cả. Đó là trách nhiệm của tất cả mọi người.

AI hiện đã phổ biến trong hầu hết các ngành công nghiệp. Nhưng cạnh tranh không còn là về việc ai có thuật toán mạnh nhất nữa. Những người chiến thắng trong giai đoạn tiếp theo của quá trình chuyển đổi AI sẽ là những công ty đã thiết kế AI của họ để đạt được những kết luận mà AI của đối thủ cạnh tranh không thể. Điều này đòi hỏi phải xác định rõ ràng trách nhiệm của con người, định nghĩa các mục tiêu vượt ra ngoài những đặt mặc định của nền tảng, xây dựng nguồn dữ liệu mà đối thủ cạnh tranh không thể sao chép, và đo lường sự khác biệt như một chỉ số chiến lược chứ không phải là một kết quả may mắn. Công việc không bắt đầu từ bộ phận công nghệ, mà từ phòng họp với một câu hỏi mà hầu hết các nhóm điều hành chưa từng đặt ra: những quyết định nào đòi hỏi chúng ta phải chịu trách nhiệm bảo tồn sự đa dạng chiến lược, và chúng ta sẽ phải trả giá như thế nào nếu giao phó trách nhiệm đó cho một thuật toán?

LTV