Ngành dữ liệu rộng lớn và những băn khoăn liên quan tới dữ liệu cá nhân

Nghiên cứu - Trao đổi - Ngày đăng : 11:34, 31/03/2026

Trong nền kinh tế số, dữ liệu khách hàng đang trở thành một loại nguyên liệu, liên quan đến hầu hết doanh nghiệp, từ ngân hàng, thương mại điện tử đến bán lẻ và viễn thông. Tại Việt Nam, khi việc xử lý dữ liệu cá nhân được đưa vào danh mục ngành nghề kinh doanh có điều kiện, nhiều doanh nghiệp trong chuỗi giá trị dữ liệu cho biết họ đang rơi vào trạng thái chờ đợi vì chưa rõ cách áp dụng quy định.

Nếu hiểu theo nghĩa hẹp, thị trường xử lý dữ liệu chỉ bao gồm các doanh nghiệp gia công dữ liệu cho khách hàng khác. Tuy nhiên, trên thực tế ngành này trải dài qua nhiều lớp hoạt động.

Một chuỗi giá trị dữ liệu nhiều tầng

Ở tầng đầu tiên là gia công dữ liệu (data processing BPO). Đây là nhóm doanh nghiệp thực hiện các công việc như nhập dữ liệu, làm sạch dữ liệu, chuẩn hóa dữ liệu, số hóa hồ sơ hoặc gán nhãn dữ liệu để huấn luyện hệ thống AI. Các công ty hoạt động trong lĩnh vực này, chủ yếu phục vụ khách hàng cần xử lý khối lượng dữ liệu lớn với chi phí thấp.

Ở tầng thứ hai là kỹ thuật dữ liệu (data engineering), nơi các công ty công nghệ xây dựng hệ thống xử lý dữ liệu cho doanh nghiệp. Công việc bao gồm thiết kế kho dữ liệu, xử lý dữ liệu lớn, xây dựng chuỗi xử lý dữ liệu và tích hợp dữ liệu từ nhiều nguồn khác nhau. Các công ty công nghệ lớn của Việt Nam như FPT Software, TMA Solutions hay CMC Global thường tham gia vào các dự án chuyển đổi số quy mô lớn cho ngân hàng, viễn thông hoặc bán lẻ.

Tầng thứ ba là phân tích dữ liệu và trí tuệ nhân tạo. Đây là nhóm doanh nghiệp khai thác giá trị từ dữ liệu, từ việc phân tích hành vi khách hàng đến xử lý dữ liệu hình ảnh hoặc dữ liệu giao dịch. Một số startup công nghệ tại Việt Nam đang hoạt động trong phân khúc này, chẳng hạn các công ty phân tích dữ liệu bán lẻ hoặc sử dụng dữ liệu viễn thông để xây dựng hệ thống chấm điểm tín dụng.

Cuối cùng là tầng nền tảng dữ liệu, bao gồm các nhà cung cấp hạ tầng điện toán đám mây và dịch vụ phân tích dữ liệu quy mô lớn. Các nền tảng như Amazon Web Services, Microsoft Azure và Google Cloud hiện đóng vai trò quan trọng trong hệ sinh thái dữ liệu tại Việt Nam.

Phần lớn dữ liệu đều là… dữ liệu cá nhân

Điểm chung của nhiều hoạt động trong chuỗi giá trị dữ liệu là dữ liệu cá nhân xuất hiện gần như ở mọi khâu.

Dữ liệu giao dịch trong ngân hàng, dữ liệu hành vi mua sắm trong bán lẻ, dữ liệu viễn thông hay dữ liệu vị trí trong các ứng dụng di động đều có thể được coi là dữ liệu cá nhân. Điều này khiến quy định mới về xử lý dữ liệu cá nhân có thể tác động đến một phạm vi doanh nghiệp rộng hơn nhiều so với dự đoán ban đầu của các doanh nghiệp.

Một doanh nghiệp trong ngành cho biết họ đang cố gắng hiểu các yêu cầu liên quan đến hạ tầng kỹ thuật và nhân sự. Nghị định 356 yêu cầu doanh nghiệp phải có hạ tầng, hệ thống trang thiết bị, cơ sở vật chất và công nghệ phù hợp với dịch vụ xử lý dữ liệu cá nhân và tối thiểu ba nhân sự đủ điều kiện phụ trách.

Việc đưa xử lý dữ liệu cá nhân vào danh mục ngành nghề kinh doanh có điều kiện khiến nhiều công ty bắt đầu nhìn quy định mới giống như một dạng loại giấy phép con. Nghĩa là phải đi xin và chờ phê duyệt.

Cũng theo doanh nghiệp này, việc đưa xử lý dữ liệu cá nhân vào danh mục ngành nghề kinh doanh có điều kiện khiến nhiều công ty bắt đầu nhìn quy định mới giống như một dạng loại giấy phép con. Nghĩa là phải đi xin và chờ phê duyệt.

Một doanh nghiệp trong lĩnh vực nghiên cứu thị trường cho biết họ đã áp dụng các tiêu chuẩn quốc tế về bảo vệ dữ liệu cá nhân từ lâu. “Trong ngành nghiên cứu thị trường, chúng tôi đã tuân thủ bộ quy tắc của ICC/WBO về xử lý dữ liệu cá nhân. Bây giờ có thêm quy định trong nước nên câu hỏi là các bộ quy tắc này có được thừa nhận lẫn nhau hay không”, đại diện doanh nghiệp nói.

Theo doanh nghiệp này, các công ty nghiên cứu thị trường vốn phải tuân thủ quy trình nghiêm ngặt khi thu thập và xử lý dữ liệu người tham gia khảo sát. Hai trong số năm nguyên tắc cốt lõi của bộ quy tắc ICC/WBO liên quan đến dữ liệu cá nhân. Các nhà nghiên cứu phải thông báo rõ ràng cho người cung cấp dữ liệu về cách dữ liệu cá nhân của họ sẽ được thu thập và sử dụng. Mọi dữ liệu cá nhân phải được bảo vệ đầy đủ trước việc truy cập hoặc sử dụng trái phép. Thêm nữa, nghiên cứu phải được thực hiện với sự cẩn trọng cần thiết, bảo đảm các tương tác diễn ra công bằng, tôn trọng và không gây tổn hại cho người cung cấp dữ liệu.

Tuy nhiên, khi khung pháp lý trong nước thay đổi, họ vẫn chưa hiểu rõ cần điều chỉnh quy trình như thế nào.

Bài toán cân bằng của kinh tế dữ liệu

Bức tranh doanh nghiệp dữ liệu tại Việt Nam cho thấy thị trường này có cấu trúc khá đặc thù. Ở tầng gia công dữ liệu, nhiều công ty có quy mô nhỏ và trung bình, phục vụ chủ yếu khách hàng quốc tế trong các hợp đồng gia công quy trình doanh nghiệp. Ở tầng kỹ thuật dữ liệu, các công ty công nghệ thông tin lớn của Việt Nam đóng vai trò triển khai hệ thống xử lý dữ liệu trong các dự án chuyển đổi số. Trong khi đó, các startup công nghệ mới nổi tập trung vào phân tích dữ liệu và AI. Phần hạ tầng, đặc biệt là điện toán đám mây, lại chủ yếu do các tập đoàn công nghệ toàn cầu cung cấp.

Cấu trúc này khiến tác động của các quy định mới về dữ liệu cá nhân có thể khác nhau giữa các nhóm doanh nghiệp. Các công ty trực tiếp thu thập hoặc xử lý dữ liệu người dùng, chẳng hạn doanh nghiệp phân tích dữ liệu hay nghiên cứu thị trường, có thể chịu ảnh hưởng rõ rệt hơn.

Việt Nam đang thúc đẩy phát triển kinh tế số, nơi dữ liệu được coi là nguồn tài nguyên quan trọng cho đổi mới và tăng trưởng. Nhưng cùng lúc đó, các chính phủ trên thế giới cũng ngày càng siết chặt quy định nhằm bảo vệ quyền riêng tư của người dân.

Làm thế nào để vừa bảo vệ dữ liệu cá nhân, vừa không tạo ra rào cản quá lớn đối với ngành dữ liệu đang phát triển. Trong khi chờ hướng dẫn chi tiết hơn, nhiều doanh nghiệp trong ngành cho biết họ vẫn đang theo dõi sát diễn biến của khung pháp lý mới. Đối với một lĩnh vực đang được xem là nền tảng của kinh tế số, sự rõ ràng của chính sách có thể quyết định tốc độ phát triển của toàn bộ hệ sinh thái dữ liệu trong những năm tới.

Hoàng Minh