Năm 2024 đã chứng kiến bước chuyển tiếp mạnh mẽ của trí tuệ nhân tạo, từ giai đoạn thí điểm sang triển khai vào sản xuất. Vào năm 2025, trí tuệ nhân tạo sẽ được mở rộng toàn diện trong toàn doanh nghiệp.
Trí tuệ nhân tạo (genAI) đã phát triển nhanh được ứng dụng rộng rãi hơn bất kỳ công nghệ nào khác hiện nay, và mang lại lợi nhuận cho nhiều doanh nghiệp.
Các nhà cung cấp cũng bổ sung AI vào toàn bộ các sản phẩm phần mềm doanh nghiệp. Thế giới cũng đã chứng kiến sự xuất hiện những làn sóng AI mới như AI tác nhân (agentic AI), AI đa phương thức (multi - modal AI), AI lý luận (reasoning AI) và các dự án AI nguồn mở cạnh tranh với các nhà cung cấp thương mại lớn nhất.
Mô hình ngôn ngữ nhỏ và điện toán biên
Phần lớn sự chú ý trong năm nay và năm ngoái đều đổ dồn vào các mô hình ngôn ngữ lớn (LLM), chẳng hạn như ChatGPT với nhiều biến thể khác nhau, cũng như các đối thủ cạnh tranh như mô hình Claude của Anthropic và mô hình Llama của Meta. Nhưng với nhiều trường hợp sử dụng trong kinh doanh, LLM là quá mức cần thiết và quá đắt, quá chậm để sử dụng thực tế.
Nhìn sang năm 2025, kỳ vọng các mô hình ngôn ngữ nhỏ, các mô hình tùy chỉnh, sẽ trở thành giải pháp phổ biến hơn cho nhiều doanh nghiệp. LLM không chỉ đắt mà còn rất rộng và không phải lúc nào cũng phù hợp với các ngành cụ thể.
Mặt khác, các mô hình nhỏ được thiết kế riêng, cho phép doanh nghiệp tạo ra các hệ thống AI chính xác, hiệu quả, mạnh mẽ và được xây dựng dựa trên nhu cầu riêng của họ. Thêm vào đó, chúng có thể được đào tạo dễ dàng hơn trên dữ liệu của chính doanh nghiệp.
Mô hình ngôn ngữ nhỏ cũng tốt hơn cho việc triển khai điện toán biên và di động, giống như thông báo gần đây của Apple về AI di động. Các doanh nghiệp, đặc biệt là doanh nghiệp có lượng nhân viên và khách hàng lớn, sẽ đặt ra tiêu chuẩn cho việc áp dụng AI trên thiết bị cá nhân, và có thể thấy sự gia tăng nhà cung cấp công nghệ luôn coi trọng những doanh nghiệp lớn khi phát triển công nghệ trên thiết bị.
AI sẽ tiếp cận khả năng lý luận của con người
Vừa qua, OpenAI đã phát hành một loạt mô hình mới có khả năng suy nghĩ thấu đáo các vấn đề giống như con người. Công ty cho biết có thể đạt được hiệu suất ở cấp độ tiến sĩ trong các bài kiểm tra chuẩn đầy thách thức về vật lý, hóa học và sinh học. Ví dụ, mô hình tốt nhất trước đây, GPT-4o, chỉ có thể giải quyết được 13% các bài toán trong Kỳ thi Olympic Toán học quốc tế, trong khi mô hình lý luận mới đã giải quyết được 83%.
Mô hình mới này rất giỏi trong lý luận thông qua các vấn đề logic. Điều đó có nghĩa là có thể sử dụng nó cho vấn đề mã khó hoặc lập kế hoạch dự án quy mô lớn, trong đó các rủi ro phải được so sánh với nhau.
Theo phân tích, nếu AI có khả năng lý luận tốt hơn, thì các tác nhân AI có thể hiểu được ý định của con người, chuyển đổi ý định đó thành một loạt các bước và thực hiện mọi việc. Lý luận cũng giúp sử dụng AI như một hệ thống hỗ trợ quyết định nhiều hơn.
Tăng trưởng mạnh trong các trường hợp được chứng minh
Năm 2024 đã chứng kiến một số trường hợp sử dụng mang lại lợi nhuận ROI. Vào năm 2025, những trường hợp sử dụng đó sẽ được áp dụng rộng rãi, đặc biệt là nếu công nghệ AI được tích hợp vào các nền tảng phần mềm mà doanh nghiệp đang sử dụng, giúp việc áp dụng trở nên đơn giản.
Các lĩnh vực dịch vụ khách hàng, tiếp thị và phát triển khách hàng sẽ được áp dụng rộng rãi hơn cả.
Dự đoán điều tương tự sẽ xảy ra trong mọi lĩnh vực phát triển phần mềm, bắt đầu từ nghiên cứu yêu cầu của người dùng thông qua quản lý dự án và cho đến thử nghiệm và đảm bảo chất lượng.
Sự tiến triển của phát triển nhanh nhẹn
Khái niệm nhanh nhạy (agile) được sử dụng vào năm 2001 và kể từ đó, triết lý phát triển đã liên tục phát triển hơn so với cách phát triển phần mềm theo kiểu thác nước trước đây.
Trong khoảng 15 năm trở lại đây, đây là tiêu chuẩn mặc định về cách thức phát triển phần mềm hiện đại. Nhưng phương pháp Agile được tổ chức xung quanh những hạn chế của con người, không chỉ hạn chế về tốc độ con người có thể viết mã, mà còn về cách các nhóm được tổ chức và quản lý…
Ngày nay, AI thế hệ mới là một công cụ bổ sung, được sử dụng để tăng năng suất của từng thành viên trong nhóm. Nhưng toàn bộ quy trình cũng cần được thay đổi để tận dụng tối đa công nghệ. Ngoài ra còn phải xem xét cách con người tương tác với đồng nghiệp và cách tương tác với AI.
Bổ sung các quy định
Vào cuối tháng 9 năm 2024, thống đốc California - Mỹ đã ký một đạo luật yêu cầu các nhà phát triển AI phải tiết lộ dữ liệu họ sử dụng để đào tạo hệ thống của mình, áp dụng cho các nhà phát triển công khai hệ thống AI cho người dân California. Các nhà phát triển phải tuân thủ vào đầu năm 2026, nghĩa là họ sẽ có hơn một năm để đưa hệ thống vào hoạt động nhằm theo dõi nguồn gốc dữ liệu đào tạo của họ.
Trên thực tế, rất nhiều người có mối liên hệ ở California, đặc biệt là trong lĩnh vực AI. Nhiều công ty công nghệ hàng đầu thế giới có trụ sở chính tại California và nhiều trong số họ cung cấp các công cụ phần mềm. Trên thực tế đã có nhiều quy định khác, cả ở Mỹ và nước ngoài, liên quan đến các vấn đề như quyền riêng tư dữ liệu và ra quyết định theo thuật toán cũng sẽ áp dụng cho AI.
Ngoài ra còn có các quy định về việc sử dụng deep fake (phương tiện tổng hợp được điều khiển bằng kỹ thuật số để thay thế chân dung, giọng nói của người khác), nhận dạng khuôn mặt... Luật toàn diện nhất, Đạo luật AI của EU (EU AI Act), có hiệu lực vào mùa hè năm ngoái, cũng là điều mà các công ty sẽ phải tuân thủ bắt đầu từ giữa năm 2026. Vì vậy, một lần nữa, năm 2025 là năm mà các doanh nghiệp cần phải chuẩn bị.
Có khả năng cao là Đạo luật AI của EU sẽ dẫn đến nhiều quy định hơn ở các nơi khác trên thế giới. Đây là một bước tiến về mặt quản trị, cố gắng đảm bảo AI được sử dụng theo cách có lợi cho xã hội.
AI sẽ trở nên dễ tiếp cận và phổ biến
Khi internet mới xuất hiện, người dùng trước tiên cần phải học HTML nếu muốn có một trang web, tiếp theo là phải có modem và phần mềm đặc biệt cùng các tài khoản với nhà cung cấp internet. Bây giờ chỉ cần nhập từ bạn đang tìm kiếm. Với AI mới, mọi người vẫn đang trong giai đoạn tìm hiểu AI thế hệ mới là gì, hoạt động như thế nào và cách sử dụng nó.
Tuy nhiên, AI thế hệ mới sẽ trở nên phổ biến hơn và được tích hợp liền mạch vào quy trình làm việc, giống như cách internet ngày nay.
Tác nhân sẽ bắt đầu thay thế dịch vụ
Phần mềm đã phát triển từ các hệ thống lớn, độc lập chạy trên máy chủ, thành các ứng dụng trên máy tính để bàn, thành các kiến trúc phân tán, dựa trên dịch vụ, ứng dụng web và ứng dụng di động.
Giờ đây, nó sẽ lại phát triển một lần nữa. Tác nhân (agent) là giai đoạn tiếp theo. Tác nhân có thể được kết nối lỏng lẻo hơn các dịch vụ, giúp các kiến trúc này linh hoạt, phục hồi và thông minh hơn. Và điều này sẽ mang lại một bộ công cụ và quy trình phát triển hoàn toàn mới.
Hiện nay, tác nhân AI còn tương đối đắt đỏ và chi phí có thể tăng nhanh đối với doanh nghiệp muốn triển khai các hệ thống lớn. Nhưng điều này sẽ thay đổi, tác nhân sẽ trở nên ít tốn kém hơn, các trường hợp sử dụng sẽ bùng nổ.
Sự trỗi dậy của trợ lý agentic
Ngoài việc các agent thay thế các thành phần phần mềm, năm 2025 cũng sẽ thấy sự trỗi dậy của trợ lý đại lý (agency assistant). Lấy ví dụ về việc theo kịp các quy định. Ngày nay, các nhà tư vấn được đào tạo liên tục để theo kịp các điều luật mới hoặc tiếp cận với đồng nghiệp đã là chuyên gia về luật. Cần có thời gian để phổ biến và để nhân viên tiếp thu hoàn toàn kiến thức mới.
Nhưng một tác nhân AI có thể được cập nhật ngay lập tức để đảm bảo rằng tất cả công việc đều tuân thủ các luật mới.
Và không chỉ là theo kịp các thay đổi về quy định. Giả sử một nhà cung cấp phát hành một sản phẩm phần mềm mới. Khách hàng doanh nghiệp cần đảm bảo rằng sản phẩm đó tuân thủ các yêu cầu của họ. Điều đó có thể xảy ra theo cách tự động, thông qua đại lý của nhà cung cấp trao đổi với đại lý của khách hàng.
Tuy vẫn còn sớm để nói về tác nhân AI, nhưng vai trò của chúng vô cùng hữu ích trong việc cắt giảm khối lượng công việc bận rộn. Công việc của tác nhân là tập hợp các thông tin liên lạc từ tất cả các kênh khác nhau, bao gồm email, trò chuyện, tin nhắn văn bản, phương tiện truyền thông xã hội...
Hệ thống đa tác nhân
Chắc chắn, tác nhân AI rất thú vị. Nhưng mọi thứ sẽ trở nên thực sự thú vị khi các tác nhân bắt đầu nói chuyện với nhau.
Đầu tiên, một tác nhân phải có khả năng nhận ra liệu nó có khả năng thực hiện một nhiệm vụ và nhiệm vụ đó có nằm trong phạm vi của nó hay không. AI ngày nay thường không làm được điều này, nhưng công ty có thể xây dựng rào cản, bổ sung thêm sự giám sát của con người để đảm bảo tác nhân chỉ làm những gì được phép làm và chỉ khi nó có thể làm tốt. Thứ hai, công ty sẽ cần có hệ thống để giám sát việc thực hiện những nhiệm vụ đó, để chúng vẫn nằm trong ranh giới pháp lý và đạo đức. Thứ ba, công ty sẽ cần có khả năng đo lường mức độ tự tin của tác nhân vào hiệu suất, để các hệ thống khác hoặc con người có thể được đưa vào khi sự tự tin thấp.
AI đa phương thức
Con người và doanh nghiệp được xây dựng đều là đa phương thức. Con người đọc và viết văn bản, nói và nghe, nhìn và vẽ. Và con người làm tất cả những điều này theo thời gian, vì vậy phải hiểu rằng một số thứ xuất hiện trước những thứ khác. Các mô hình AI ngày nay phần lớn là rời rạc. Một số có thể tạo hình ảnh, một số khác chỉ có thể xử lý văn bản và một số mô hình gần đây có thể hiểu hoặc tạo video.
Khi muốn tạo giọng nói, cần đến mô hình chuyên biệt thực hiện chuyển văn bản thành giọng nói. Hoặc mô hình chuyên biệt để tạo hình ảnh. Để hiểu đầy đủ về cách thế giới hoạt động, để có trí thông minh thực sự, AI phải hoạt động trên tất cả các phương thức khác nhau. Một số trong số này hiện có sẵn, và công việc thực tế được xử lý đằng sau hậu trường bởi các mô hình chuyên biệt, đơn chế độ khác nhau.
Về mặt kiến trúc, các mô hình này là riêng biệt và nhà cung cấp đang sử dụng kiến trúc hỗn hợp của các chuyên gia. Tuy nhiên, trong năm 2025, kỳ vọng đa phương thức sẽ là xu hướng quan trọng. AI đa phương thức có thể chính xác hơn và có khả năng phục hồi tốt hơn với nhiễu và dữ liệu bị thiếu, đồng thời có thể tăng cường tương tác giữa người và máy tính. Trên thực tế, Gartner dự đoán rằng 40% các giải pháp AI thế hệ sẽ là đa phương thức vào năm 2027, tăng từ 1% vào năm 2023.
Định tuyến đa mô hình
Không nên nhầm lẫn với AI đa phương thức, định tuyến đa phương thức là khi công ty sử dụng nhiều hơn một LLM để cung cấp đầu vào cho các ứng dụng AI của họ. Các mô hình AI khác nhau tốt hơn ở những thứ khác nhau và một số mô hình rẻ hơn những mô hình khác hoặc có độ trễ thấp hơn. Và sau đó là vấn đề đặt tất cả vào một chỗ.
Việc đa dạng hóa khỏi việc chỉ sử dụng một mô hình duy nhất cho tất cả các trường hợp có nghĩa là doanh nghiệp ít phụ thuộc hơn vào bất kỳ nhà cung cấp nào, và linh hoạt hơn khi hoàn cảnh thay đổi. Ngày nay, hầu hết các công ty xây dựng hệ thống AI nội bộ có xu hướng bắt đầu chỉ với một nhà cung cấp, vì việc quản lý nhiều nhà cung cấp khó khăn hơn nhiều. Nhưng khi xây dựng kiến trúc có thể mở rộng vào năm tới, việc có mô hình với nhiều hệ thống đã được thẩm định, tùy chỉnh và tinh chỉnh với nhiều kích cỡ và khả năng khác nhau sẽ rất quan trọng để đạt được hiệu suất tối đa và hiệu quả về giá cao nhất từ AI.
Tùy chỉnh phần mềm doanh nghiệp
Ngày nay, chỉ những công ty quy mô lớn, có nguồn tài chính dồi dào mới có thể phát triển phần mềm tùy chỉnh dành riêng cho họ. Việc xây dựng hệ thống lớn cho các trường hợp sử dụng nhỏ là không khả thi về mặt kinh tế.
Hiện tại, nhiều doanh nghiệp đều sử dụng cùng một phiên bản phần mềm nào đó, nhà cung cấp phần mềm không thể tạo ra phiên bản tùy chỉnh dành riêng. Nhưng khi AI bắt đầu đẩy nhanh tốc độ phát triển phần mềm trong khi giảm chi phí, thì việc này trở nên khả thi hơn nhiều.
Các doanh nghiệp luôn xây dựng phần mềm tùy chỉnh, và giờ đây AI đang giúp mọi người đều có thể tiếp cận phần mềm này, cho khả năng tạo phần mềm tùy chỉnh riêng mà không cần phải thuê bên ngoài.