Trí tuệ nhân tạo đã thiết kế vi mạch và gửi thư rác cho chúng ta, vậy điều gì tiếp theo? Đây là cách Trí tuệ nhân tạo thực sự làm việc và chúng ta sẽ mong chờ điều gì từ nó.
Lời tòa soạn. Bàn về Trí tuệ nhân tạo hay AI, trang IDS đã có bài viết “AI/ML là gì và tại sao nó lại quan trọng với doanh nghiệp?”, đề cập đến xu hướng này ở góc độ cơ bản. Trong bài tiếp theo, chúng ta sẽ cùng tìm hiểu về Trí tuệ nhân tạo dưới một góc độ khác.
Trí tuệ nhân tạo - AI sáng tạo (generative AI) là một thuật ngữ chung cho bất kỳ loại quy trình tự động nào sử dụng thuật toán để tạo, thao tác hoặc tổng hợp dữ liệu, thường ở dạng hình ảnh hoặc văn bản mà con người có thể đọc được. Nó được gọi là sáng tạo vì AI tạo ra thứ gì đó chưa từng tồn tại trước đây. Đó là điều khiến nó không giống với AI phân biệt đối xử (disriminative AI), vốn tạo ra sự khác biệt giữa các loại đầu vào khác nhau. Nói cách khác, AI phân biệt đối xử sẽ trả lời một câu hỏi như “Đây là hình của con thỏ hay con sư tử?” trong khi AI sáng tạo đáp lại những yêu cầu như “Hãy vẽ con sư tử và con thỏ ngồi cạnh nhau”.
Bài viết này giới thiệu về AI sáng tạo và cách sử dụng nó với các mô hình phổ biến như ChatGPT và DALL-E (mô hình AI do OpenAI phát triển, có thể tạo ra hình vẽ từ lời nhắc văn bản). Chúng ta cùng xem xét những hạn chế của công nghệ, bao gồm cả lý do tại sao “too many fingers” (quá nhiều ngón tay) đã trở thành một món quà chết chóc đối với tác phẩm nghệ thuật được tạo ra một cách nhân tạo.
Sự xuất hiện của AI thế hệ mới
AI sáng tạo đã xuất hiện trong nhiều năm, được cho là kể từ khi ELIZA, một chatbot (chương trình máy tính tự động giao tiếp với người dùng) mô phỏng việc nói chuyện với một nhà trị liệu, được phát triển tại Đại học công nghệ MIT vào năm 1966. Nhưng nhiều năm nghiên cứu về AI và học máy (ML) gần đây đã có kết quả với việc phát hành các hệ thống AI sáng tạo mới. Bạn đã nghe nói về ChatGPT, một chatbot AI dựa trên văn bản tạo ra văn xuôi giống con người một cách đáng kinh ngạc. DALL-E cũng đã thu hút sự chú ý nhờ khả năng tạo hình ảnh sống động và chân thực dựa trên lời nhắc văn bản. Chúng ta thường coi những hệ thống này và những hệ thống tương tự khác như một mô hình vì chúng có thể mô phỏng hoặc mô hình hóa một số khía cạnh của thế giới thực dựa trên một tập hợp con (đôi khi là một tập hợp rất lớn) thông tin về nó.
Kết quả đầu ra từ những hệ thống này kỳ lạ đến mức khiến nhiều người đặt ra câu hỏi về bản chất của ý thức, và lo lắng về tác động của trí tuệ nhân tạo đến con người. Nhưng trong khi tất cả những sáng tạo trí tuệ nhân tạo này đều là những thực tế không thể phủ nhận, thì có thể cho rằng có điều gì đó xảy ra bên trong không như nhiều người giả định. Trước tiên, hãy xem điều gì đang diễn ra dưới vỏ bọc của các mô hình như ChatGPT và DALL-E.
AI sáng tạo hoạt động như thế nào?
AI sáng tạo sử dụng máy học (ML - machine learnning) để xử lý một lượng lớn dữ liệu hình ảnh hoặc văn bản, phần lớn trong số đó được lấy từ Internet, sau đó xác định những thứ có khả năng xuất hiện gần những thứ khác nhất. Phần lớn công việc lập trình của AI sáng tạo là tạo ra các thuật toán có thể phân biệt “những thứ” mà người tạo ra AI quan tâm, các từ và câu trong trường hợp chatbot như ChatGPT hoặc các yếu tố hình ảnh cho DALL-E. Nhưng về cơ bản, AI sáng tạo tạo ra đầu ra của nó bằng cách đánh giá một kho dữ liệu khổng lồ mà nó đã được đào tạo, sau đó phản hồi yêu cầu bằng thứ gì đó nằm trong phạm vi xác suất được xác định bởi kho dữ liệu đó.
Tính năng tự động điền yêu cầu khi bạn sử dụng điện thoại di động hoặc Gmail gợi ý phần còn lại của từ hoặc câu từ bạn đang nhập có thể là gì? Đó là một dạng AI sáng tạo cấp thấp. Các mô hình như ChatGPT và DALL-E chỉ đưa ý tưởng này lên một tầm cao mới.
Đào tạo mô hình AI sáng tạo
Quá trình “nạp” dữ liệu cho các mô hình được gọi là đào tạo. Một vài kỹ thuật cơ bản đang được sử dụng ở đây cho các mô hình khác nhau. ChatGPT sử dụng cái được gọi là máy chuyển đổi (transformer - T). Máy chuyển đổi lấy ý nghĩa từ các chuỗi văn bản dài để hiểu những từ hoặc thành phần ngữ nghĩa khác nhau có thể liên quan với nhau như thế nào, sau đó xác định khả năng chúng xuất hiện gần nhau. Máy chuyển đổi này chạy không có giám sát trên một kho văn bản ngôn ngữ tự nhiên rộng lớn trong một quy trình được gọi là đào tạo trước (pretraining - P), trước khi được con người tương tác với mô hình tinh chỉnh.
Một kỹ thuật khác được sử dụng để đào tạo các mô hình là cái được gọi là generative adversarial network (mạng kình địch sáng tạo), hay GAN. Trong kỹ thuật này có hai thuật toán cạnh tranh với nhau. Một là tạo văn bản hoặc hình ảnh dựa trên xác suất thu được từ một tập dữ liệu lớn; cái còn lại là AI phân biệt đối xử, được huấn luyện để đánh giá xem đầu ra đó là thật hay do AI tạo ra. AI sáng tạo liên tục “lừa” AI phân biệt đối xử, tự động điều chỉnh để cho ra kết quả thành công. Sau khi AI sáng tạo “thắng” cuộc cạnh tranh này, AI phân biệt đối xử sẽ được con người tinh chỉnh và quá trình bắt đầu lại.
Một trong những điều quan trọng nhất cần ghi nhớ ở đây là, mặc dù có sự can thiệp của con người vào quá trình đào tạo, nhưng hầu hết việc học và thích ứng diễn ra tự động. Rất nhiều lần lặp lại được yêu cầu cho mô hình đến khi kết quả chúng tạo ra thật sự thú vị. Đây là quá trình chuyên sâu về mặt tính toán.
Trí tuệ nhân tạo có tri giác?
Toán học và mã hóa dùng để tạo và đào tạo các mô hình AI sáng tạo khá phức tạp và nằm ngoài phạm vi của bài viết này. Nhưng nếu bạn tương tác với các mô hình là kết quả cuối cùng của quá trình này, trải nghiệm có thể rất kỳ lạ. Bạn có thể yêu cầu DALL-E tạo những thứ giống như tác phẩm nghệ thuật thực sự, bạn cũng có thể trò chuyện với ChatGPT giống như trò chuyện với một người khác.
Vậy các nhà nghiên cứu đã thực sự tạo ra một cỗ máy biết suy nghĩ chưa?
Theo một chuyên gia xử lý ngôn ngữ tự nhiên của IBM, người đã làm việc với các sản phẩm Watson (sản phẩm AI của IBM) thì là “không”, mà cho rằng ChatGPT là một “cỗ máy dự đoán rất tốt”.
ChatGPT rất giỏi trong việc dự đoán những gì con người sẽ thấy mạch lạc, nhưng không phải lúc nào cũng mạch lạc. Không phải vì ChatGPT “hiểu”. Điều ngược lại: những người sử dụng đầu ra thực sự giỏi trong việc đưa ra bất kỳ giả định ngầm nào mà chúng ta cần để làm cho đầu ra có ý nghĩa.
Tại sao nghệ thuật AI có quá nhiều ngón tay?
Một điều lạ đáng chú ý của nghệ thuật AI là nó thường thể hiện những người có bàn tay kỳ lạ. “Những bàn tay kỳ lạ” đang trở thành một dấu hiệu phổ biến cho thấy tác phẩm nghệ thuật được tạo ra một cách giả tạo. Sự kỳ lạ này mang đến cái nhìn sâu sắc hơn về cách thức AI sáng tạo hoạt động. Bắt đầu với kho dữ liệu mà DALL-E và các công cụ AI tạo hình ảnh tương tự đang lấy, hình ảnh của mọi người thường tháy rõ khuôn mặt của họ nhưng bàn tay của họ thường bị che khuất một phần hoặc hiển thị ở các góc kỳ lạ, vì vậy bạn không thể nhìn thấy tất cả ngón tay cùng một lúc. Thêm vào đó thực tế là bàn tay có cấu trúc phức tạp, chúng nổi tiếng là khó vẽ đối với mọi người, ngay cả những nghệ sĩ được đào tạo. Và một điều mà DALL-E không làm là lắp ráp một mô hình bàn tay 3D phức tạp dựa trên các mô tả 2D khác nhau trong bài tập huấn luyện của nó. Đó không phải là cách nó hoạt động. DALL-E thậm chí không nhất thiết phải biết rằng “bàn tay” là một phạm trù mạch lạc của sự vật cần được lý giải. Tất cả những gì nó có thể làm là cố gắng dự đoán, dựa trên những hình ảnh mà nó có, một hình ảnh tương tự sẽ trông như thế nào. Mặc dù có một lượng lớn dữ liệu đào tạo, nhưng những dự đoán đó thường không đạt yêu cầu.
Ngoài ra còn có một yếu tố là mô hình AI này không coi những bức vẽ mà nó đang tạo ra là một tổng thể mạch lạc; thay vào đó, nó tập hợp một loạt các thành phần có khả năng ở gần nhau, như dữ liệu huấn luyện đã chỉ ra. DALL-E có thể không biết rằng một bàn tay được cho là có năm ngón, nhưng nó biết rằng một ngón tay có khả năng liền kề với một ngón tay khác. Vì vậy, đôi khi, nó chỉ tiếp tục thêm ngón tay (bạn có thể nhận được kết quả tương tự với răng). Trên thực tế, ngay cả mô tả này về quy trình của DALL-E cũng có thể nhân cách hóa nó quá nhiều.
Tác động tiêu cực tiềm ẩn của AI sáng tạo
Những ví dụ này cho bạn thấy một trong những hạn chế chính của AI sáng tạo: cái mà những người trong ngành gọi là ảo giác, đây là một thuật ngữ có lẽ gây hiểu nhầm cho đầu ra mà theo tiêu chuẩn của những người sử dụng nó là sai hoặc không chính xác. Tất nhiên, tất cả các hệ thống máy tính đôi khi tạo ra lỗi, nhưng những lỗi này đặc biệt nghiêm trọng vì người dùng cuối khó có thể phát hiện ra chúng. Nếu bạn đưa cho chatbot AI sáng tạo một câu hỏi, thường bạn sẽ không biết câu trả lời cho chính mình. Do đó, nhiều khả năng bạn chấp nhận câu trả lời của AI bằng văn bản, đầy đủ thành ngữ mà ChatGPT và các mô hình tương tự khác tạo ra, ngay cả khi thông tin không chính xác.
Ngay cả khi một AI sáng tạo có thể tạo ra đầu ra không có ảo giác (hallucination-free), vẫn có nhiều tác động tiêu cực tiềm ẩn khác nhau:
Tạo nội dung rẻ và dễ dàng: Hy vọng rằng bây giờ mọi người đã rõ ChatGPT và các AI sáng tạo khác không phải là những bộ óc thực sự có khả năng tạo ra sản phẩm sáng tạo hoặc thông tin chi tiết. Nhưng sự thật là không phải mọi thứ được viết hoặc vẽ đều cần phải đặc biệt sáng tạo. Có rất nhiều tài liệu ở mức trung cấp hoặc đại học chỉ nhằm mục đích tổng hợp dữ liệu có sẵn công khai, và chúng trở thành mục tiêu hoàn hảo cho AI tổng hợp. Và thực tế là văn bản hoặc nghệ thuật tổng hợp giờ đây có thể được sản xuất tự động, ở quy mô siêu phàm, có thể mang lại những kết quả kỳ lạ hoặc không lường trước được. Chẳng hạn, các nghệ sĩ spam đã sử dụng ChatGPT để viết email lừa đảo.
Sở hữu trí tuệ: Ai sở hữu những nội dung như hình ảnh hoặc văn bản do AI tạo ra? Nếu một tác phẩm có bản quyền là một phần của chương trình tập huấn của AI, thì AI có phải đã “đạo văn” khi nó tạo dữ liệu tổng hợp, ngay cả khi nó không sao chép từng chữ không? Đây là những câu hỏi pháp lý gai góc, chưa được kiểm chứng.
Xu hướng: Nội dung do AI sáng tạo tạo ra hoàn toàn được xác định bởi dữ liệu cơ bản mà nó được đào tạo. Bởi vì dữ liệu đó do con người tạo ra với tất cả sai sót và thành kiến, nên kết quả được tạo ra cũng có thể sai sót và sai lệch, đặc biệt nếu chúng hoạt động mà không có hành lang pháp lý bảo vệ của con người. OpenAI, chủ của ChatGPT, đã đưa các biện pháp bảo vệ vào mô hình trước khi tung ra cho công chúng sử dụng để ngăn nó làm những việc như sử dụng lời lẽ phân biệt chủng tộc. Tuy nhiên, những người khác đã tuyên bố rằng những loại biện pháp an toàn này đại diện cho kiểu thiên vị của chính họ.
Mức tiêu thụ năng lượng: Ngoài những câu hỏi triết lý, AI tổng quát còn đặt ra một số vấn đề rất thực tế. Trước hết, việc đào tạo một mô hình AI sáng tạo đòi hỏi cường độ tính toán cực cao. Điều này có thể dẫn đến mức tiêu thụ điện của hệ thống điện toán đám mây lớn tăng mạnh và cuối cùng đặt ra câu hỏi liệu mức tiêu tốn này, cuối cùng là lượng khí thải nhà kính - có xứng đáng với kết quả cuối cùng hay không.
Những trường hợp sử dụng AI sáng tạo
Bất chấp những vấn đề tiềm ẩn trên, hứa hẹn về AI sáng tạo là khó có thể bỏ lỡ. ChatGPT có khả năng trích xuất thông tin hữu ích từ các tập dữ liệu khổng lồ để đáp ứng những truy vấn ngôn ngữ tự nhiên khiến những gã khổng lồ tìm kiếm như Google cũng phải ganh tỵ. Microsoft đang thử nghiệm chatbot AI của riêng mình, được đặt tên là “Sydney”, mặc dù nó vẫn đang trong giai đoạn thử nghiệm.
Theo các chuyên gia AI cho rằng các kiểu tìm kiếm chuyên biệt hơn là hoàn toàn phù hợp với công nghệ này. Có nhiều tổ chức thiếu chuyên gia tư vấn ở cấp độ đầu vào, những gì họ cần là nhanh chóng trả lời các câu hỏi đơn giản của khách hàng. Chính vì vậy, việc xây dựng những chatbot AI để hỗ trợ khách hàng là điều cần thiết. Trong trường hợp này, việc sử dụng các AI sáng tạo như ChatGPT có thể mang lại ưu thế vượt trội hơn nhiều so với nhiều khác. Điều thú vị về trường hợp sử dụng đó là vẫn cần một chuyên gia kiểm tra lại câu trả lời. Do đó sẽ giảm thiểu các vấn đề đạo đức.
Có một thị trường khổng lồ cho những loại công cụ tìm kiếm thông minh dành cho các chuyên gia.
Các trường hợp sử dụng tiềm năng khác:
AI sáng tạo chắc chắn sẽ thay đổi hoặc phá vỡ một số ngành công nghiệp, và loại bỏ nhiều công việc. Tuy nhiên, những bài báo như thế này sẽ tiếp tục được viết bởi con người, ít nhất là cho đến bây giờ. CNET gần đây đã cố gắng đưa AI sáng tạo vào công việc viết bài nhưng nỗ lực này đã tạo ra một làn sóng ảo giác.