AI: Tương lai thực sự của trí tuệ nhân tạo

Tôi yêu Grammarly, một phần mềm chỉnh sửa văn bản từ công ty Grammarly, Inc. Là một phần mềm soạn văn bản, nó đã chứng minh giá trị vô giá đối với tôi hết lần này đến lần khác, thông báo một cách nhẹ nhàng rằng tôi đã quên một dấu phẩy, hơi quá dài dòng trong câu hoặc có sử dụng quá nhiều trạng từ. Tôi thậm chí phải cập nhật lên phiên bản chuyên nghiệp.
18:16 PM 04/10/2019 In bài viết này

Young female engineer concept. GUI (Graphical User Interface).

Bên cạnh việc kiểm chứng, tôi đưa phần mềm Grammarly để thảo luận vì một lý do khác. Đó là giao diện của trí tuệ nhân tạo được tăng cường, nó sử dụng một số thuật toán rất tinh vi (và có khả năng đệ quy) để xác định khi nào ngữ pháp được sử dụng không đúng cách hoặc thậm chí để đưa ra các khuyến nghị cho những gì có thể làm tốt hơn để diễn đạt mọi thứ. Nó mang tính bổ sung bởi vì nó đưa người dùng theo một hướng cụ thể để cung cấp cho họ một mức độ chuyên môn về biên tập nhất định để họ có thể xuất bản với sự tự tin hơn hoặc giảm khối lượng công việc sao chép của biên tập viên.

Điều này nghe có vẻ như nó đã loại bỏ sự cần thiết của một biên tập viên, nhưng không hẳn là như vậy. Sự thật là, nhiều biên tập viên sao chép cũng sử dụng Grammarly, và cũng muốn các nhà văn làm như vậy vì họ thích cải thiện văn xuôi hơn là làm công việc tẻ nhạt và điên rồ trong việc sửa lỗi ngữ pháp và chính tả.

Là một nhà báo, tôi sử dụng Webex của Cisco rất nhiều. Các sản phẩm gần đây nhất của họ đã giới thiệu một thứ mà tôi gọi là vô giá - đó là khả năng phiên âm âm thanh trong thời gian thực. Một lần nữa, khả năng xử lý ngôn ngữ tự nhiên (NLP) này, từ lâu là chén thánh của AI, đã có sẵn. Nó đã biến những gì từng là một hoạt động dài ngày tẻ nhạt thành một phiên chỉnh sửa tương đối ngắn (không có NLP nào chính xác 100%), có nghĩa là tôi có thể dành nhiều thời gian hơn để thu thập tin tức hơn là phải sao chép nó.

Những ví dụ này có vẻ khác xa với tầm nhìn phổ biến của AI là kẻ đánh cắp công việc - từ xe hơi và xe tải tự lái đến các hệ thống sẽ loại bỏ những người sáng tạo và người ra quyết định - nhưng chúng thực sự là dấu hiệu cho thấy trí tuệ nhân tạo sẽ đi về đâu. Trước đây tôi đã viết về tính năng Adobe Photoshop, sử dụng AI khá tinh vi để chọn tiêu điểm của ảnh. Đây là một việc có thể được thực hiện bằng tay, nhưng nó chậm, tẻ nhạt và dễ bị lỗi. Với nó, Photoshop sẽ chọn những gì tôi muốn và phần còn lại sau đó có thể được thêm vào tương đối dễ dàng.

Minh chứng rõ ràng từ những ví dụ này là loại AI tăng cường có thể được sử dụng để thực hiện những phần của một nhiệm vụ hoặc hoạt động có chi phí cao với rất ít giá trị gia tăng. Grammarly không thay đổi giọng nói của tôi nhiều. Tự động sao chép có thể khiến tôi mất vài giờ để thực hiện thủ công và AI tăng cường sẽ giảm thời gian xuống còn vài giây để tôi có thể tập trung vào phần nội dung. Tính năng “Lựa chọn Đối tượng” của Photoshop sẽ loại bỏ sự cần thiết phải lựa chọn một hình ảnh. Có thể lập luận trong cả ba trường hợp, rằng điều này không loại bỏ sự cần thiết của con người để thực hiện các nhiệm vụ này, nhưng thực tế mà nói, đây là những nhiệm vụ mà không ai muốn làm trừ khi họ thực sự không còn lựa chọn nào khác.

Có những trường hợp không thể hiện trí tuệ nhân tạo từ bên ngoài. Khi Microsoft Powerpoint gợi ý các hình ảnh thay thế cho slide cũ nhàm chán, nó sẽ đưa ra các hiệu ứng thay đổi. Nó sẽ hỏi rằng: “Trông cái này  giống như một kim tự tháp, hoặc dòng thời gian, hoặc một loạt các bộ chứa (bucket). Tại sao bạn không sử dụng loại bài thuyết trình này”?

Theo thời gian, bạn sẽ nhận thấy rằng một số bài thuyết trình nổi lên đầu thường xuyên hơn các bài thuyết trình khác, bởi vì bạn có xu hướng chọn chúng thường xuyên hơn, mặc dù đôi khi, AI trộn lẫn mọi thứ với nhau bởi vì nó “nhận ra” rằng thông qua phân tích lịch sử của bạn với ứng dụng bạn sử dụng quá nhiều, bạn có thể thích thử những thứ khác cho đa dạng. Grammarly (và các dịch vụ liên quan như Textio) tuân theo các quy tắc ngữ pháp, nhưng sử dụng các sản phẩm này trong một thời gian và bạn sẽ thấy rằng các hệ thống bắt đầu đưa ra các khuyến nghị lớn hơn và phức tạp hơn phù hợp với phong cách viết của riêng bạn.

Bạn thấy hành vi này ngày càng tăng trong các nền tảng truyền thông xã hội, đặc biệt là trong tin nhắn kinh doanh dạng dài hơn như Linked-In, nơi công cụ đề xuất thường sẽ cung cấp nội dung hoàn thành và đề xuất có thể dài câu hơn. Vâng, bạn đang tiết kiệm thời gian, nhưng AI cũng đang đào tạo bạn ngay cả khi bạn huấn luyện nó, đưa ra các khuyến nghị nghe có vẻ chuyên nghiệp hơn và, bằng cách mở rộng, nó sẽ dạy bạn thích hình thức tu từ đó để nhận thức rõ hơn về các cấu trúc ngữ pháp nhất định mà không nhất thiết phải biết chính xác cụ thể nó là gì.

Chính sự tương tác tinh tế giữa con người và máy móc khiến cho việc tăng cường AI trở nên rất đáng quan tâm. Cho đến gần đây, khả năng này đã không tồn tại theo cách tương tự. Khi phát triển ứng dụng, con người đã tạo ra các khả năng, mô-đun có thêm chức năng, nhưng chức năng đó thường bị giới hạn. Tự động lưu tài liệu xử lý văn bản, chẳng hạn, không phải là trí tuệ nhân tạo mà nó sử dụng một thuật toán đơn giản để xác định khi nào các thay đổi được thực hiện, sau đó cung cấp một cuộc gọi lưu sau khi hoạt động (chẳng hạn như gõ) dừng trong một khoảng thời gian cụ thể.

Word Cloud NLP

Word Cloud với các tag liên quan tới NLP

Tuy nhiên, làm việc với một trình xử lý văn bản thông minh đủ lâu thì bạn sẽ nhận ra rằng một số thứ sẽ bắt đầu được cấu hình để phù hợp hơn với phong cách viết của bạn. Lời khuyên và ngữ pháp sẽ bắt đầu phản ánh cách sử dụng của bạn. Các quy tắc ngữ pháp mềm sẽ bị loại bỏ nếu bạn tiếp tục bỏ qua chúng, ứng dụng đưa ra giả định hợp lý rằng bạn đang cố tình bỏ qua chúng khi được chỉ ra.

Trớ trêu thay, điều này cũng có nghĩa là nếu người khác sử dụng ứng dụng xử lý văn bản được đào tạo riêng của bạn, họ có thể sẽ nản lòng vì các đề xuất được đưa ra không phù hợp với phong cách viết của họ, không phải vì chúng được lập trình theo một tiêu chuẩn nhất định mà bởi vì phần mềm viết văn bản đã được đào tạo để tạo điều kiện cho phong cách của bạn.

White conceptual keyboard - NLP (blue key)

Đào tạo là quá trình cung cấp dữ liệu đầu vào vào máy học để thiết lập các tham số để phân loại.

Về hiệu ứng, việc sử dụng AI tăng cường đã cá nhân hóa trí tuệ nhân tạo trở thành một người bạn tâm tình chứ không chỉ là một công cụ. Đây không phải là phép màu hay là tài sản của khoa học máy tính huyền bí. Con người là những sinh vật xã hội, và khi chúng ta cô đơn, chúng ta có xu hướng nhân hóa ngay cả những vật vô tri vô giác xung quanh để có ai đó trò chuyện. Tom Hanks, trong một trong những vai diễn hay nhất của anh ấy cho đến nay (Cast Away), đã thể hiện rõ điều này khi anh ấy nhân hóa một quả bóng chuyền như Wilson, một ví dụ về cái mà TVtropes.com gọi là “Hình khối - Người bạn đồng hành”, đặt tên cho một đối tượng được nhân cách hóa tương tự từ cổng thông tin nhượng quyền trò chơi. Trí tuệ nhân tạo mở rộng là ví dụ về các hình khối đồng hành như vậy, những khối này ngày càng có khả năng trò chuyện và ghi nhớ lịch sử (ví dụ như Hey, Siri, bạn có nhớ quả bóng bãi biển trong bộ phim mà chúng ta đã xem về một diễn viên đã nói chuyện với nó không?”, “Tôi nghĩ tên của quả bóng là Wilson. Tại sao bạn hỏi thế?”)

Lịch sử đã có một mô tả khá hay về cách thức hoạt động của hầu hết các AI tăng cường. Thông thường, hầu hết các AI được đào tạo để nhận dạng hành vi dị thường từ một mô hình cụ thể, cân nhắc loại và trọng lượng của sự bất thường đó và điều chỉnh mô hình sao cho phù hợp. Trong phân tích từ vựng, điều này bao gồm sự hiện diện của các từ hoặc cụm từ mới và sự vắng mặt của các từ hoặc cụm từ hiện có trước đó (lần lượt được giữ ở một số dạng mục). AI sẽ thiết lập lại hệ thống với sự thay đổi đáng kể khi người dùng tương tác với nó, nhưng theo thời gian, hệ thống sẽ được hiển thị chặt chẽ hơn với trạng thái tối ưu cho người dùng.

Trong một số trường hợp, bản thân hệ thống cũng có phần tự nhận thức và sẽ cố tình biến đổi các trọng số dựa trên các tham số nhất định để trộn mọi thứ lên một chút. Chẳng hạn, các bộ lọc tin tức thường sẽ bị hút về một trạng thái mà chủ đề nào đó đang chiếm ưu thế (ví dụ như tin tức về trí tuệ nhân tạo của Cameron hoặc thể thao dựa trên các lựa chọn của người dùng), nhưng thông thường, một bộ lọc sẽ lựa chọn ba hoặc bốn bước dọc theo biểu đồ chủ đề lựa chọn để giữ cho bộ lọc không quá hẹp.

Tất nhiên, điều này cũng sẽ làm nảy sinh một trong những mối nguy hiểm lớn nhất của việc tăng cường AI. Những bộ lọc như vậy sẽ tạo ra sự thiên lệch nội tại, tự chọn trong thông tin được thông qua. Nếu sự thiên vị cá nhân của bạn có xu hướng ủng hộ một ý thức hệ chính trị nhất định, bạn sẽ nhận được nhiều câu chuyện (hoặc khuyến nghị) ủng hộ sự thiên vị đó, và nhận được ít ý kiến phản đối nó hơn. Điều này có thể tạo ra một bong bóng trong đó những gì bạn nhìn thấy sẽ củng cố những gì bạn tin tưởng, trong khi các ví dụ ngược lại không bao giờ vượt qua được các bộ lọc. Bởi vì ảnh hưởng này là vô hình, thậm chí có thể không rõ ràng nhưng đó là một lý do tại sao bất kỳ AI nào nên tự đẩy mình ra khỏi các cài đặt trước được tính toán.

Vấn đề khác mà các AI tăng cường là trong thiết kế ban đầu của mô hình. Một trong những điểm tương đồng tốt nhất với cách mà hầu hết các máy học cụ thể hoạt động là tưởng tượng một bộ trộn âm thanh với vài chục (hoặc vài nghìn) mặt số tự động điều chỉnh để xác định trọng lượng của các đầu vào khác nhau. Trong một thế giới lý tưởng, mỗi mặt số được nối với một biến độc lập với các biến khác (thay đổi một biến không có hiệu lực của bất kỳ biến nào khác). Trong thực tế, nó không khác thường đối với một số biến có tương quan (hoặc thậm chí nặng nề), điều đó có nghĩa là nếu một biến thay đổi, nó sẽ khiến các biến khác thay đổi tự động, mặc dù không nhất thiết phải theo những cách đã biết.

Ví dụ, thoạt nhìn, tuổi tác và mối quan hệ chính trị có thể không tương quan rõ ràng, nhưng khi nó xuất hiện, có những mối tương quan tinh tế (và không hoàn toàn tuyến tính) có xu hướng hiển thị khi lấy một mẫu dân số đủ lớn. Trong một mô hình tuyến tính thuần túy (miền chủ yếu của đại số tuyến tính trung học), các biến thường hoàn toàn độc lập, nhưng trong thực tế, sự kết hợp giữa các biến có thể trở nên hỗn loạn và phi tuyến tính một cách khó lường, và là một trong những thách thức lớn mà các nhà khoa học dữ liệu phải đối mặt là phải xác định xem mô hình đang đề cập có tuyến tính trong miền đang được xem xét hay không.

Mỗi AI có một số mô hình xác định các biến (cột) được điều chỉnh khi việc học được diễn ra. Nếu có quá ít biến số, mô hình có thể không phù hợp. Nếu có quá nhiều, các đường cong được phân định có thể quá hạn chế và nếu các biến cụ thể được tương quan theo một cách nào đó, thì các biến thể nhỏ đầu vào có thể phát nổ và tạo ra tín hiệu nhiễu. Điều này có nghĩa là sẽ có một vài mô hình hoàn hảo Trí đôi khi điều tốt nhất bạn có thể làm là giữ cho những điểm tích cực và tiêu cực sai dưới một ngưỡng nhất định.

Học sâu của trí tuệ nhân tạo cũng tương tự, nhưng về cơ bản chúng có khả năng xác định các biến (hoặc trục) trực giao nhất với nhau. Tuy nhiên, điều này đòi hỏi nhiều chi phí - có thể không rõ ràng về cách để diễn giải các biến đó. Vấn đề có thể giải thích này là một trong những vấn đề khó chịu nhất đối với lĩnh vực AI, bởi vì nếu bạn không biết một biến thực sự có nghĩa là gì, bạn sẽ không thể chứng minh rằng mô hình là thực sự hoạt động.

In Near Future Laboratory Scientist Wearing Virtual Reality Headset Sitting in a Chair Using Futuristic Holografic Interface. Modern Brain Study/ Neurological Research Center.

Đôi khi các mô hình xuất hiện trong AI tăng cường không phải là mô hình mà chúng ta mong đợi.

Một cuộc trò chuyện tại cuộc họp về trí tuệ nhân tạo ở Seattle đã minh họa vấn đề này bằng đồ họa. Trong một phân tích sâu đặc biệt về các bệnh nhân khác nhau tại một bệnh viện nhất định, một mô hình học tập sâu xuất hiện từ phân tích dường như đã đưa ra dự đoán từ một hồ sơ y tế của một người rằng bệnh nhân đó bị ung thư. Các nhà phân tích kiểm tra dữ liệu (quét OCR) hạnh phúc đến ngây ngất, nghĩ rằng họ đã tìm thấy một mô hình hoàn hảo để phát hiện ung thư, khi một trong những y tá làm việc trong nghiên cứu này chỉ ra rằng mọi hồ sơ giấy của bệnh nhân ung thư đều có một bản ghi © trên một góc của mẫu đơn để cho các y tá nhanh chóng xem ai bị ung thư và ai không. AI đã chọn ra điều này trong phân tích, và không ngạc nhiên khi nó khẳng định chính xác rằng nếu © nằm ở góc đó, bệnh nhân chắc chắn bị ung thư. Khi yếu tố này được loại bỏ, tỷ lệ chính xác của mô hình giảm đáng kể. (Cảm ơn Reza Rassool, CTO của RealNetworks, cho câu chuyện đặc biệt này).

Sự mở rộng có thể sẽ xuất hiện trong thời gian tới khi mà hầu hết mọi người sẽ tương tác trực tiếp với các hệ thống trí tuệ nhân tạo. Các hiệu ứng sẽ rất tinh tế và chất lượng được cải thiện đều đặn ở các sản phẩm kỹ thuật số mà mọi người sản xuất, giảm số lỗi xuất hiện và giảm thời gian để tạo ra các tác phẩm trí tuệ - nghệ thuật, viết, mã hóa, v.v… Đồng thời, họ đưa ra những câu hỏi hấp dẫn về vấn đề đạo đức và trách nhiệm, chẳng hạn như nếu một AI được sử dụng để tạo ra nội dung mới, công nghệ tăng cường đó có thực sự chịu trách nhiệm cho những gì  tạo ra?

Nó cũng đặt ra những câu hỏi nghiêm túc trong thế giới kỹ thuật số. Daz Studio, một sản phẩm phần mềm dựng hình 3D gần đây đã đưa ra một bản nâng cấp phân tích chân dung và tạo ra các mô hình và vật liệu 3D bằng phần mềm nhận dạng khuôn mặt. Mặc dù kết quả vẫn còn (chủ yếu) trong “lãnh thổ thung lũng kỳ lạ”, một công cụ như vậy giúp tạo ra những bức ảnh và hoạt hình trông thật đến kinh ngạc và trong nhiều trường hợp con người không thể phân biệt được. Nếu bạn nghĩ về các diễn viên, người mẫu, doanh nhân, nhân vật chính trị và những người khác, bạn có thể thấy những loại công nghệ này có thể được sử dụng cho mục đích chính trị.

Điều này có nghĩa là AI tăng cường cũng có thể là mặt trận tiếp theo trong chiến trường đạo đức, khi luật pháp, quy ước xã hội và đạo đức bắt đầu bắt kịp với công nghệ.

Rõ ràng là trí thông minh nhân tạo đang viết lại các quy tắc, tốt và xấu, và AI tăng cường hiện nay và đang ngày càng trở nên khó phân biệt từ phần mềm hướng đến con người, đó là một nền tảng chứng minh cho cách thức con người và máy móc phân chia nhiệm vụ để khẳng định chính mình. Hãy chờ xem nhé!

Anh Học