Trí tuệ nhân tạo sẽ phát triển như thế nào trong thời đại mới?

Anh Học| 04/10/2019 18:35
Theo dõi ICTVietnam trên

Giám đốc thông tin của các công ty có một tình huống kỳ lạ trong thời đại AI: Họ phải giải quyết các vấn đề cho công ty bằng cách sắp xếp các dữ liệu liên quan về khách hàng và giao dịch, nhưng chính dữ liệu sẽ đặt ra những câu hỏi mới, không lường trước.

Threshold of questions.

Càng ngày, dữ liệu phù hợp với các nỗ lực học máy của các công ty sẽ không chỉ là một số dữ liệu, mà là tất cả các dữ liệu; nhưng thứ đang thiếu là cái nhìn sâu sắc về vấn đề này.

Cho đến gần đây, thời đại của dữ liệu lớn chỉ nói về việc cung cấp thông tin cần thiết để trả lời một số câu hỏi đơn giản, trong đó những gì mà người ta biết đến là những vấn đề.

Ví dụ: nếu bạn là một nhà bán lẻ, bạn có thể muốn biết có bao nhiêu khách hàng của bạn sẽ có khả năng trả lại các mặt hàng mà họ đã mua dựa trên các mẫu mua hàng. Trên thực tế, một nhóm các nhà bán lẻ quần áo trực tuyến Ấn Độ Myntra vào mùa hè này đã trình diễn một mô hình học máy cho một ứng dụng như vậy. Các nhà khoa học tại công ty đã thể hiện với sự tự tin cao độ rằng họ có thể dự đoán khách hàng nào sẽ trả lại hàng ngay cả khi trước khi họ rời khỏi cửa hàng.

Loại nghiên cứu đó vẫn được đóng khung trong cấu trúc thống kê thông thường. Đưa ra một biến độc lập, chẳng hạn như các mô hình mua hàng trong quá khứ và một biến quan tâm phụ thuộc, chẳng hạn như tỷ lệ hoàn vốn, tìm mối quan hệ giữa hai mô hình. Nhưng điều đó cho rằng câu hỏi về lợi nhuận là câu hỏi phù hợp nhất.

Việc chồng chất dữ liệu bao hàm một loại câu hỏi khác, một câu hỏi trong đó không thể biết được các biến độc lập hay biến phụ thuộc. Dữ liệu lớn đang mở ra một thời kỳ của những ẩn số chưa biết.

Nếu bạn là nhà bán lẻ, việc tính toán lợi nhuận sản phẩm chưa biết để giảm tỷ lệ lợi nhuận có thể là một đóng góp rất có ý nghĩa ngay lập tức cho hiệu quả tài chính. Nó có thể gợi ý các bước thực tế bạn có thể thực hiện để giảm việc khách trả lại , giúp tiết kiệm tiền.

Nhưng những điều chưa biết đã bẫy bạn trong câu hỏi mà bạn đã đặt ra, trong khi đó có thể có những câu hỏi hay hơn và những mô hình tốt hơn để xây dựng. Điều gì xảy ra nếu sự hiện diện của lợi nhuận là một hành vi mà người mua hàng của bạn thể hiện trong một xu hướng tiêu dùng được tối ưu hơn? Họ đã trả lại một nửa số tiền mua của họ vì tổng số các loại là có chất lượng kém. Điều tốt nhất để dự đoán các mẫu riêng lẻ, hoặc để khẳng định tổng cầu tốt hơn là gì? Nói cách khác, cố gắng ngăn chặn việc trả lại hàng, có thể là một chiến lược ít hữu ích hơn là cố gắng thúc đẩy nhu cầu tổng thể.

Thời đại của những ẩn số chưa biết đã được các học giả về AI dự đoán. Trong số những ví dụ điển hình nhất của những người có tư duy sâu sắc như vậy là Vladimir Vapnik, một người di cư Nga nổi tiếng với việc phát triển trong suốt 40 năm ra thứ gọi là lý thuyết học thống kê. Công việc của Vapnik trong những năm 1990 là một trong những hình thức học máy phổ biến nhất trước công nghệ học sâu ngày nay, được gọi là máy vectơ hỗ trợ. Hiện tại thì Vapnik là thành viên của nhóm nghiên cứu AI của Facebook.

Ngay cả với các vấn đề khá đơn giản như hồi quy tuyến tính, Vapnik đã thể hiện trong nhiều tác phẩm bằng văn bản trong nhiều năm qua rằng có thể không có thông tin đầy đủ về một số biến. Ví dụ, trong một nghiên cứu về bệnh nhân ung thư, chỉ cần so sánh tỷ lệ mắc ung thư trong một nhóm dân số có thể bỏ qua các biến số khác về bệnh nhân bị giấu kín nhưng điều đó rất quan trọng để đưa ra dự đoán y khoa.

Tất nhiên, thiết kế một thử nghiệm tốt là điều mà các nhà thống kê luôn phải vật lộn. Nhưng Vapnik đã đi xa hơn so với việc đánh giá thiết kế nghiên cứu, ông đã đưa ra một triết lý khoa học rộng lớn hơn nhiều.

Trong một cuộc phỏng vấn vào năm 2014 với các nhân viên của Hiệp hội Khoa học máy tính, Vapnik đã quan sát thấy rằng hầu hết khoa học vận hành một cách cổ điển theo nguyên tắc đơn giản. Trích dẫn câu nói của Einstein, Vapnik nói, “khi giải pháp là đơn giản là do Chúa trời đang trả lời”, có nghĩa là “quy tắc đơn giản khi chúng ta đơn giản”. Nhưng theo Vapnik, hầu hết thế giới không đơn giản như vậy, và nó không  mang lại các quy tắc đơn giản phù hợp với các điểm trên biểu đồ.

“Vì vậy, câu hỏi là thế giới thực là gì? Nó đơn giản hay phức tạp?” Vapnik hỏi. Ông kết luận rằng “việc học máy trên mạng cho thấy có những ví dụ về các thế giới phức tạp”, và rằng “chúng ta nên tiếp cận các thế giới phức tạp từ một vị trí hoàn toàn khác so với các thế giới đơn giản”.

Điều đó nghĩa là gì? Đối với các ngành công nghiệp, điều đó có nghĩa là giả sử người ta biết câu hỏi có lẽ là một kết luận sớm. Khối lượng dữ liệu trong các tập đoàn sẽ mang lại những loại câu hỏi hoàn toàn mới không liên quan gì đến những câu hỏi hiện đang được hỏi bởi các thống kê thông thường hoặc mô hình học máy hiện tại.

Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
Trí tuệ nhân tạo sẽ phát triển như thế nào trong thời đại mới?
POWERED BY ONECMS - A PRODUCT OF NEKO