Tích hợp phân tích dữ liệu với Blockchain và AI

Khôi Linh, Trương Khánh Hợp| 15/11/2018 16:06
Theo dõi ICTVietnam trên

Chúng ta đang sống trong một thế giới mà các sự kiện và hoạt động hàng ngày của chúng ta đều được thu thập và tổng hợp thành một cơ sở dữ liệu khổng lồ gọi là dữ liệu lớn (Big Data), và dữ liệu này liên tục được triển khai ứng dụng theo nhiều cách. Dữ liệu này đã trở thành nguồn tài nguyên khổng lồ của chính phủ và cả các mối quan tâm riêng tư.

Integrating Datafication with Blockchain and AI

Chúng ta đang trong quá trình kỹ thuật số hóa tất cả mọi thứ, từ việc sử dụng dữ liệu đến DNA của chúng ta, và trong tương lai là sự tích hợp DNA và các vật thể xung quanh chúng ta lại với nhau. Vì vậy, chúng ta cần phải nhận thức sâu sắc rằng chúng ta cần phải kết nối chặt chẽ với dữ liệu chúng ta sản xuất, trong khi sử dụng nền tảng công nghệ trong điện thoại, máy tính, cũng như các ứng dụng.

Điều này không chỉ xảy ra với mỗi cá nhân chúng ta, và ngược lại nó cũng xảy ra cả với các công ty, doanh nghiệp và tổ chức tài chính quản lý dữ liệu của chúng ta: Đối với các doanh nghiệp, dữ liệu lớn là một cơn sốt vàng mới. Đối với chính phủ, dữ liệu lớn bao trùm nhiều khía cạnh kinh doanh của chính phủ.

Nhưng điều gì mang AI và Blockchain đến để cùng hỗ trợ phân tích dữ liệu? Chúng có liên quan với nhau như thế nào? Chúng có thể được sử dụng cùng nhau không hoặc điều này có bị đặt ra quá nhiều yêu cầu?

Blockchain và Big Data

Blockchain về cơ bản là sổ kế toán phân phối các bản ghi giao dịch. Nói cách khác, Blockchain về cơ bản được xây dựng để lưu trữ và phân phối dữ liệu lớn theo định dạng minh bạch, an toàn và không thay đổi. Về bản chất, các chức năng Blockchain là một siêu dữ liệu khổng lồ. Với khả năng lưu trữ dữ liệu này, Blockchain do đó được định vị hoàn hảo để trở thành Ngân hàng Trung ương của Internet và Dữ liệu lớn tiếp theo. Điều này mang lại cho Blockchain vị trí tuyệt vời như là trình điều khiển số 1 của sự thay đổi về cách thức nhận thức và quản lý dữ liệu lớn.

Danh tính, giao dịch tài chính và chuỗi cung ứng cấu thành ba lĩnh vực chính nơi dữ liệu tìm thấy các ứng dụng quan trọng nhất của nó. Ngân hàng, thương mại, chính phủ, thương mại, tài chính, du lịch và các lĩnh vực khác nhau của nền kinh tế đều được tạo thành từ một hoặc tất cả ba lĩnh vực chính này. Khi dữ liệu tăng kích thước và sự tinh tế, các phương pháp lưu trữ dữ liệu đó một cách an toàn cũng cần phải phát triển. Việc lưu trữ một lượng lớn dữ liệu trong đám mây hoặc trên các nền tảng lưu trữ thông thường khác là tốn kém và không thể thực hiện được (Fedak, 2018). Dữ liệu sẽ ngày càng lớn hơn và phức tạp hơn. Do đó, một phương tiện quản lý dữ liệu lớn tốt hơn, hiệu quả hơn và rẻ hơn đã trở thành một điều cần thiết. Blockchain, còn được gọi là Công nghệ Ledger phân tán hoặc DLT, có các yếu tố cho vay để sử dụng như vậy.

Bảo mật dữ liệu lớn và tính bất biến của nó là hai yếu tố mà Blockchain có thể mang lại cho các nhóm sử dụng. Các chính phủ trên khắp thế giới đang dần nhận ra rằng các quốc gia hùng mạnh nhất không còn là những quốc gia có kho vũ khí quân sự lớn, mà là những người có khả năng kiểm soát dữ liệu và cơ sở dữ liệu tốt nhất. Vào năm 2012, một loại vi-rút máy tính được gọi là phần mềm nhiễm độc Stuxnet kiểm soát hoạt động ly tâm trong các cơ sở làm giàu urani của Iran. Do đó, thành phần quan trọng này của chương trình hạt nhân của Iran gặp một trở ngại trong quá trình vận hành, đó là kết quả của cuộc tấn công, mà mã độc gây ra cho hơn 1000 máy ly tâm dẫn đến vượt khỏi tầm kiểm soát và tự hủy (Beaumont và Hopkins, 2012). Đây là ví dụ đầu tiên về cách truyền tải dữ liệu độc hại đã gây gián đoạn cho chương trình quan trọng của một quốc gia.

Với các chính phủ như Mỹ, Trung Quốc và Nga, những cáo buộc về tấn công mạng và gián điệp mạng, bảo mật dữ liệu nhạy cảm được cải thiện cho chính phủ đang tạo ra nhu cầu ngày càng tăng về việc khám phá Blockchain như một phương án thay thế khả thi và hiệu quả về chi phí.

Chính phủ không phải là những người duy nhất quan tâm đến sự an toàn của dữ liệu lớn của họ. Các doanh nghiệp và cá nhân cũng vậy. Các quy trình kinh doanh liên quan đến các giao dịch tài chính, quản lý chuỗi cung ứng, quản lý nhân lực và kế toán là tất cả các khu vực mà dữ liệu lớn được tạo ra và có thể được xử lý tốt hơn bằng cách sử dụng công nghệ sổ cái phân tán (DLT). Tiết kiệm chi phí và chất lượng dữ liệu là hai lợi ích được mong muốn từ công nghệ Blockchain khi có liên quan đến dữ liệu lớn của khu vực tư nhân.

Ứng dụng Blockchain cho dữ liệu lớn là không cần bàn cãi. Hầu hết mọi thứ cần thiết để bảo vệ và xác nhận dữ liệu lớn nằm trong Blockchain. Ví dụ, có thể tạo dấu thời gian đồng thuận, thực hiện kiểm tra, xác thực nguồn dữ liệu và đảm bảo tính toàn vẹn dữ liệu lớn một cách toàn diện (Epstein, 2017).

AI và Big Data

Trí tuệ nhân tạo đồng nghĩa với học tập và học máy sâu. Tại sao? Điều này là do AI không thể đạt được kết luận và có hành động tương ứng theo cách mà bộ não con người làm. Để có thể giải quyết các vấn đề phức tạp, AI cần có được sức mạnh của nhận thức; các máy chạy trên AI cần phải được “dạy” để làm điều này, giống như là cách con người cần phải đi học để học các kỹ năng nhất định. Các máy được “dạy học” để tìm hiểu các quy trình và thuật toán để có khả năng giải quyết các vấn đề phức tạp theo cách mà bộ não con người đã làm, đòi hỏi một lượng lớn dữ liệu thuần túy và luôn cập nhật. Đối với AI, càng nhiều dữ liệu thì càng đem lại hiệu quả tốt hơn. Khi có thêm dữ liệu có sẵn qua Internet, AI đã nhận được nhiều thứ tốt hơn so với những năm 80 hoặc 90. Do đó, AI và dữ liệu lớn được kết nối với nhau và sẽ trở thành hai công cụ có mục tiêu chung. Vì vậy, dữ liệu lớn tạo thành đầu vào và AI là đầu ra sẽ giúp máy móc có khả năng giải quyết các vấn đề và hoàn thành nhiệm vụ một cách độc lập (Patrizio, 2018).

Khả năng tích hợp của Blockchain, AI và Big Data

Vẻ đẹp của Blockchain là bất kỳ dữ liệu nào được đưa vào không nhất thiết phải được sử dụng giống như cách mà nó nhận được. Blockchain có thể lấy dữ liệu theo một cách nào đó, và sau đó làm cho dữ liệu này có sẵn để sử dụng với nhiều ứng dụng. Đây là những điều cơ bản về quá trình phân tích dữ liệu; số hóa mọi thành phần trong cuộc sống của chúng ta và tìm kiếm nhiều ứng dụng người dùng cho dữ liệu đó. Chính vì vậy, Blockchain đã vượt qua các định nghĩa và ứng dụng thông thường của một cơ sở dữ liệu thông thường, và tiếp tục trở thành một điều hữu ích hơn nhiều. Nó là một cơ sở dữ liệu phân tán với một lớp bảo mật bổ sung dưới dạng mã hóa mật mã, có khả năng truyền đạt một yếu tố tin cậy tới bất kỳ dữ liệu nào được lưu trữ bên trong nó. Phạm vi áp dụng dữ liệu trong bối cảnh của DLT có thể được hình dung bằng cách xem xét các trường hợp sử dụng được đề xuất bởi các công ty cung cấp các dịch vụ Initial Coin Offerings (ICO).

Chúng ta phải hiểu mục tiêu cuối cùng của cả ba yếu tố này là nhằm đảm bảo cho tất cả các lĩnh vực của cuộc sống hàng ngày và các chức năng hỗ trợ cuộc sống thực sự trở nên tốt hơn. Chúng ta cũng đã xác định rằng đầu ra của một máy thông minh là AI, trong khi đầu vào là dữ liệu lớn (Patrizio, 2018). Nhưng điều gì sẽ xảy ra nếu dữ liệu đầu vào bị lỗi hoặc đã bị cố tình làm hỏng để gây nguy hiểm, mà có thể đã bị gây ra trong một cuộc tấn công bảo mật? Đây là nơi Blockchain sẽ đi vào. Blockchain có thể làm cho dữ liệu không thay đổi được vì nó có một cơ chế để loại bỏ dữ liệu bị hỏng khỏi mạng. Dữ liệu bị hỏng hoặc bị thay đổi tại một thời điểm, không thể được thêm vào chuỗi vì nó sẽ được xác nhận là không phù hợp với các điểm dữ liệu khác trên chuỗi. Khả năng này giúp làm sạch và cấu trúc dữ liệu trước khi tích hợp vào Blockchain một dữ liệu mới có thể được triển khai cho quá trình học máy. Bằng cách làm sạch các dữ liệu lớn và làm cho nó có sẵn cho việc học sâu, các đầu ra mong muốn có thể được đảm bảo.

Các trường hợp Sử dụng AI, Blockchain và Big Data

Chúng ta cùng thảo luận về vấn đề này với một vài trường hợp sử dụng ứng dụng AI và Blockchain để xử lý dữ liệu.

1. Bảo mật dữ liệu tốt hơn

Một trong những thách thức lớn nhất của lưu trữ dữ liệu vẫn là vấn đề bảo mật. Vi phạm an ninh mạng đã dẫn đến trộm cắp dữ liệu với thiệt hại lên đến hàng tỷ đô la trên thế giới. Một sự cố gần đây trong hệ thống chăm sóc sức khỏe của Mỹ liên quan đến công ty bảo hiểm y tế Anthem, trong đó có dữ liệu cá nhân về 78 triệu khách bị truy cập bất hợp pháp bởi một mã độc (Scannell và Chon, 2015). Blockchain hoạt động bằng cách sử dụng một số nút để lưu trữ các khối dữ liệu. Hệ thống lưu trữ phi tập trung này đảm bảo rằng bất kỳ hình thức nào khi bị tấn công hoặc vi phạm tại một nút sẽ không gây nguy hiểm cho dữ liệu được lưu trữ trên các nút khác. Mã hóa toán học của các khối dữ liệu mới trước khi được thêm vào các khối hiện có khác sẽ được thêm vào lớp bảo mật được cung cấp bởi cấu trúc lưu trữ dữ liệu đa nút. Ví dụ, hồ sơ y tế không chỉ được nhân viên y tế sử dụng để chẩn đoán và điều trị bệnh nhân; chúng cũng được các công ty bảo hiểm y tế sử dụng để duy trì hệ thống bảo hiểm y tế.

Trong Blockchain, dữ liệu chăm sóc sức khỏe cũng được mang thêm một lớp bảo mật bổ sung. Đây là một lĩnh vực mà Big Data đang tìm kiếm ứng dụng lớn, vì đây là một lĩnh vực mà an ninh và sự bất biến của dữ liệu là bất khả xâm phạm. Blockchain cho phép một nhóm các bên độc lập chia sẻ tài sản và thông tin kỹ thuật số mà không phải thông qua một bên thứ ba. Tất cả các dữ liệu trao đổi giữa các tác nhân được nêu trong đăng ký trên sổ kế toán phân phối. Không có thực thể trung tâm nào kiểm soát các giao dịch. Mỗi thông tin mới đều được thêm vào sổ kế toán do đó được xác nhận bằng sự đồng thuận của mạng (Petra, 2018).

Các khu vực khác cũng có nhu cầu về dữ liệu an toàn. Ví dụ, một nhà máy điện hạt nhân hoạt động như thế nào nếu bị cung cấp dữ liệu hỏng? Kết quả sẽ gây ra hậu quả mà bạn khó tưởng tượng nổi.

2. Kiểm soát gian lận

Kiểm soát gian lận có nhiều khía cạnh. Nó có thể áp dụng cho lĩnh vực dịch vụ tài chính, hoặc trong các lĩnh vực như biên chế của chính phủ / quản lý lương hưu, và thậm chí trong các quy trình bầu cử. Chúng ta đã có một trường hợp Blockchain được sử dụng để xác nhận kết quả bầu cử tại một tỉnh ở Sierra Leone vào tháng 3 năm 2018. Nhiều quốc gia vẫn gặp vấn đề với vấn đề gian lận bầu cử, và khi cải tiến công nghệ, vấn đề có thể được giảm bớt hoặc bị gián đoạn suốt quá trình bỏ phiếu để thao tác dữ liệu. Blockchain có thể được sử dụng để xác thực dữ liệu đầu vào (đăng ký các cử tri đủ điều kiện) và để phù hợp với số lượng cử tri và kết quả, do đó làm cho nó khó hơn đáng kể nếu muốn làm sai lệch kết quả. AI sau đó có thể được thêm vào quá trình này bằng cách tiếp nhận các chức năng như đối chiếu kết quả và xác nhận các lá phiếu.

3. Kiểm soát các luồng tài chính bất hợp pháp

Nếu có một lỗ hổng mà Blockchain phát hiện, đó là các ẩn danh mà nó giao dịch với các giao dịch tài chính được thực hiện trên các cryptocurrencies được xây dựng bằng công nghệ này. Đây là một lỗ hổng có thể được khai thác bởi những kẻ xấu để di chuyển tiền xung quanh các tài khoản nhằm đánh lạc hướng bên điều tra và thông thường đây là hình thức phạm tội của tội phạm có tổ chức, buôn bán ma tuý hoặc khủng bố. Thật vậy, điều này đã xảy ra và các cơ quan thực thi pháp luật ở Mỹ, Úc và Anh đã bắt giữ và truy tố rất nhiều nghi phạm về vấn đề này. Liên kết còn thiếu ở đây có thể là AI. Theo cố vấn Blockchain Ali Ayyash, các nền tảng có thể được xây dựng để chạy trên AI; dạy chúng theo dõi và giám sát các luồng giao dịch trên Blockchain. Từ đó, có thể thiết lập và nhận ra các mẫu giao dịch được sử dụng bởi các cá nhân hoặc tổ chức tội phạm, sau đó có thể được sử dụng để xây dựng các kiểm tra thích hợp chống lạm dụng các giao dịch tiền điện tử theo cách này (Ayyash, 2018).

Đây chỉ là một ví dụ về một số trường hợp sử dụng có thể, nhưng theo thời gian, các trường hợp sử dụng mới hơn sẽ xuất hiện và các trường hợp hiện có sẽ biến đổi không ngừng.

Tóm lại, chúng ta thấy rằng Blockchain, AI và dữ liệu lớn, tất cả phải được liên kết với nhau nếu chúng ta muốn có được kết quả mong muốn làm cho máy móc thông minh hơn và có khả năng nhận thức nhiều hơn. Dữ liệu lớn cung cấp đầu vào cho các thuật toán học máy, nhưng sự chính xác của dữ liệu đầu vào này có thể được đảm bảo bằng cách sử dụng Blockchain. Để nâng cao chất lượng sản xuất sau đó có thể được sử dụng trong quá trình học tập sâu để tạo ra kết quả nhanh hơn nhiều so với con người có thể làm, và với ít sai phạm hơn.

Ba thành phần này là một phần của chuỗi, và ngày càng khó nhìn thấy một cái làm việc mà không có cái kia. Nếu không có dữ liệu lớn, các nỗ lực học máy sẽ bị hạn chế. Nếu không có chất lượng dữ liệu lớn được tăng cường bằng cách sử dụng Blockchain, việc học máy sẽ bị thiếu và sẽ tạo ra ít thông minh nhân tạo hơn. Nhưng với Blockchain và dữ liệu lớn tạo ra đầu vào chính xác, các máy sau đó có thể học sâu và trở nên thông minh hơn để tạo ra đầu ra mong muốn cho bất kỳ ngành nào.

Do đó, con đường phía trước sẽ là tăng cường sự tham gia của Big Data, của AI và Blockchain. Lợi ích tiềm năng là rất lớn

Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
Tích hợp phân tích dữ liệu với Blockchain và AI
POWERED BY ONECMS - A PRODUCT OF NEKO