Thách thức đối với phân tích dữ liệu IoT

06:41 PM 11/10/2018 In bài viết

Kết quả hình ảnh cho IoT analytics guide: What to expect from Internet of Things data

Sự phát triển của Internet of Things (IoT) đang có tác động lớn đến nhiều lĩnh vực trong CNTT của doanh nghiệp và phân tích dữ liệu là một trong số đó.

Các công ty đang thu thập rất nhiều thông tin từ tất cả các loại kết nối của các đối tượng người dùng, chẳng hạn như dữ liệu về cách người tiêu dùng đang sử dụng một số sản phẩm nhất định, hiệu suất của tài sản công ty và điều kiện môi trường. Bằng cách áp dụng phân tích nâng cao cho các luồng dữ liệu đầu vào, các tổ chức có thể có được thông tin chi tiết mới có thể giúp họ đưa ra quyết định sáng suốt hơn về những hành động cần thực hiện. Và với các công ty đặt cảm biến IoT vào ngày càng nhiều đối tượng, khối lượng dữ liệu đến sẽ tiếp tục tăng.

“Máy tính dựa trên cảm biến là một xu hướng cốt lõi trong chuyển đổi kỹ thuật số”, Maureen Fleming, một nhà phân tích tại công ty nghiên cứu IDC cho biết. “Tùy theo trường hợp sử dụng, áp dụng máy học (ML) vào dữ liệu cảm biến nhằm mục đích dự đoán xác suất mất điện, xu hướng mua, vấn đề sức khỏe, v.v...”

Việc áp dụng ML cho dữ liệu cảm biến kết hợp với dữ liệu từ các ứng dụng doanh nghiệp cũng có thể thay đổi một cách cơ bản cách tổ chức hoạt động của chính doanh nghiệp, bằng cách dự đoán các vấn đề với thỏa thuận về dịch vụ cấp cho khách hàng hoặc vấn đề vận tải trong chuỗi cung ứng.

IoT “đang thúc đẩy sự pha trộn của thế giới kỹ thuật số và thể chất”, Brian Hopkins, phó chủ tịch kiêm nhà phân tích chính của Forrester Research cho biết. “Hầu như tất cả các doanh nghiệp đều muốn dữ liệu thời gian thực từ thế giới thực để thực hiện bước tiếp theo trong việc tìm kiếm thông tin chi tiết mang lại lợi thế cạnh tranh”.

Forrester thấy ba kịch bản chính để có được cái nhìn sâu sắc thông qua phân tích. Một là thông tin chi tiết về các sản phẩm được kết nối thông minh. Hai là cái nhìn sâu sắc về cách kết nối mọi thứ hoạt động hiệu quả với nhau, có thể giúp các công ty cải tiến các quy trình liên quan đến tài sản vật chất. Và thứ ba là cái nhìn sâu sắc về mọi thứ và con người đến từ dữ liệu IoT của các đối tác kinh doanh như nhà cung cấp.

IoT yêu cầu cơ sở hạ tầng mới

Đối với nhiều doanh nghiệp, cơ sở hạ tầng phân tích dữ liệu hiện tại sẽ không xử lý đầy đủ mức tăng dự kiến ​​về khối lượng dữ liệu do IoT tạo ra. Họ sẽ cần phải thay đổi môi trường CNTT của mình để làm cho chúng trở nên “sẵn sàng cho IoT” hơn.

“IoT đang tạo ra một lượng dữ liệu chưa từng có trong doanh nghiệp cả về khối lượng và tốc độ”, Mark Hung, phó chủ tịch nghiên cứu của công ty nghiên cứu Gartner cho biết. “Để trích xuất giá trị của dữ liệu này, kiến ​​trúc hạ tầng phân tích dữ liệu của doanh nghiệp cần phải được tân trang lại”.

Đối với các doanh nghiệp để đưa ra hành động dựa trên dữ liệu IoT một cách kịp thời, streaming hoặc phân tích thời gian thực thường được yêu cầu, Mark Hung cho biết. Sự cần thiết phải kết hợp các phương pháp phân tích mới như phân tích luồng dữ liệu và cơ sở hạ tầng mới như các cổng cạnh đặt các yêu cầu kiến ​​trúc mới trên cơ sở hạ tầng CNTT hiện có, ông nói.

Phân tích dữ liệu cho IoT có một số yêu cầu riêng biệt so với phân tích cho các loại dữ liệu khác. Điều này bao gồm định dạng dữ liệu, độ phong phú dữ liệu, độ nhạy thời gian, nơi dữ liệu được lưu trữ và thời gian lưu trữ dữ liệu.

“Nhu cầu phân tích chính là khoảng cách giữa việc tạo dữ liệu trong thế giới vật chất và nhu cầu hành động trong thế giới thực hoặc kỹ thuật số”, Hopkins nói. “Điều này chắc chắn có nghĩa là đẩy một số logic phân tích đến các cạnh, ra khỏi đám mây hoặc trung tâm dữ liệu. Vấn đề là các máy chủ và thiết bị có ít công suất tính toán hơn.” Một số máy có giới hạn về pin hoặc nguồn điện và dung lượng lưu trữ ít hơn nhiều so với yêu cầu phân tích, Hopkins nói. Do đó, các phân tích cần được phân phối. “Một số điều xảy ra trên các thiết bị, những thứ khác trên các máy chủ cạnh và cổng, những vấn đề khác lại diễn ra trong môi trường xử lý trung tâm,” ông nói.

Việc xây dựng dữ liệu theo thời gian thực, quản trị dữ liệu và tính khả dụng của các dịch vụ là một trong những thách thức lớn nhất mà IT sẽ phải đối mặt trong việc tạo ra một môi trường phân tích IoT, Hopkins nói.

“Vì không phải tất cả dữ liệu được lưu trữ gọn gàng trong một cơ sở dữ liệu, do vậy mỗi thiết bị tạo ra dữ liệu phải được xếp vào danh mục và dữ liệu mà nó tạo ra cần đặt dưới sự quản trị, v.v.”, Hopkins nói. “Có nhiều vấn đề về bảo mật và quyền riêng tư thường rơi vào vòng đua của CNTT. Vấn đề là rất nhiều đầu tư IoT đang xảy ra bên ngoài CNTT trong khu vực hoạt động, nhưng CNTT vẫn cảm thấy áp lực để bảo vệ hệ thống và bảo vệ dữ liệu.”

Phân tích dữ liệu IoT cũng sẽ đặt áp lực mới vào cơ sở hạ tầng mạng. “Khi khối lượng dữ liệu phát triển, mạng phải trở nên linh hoạt hơn nhiều và để đạt được dung lượng cao hơn, trong khi được bảo mật,” Hopkins nói. “Một yêu cầu cao hơn.”

Tùy thuộc vào ứng dụng và ngành công nghiệp, các yêu cầu của IoT sẽ tạo thêm nhu cầu về băng thông bổ sung và ít chịu được độ trễ trong cơ sở hạ tầng mạng, Ông Mark nói.

Xác định liệu một tổ chức có nên triển khai các dịch vụ bên ngoài hay phân tích nội bộ là một chủ đề phức tạp có nhiều mặt. “Một số yếu tố bao gồm yêu cầu bảo mật dữ liệu của doanh nghiệp và khả năng phân tích nội bộ”, ông nói.

Sự sẵn có của các kỹ năng là một sự cân nhắc cơ bản, Fleming nói. “Một điều khác là liệu có các thư viện ngoài hộp dữ liệu để tăng tốc độ phát triển, so với nhu cầu xây dựng các thuật toán độc quyền,” bà nói. “Ngoài ra, phân tích IoT thường tập trung vào chuỗi thời gian, thậm chí có thể yêu cầu các khả năng mới”.

Một trong số các ngành công nghiệp chấp nhận phân tích IoT là ngành thăm dò năng lượng (ví dụ dầu và khí đốt), theo truyền thống đã đi đầu trong việc áp dụng phân tích IoT, Mark nói. “Tuy nhiên, các ngành công nghiệp trọng điểm khác, chẳng hạn như sản xuất và vận tải, đang ngày càng tích cực trong việc ứng dụng đánh giá phân tích IoT”, ông nói.

Chọn nền tảng phân tích IoT

Một số nhà cung cấp đang cung cấp các hệ thống phân tích IoT. Ví dụ như IBM cung cấp nền tảng Watson IoT, một dịch vụ được quản lý, được lưu trữ trên đám mây cung cấp các khả năng như đăng ký thiết bị, kết nối, hiển thị nhanh và lưu trữ dữ liệu IoT. IBM Watson cung cấp xử lý ngôn ngữ tự nhiên, học máy, và phân tích hình ảnh và văn bản cho các ứng dụng IoT.

Khách hàng sử dụng nền tảng này để mua và lưu trữ dữ liệu được nhúng vào thiết bị để đưa ra quyết định gần như trong thời gian thực bằng cách sử dụng Watson Analytics và trí thông minh nhân tạo (AI), Stephan Biller, phó chủ tịch quản lý cung cấp tại IBM Watson IoT cho biết. Cảm biến gửi dữ liệu qua mạng vô tuyến Z-Wave đến các cổng được kết nối thông qua mạng LAN cáp tới Internet. Dữ liệu được ghi lại và lưu trữ trên Đám mây của IBM.

“Quy tắc phân tích IoT có thể được đặt theo các điều kiện cụ thể kích hoạt các hành động cụ thể”, Biller cho biết, ví dụ: khách hàng có thể tạo quy tắc để đảm bảo rằng cảnh báo được gửi đến bảng điều khiển dữ liệu và email được gửi đồng thời đến quản trị viên, khi một thiết bị bị giảm hoặc khi nhiệt độ của thiết bị tăng vọt, ông cho biết.

IBM tiếp tục thấy sự gia tăng nhu cầu về nền tảng IoT ổn định, Biller nói. “Chúng tôi thấy việc áp dụng IoT của doanh nghiệp đang phát triển trong khi các dự án chuyển từ chứng minh khái niệm sang sản xuất, ông nói. “Đầu tư nền tảng là rất quan trọng, vì khách hàng nhận ra nhu cầu cơ bản để kết nối cảm biến và thiết bị và quản lý, lưu trữ và bảo mật dữ liệu.”

Các nền tảng như Watson IoT được thiết kế để giúp khách hàng thực hiện các phân tích cơ bản, chẳng hạn như tạo cảnh báo và phát hiện dị thường từ các luồng dữ liệu. “Nhưng phần lớn sự tăng trưởng mà chúng tôi thấy là đến từ những khách hàng nhận ra rằng giá trị thực sự vượt ra ngoài 'kết nối và thu thập' cơ bản” Biller nói. “Những khách hàng này quan tâm đến phân tích nâng cao, học máy và các công nghệ AI khác có thể được triển khai để giúp họ hiểu dữ liệu của họ và thúc đẩy lợi ích như cải thiện hiệu quả hoạt động và thời gian hoạt động của tài sản”.

Phân tích IoT phục vụ cho các ngành công nghiệp cụ thể là rất quan trọng đối với khách hàng, Biller nói. “Thường thì điều này xuất hiện dưới dạng các mẫu mô hình công nghiệp mà chúng tôi cùng nhau xây dựng với nghiên cứu của IBM và các khách hàng của chúng tôi”, ông nói. “Mặc dù một số kỹ thuật xuyên suốt nhất định có thể được sử dụng cho dữ liệu cơ bản và thông tin chi tiết ban đầu, chúng tôi nhận thấy rằng điều kiện kinh doanh của từng khách hàng và nguồn dữ liệu thường là duy nhất để yêu cầu mức độ tuỳ chỉnh cao hơn”.

Amazon cung cấp AWS IoT Analytics, một dịch vụ quản lý được thiết kế để giúp dễ dàng xử lý và vận hành các phân tích phức tạp về khối lượng lớn dữ liệu IoT mà không phải lo lắng về chi phí và độ phức tạp cần thiết để xây dựng nền tảng phân tích IoT.

AWS IoT Analytics tự động hóa từng bước cần thiết để phân tích dữ liệu từ các thiết bị IoT, Marco Argenti, phó chủ tịch công nghệ của AWS cho biết. Nó lọc và tổng hợp dữ liệu IoT trước khi lưu trữ nó trong kho dữ liệu chuỗi thời gian để phân tích. Các tổ chức có thể thiết lập dịch vụ để chỉ thu thập dữ liệu họ cần từ thiết bị của họ, áp dụng các phép biến đổi toán học để xử lý dữ liệu và làm phong phú dữ liệu với siêu dữ liệu cụ thể theo thiết bị như phân loại thiết bị và vị trí trước khi lưu trữ dữ liệu đã xử lý.

Sau đó, họ có thể phân tích dữ liệu của họ bằng cách chạy truy vấn đặc biệt hoặc được lập lịch sử dụng công cụ truy vấn SQL tích hợp hoặc thực hiện phân tích phức tạp hơn và suy luận học máy. AWS IoT Analytics bao gồm các mô hình được xây dựng sẵn cho các trường hợp sử dụng IoT phổ biến, Argenti nói.

Các tổ chức cũng có thể sử dụng phân tích tùy chỉnh của riêng mình, được đóng gói trong một vùng chứa, để thực thi trên AWS IoT Analytics. Nền tảng tự động hóa việc thực hiện các phân tích tùy chỉnh được tạo trong Jupyter Notebook hoặc các công cụ của chính tổ chức.

Ngoài ra, AWS cũng có AWS Greengrass trong danh mục đầu tư IoT của nó. AWS Greengrass là phần mềm cho phép các công ty chạy tính toán cục bộ, nhắn tin, lưu trữ dữ liệu, đồng bộ hóa và khả năng suy luận học máy cho các thiết bị kết nối, Argenti nói.

Với AWS Greengrass, các thiết bị được kết nối có thể giữ dữ liệu đồng bộ và liên lạc với các thiết bị khác một cách an toàn, ngay cả khi không kết nối với Internet. Sử dụng AWS Lambda, Greengrass đảm bảo rằng các thiết bị IoT có thể đáp ứng nhanh chóng các sự kiện cục bộ, sử dụng các hàm Lambda chạy trên Greengrass Core để tương tác với các tài nguyên cục bộ và hoạt động với các kết nối gián đoạn.

“Do những thách thức độc đáo của dữ liệu IoT, đã có nhu cầu về phân tích vì các nhà sản xuất thiết bị kết nối và doanh nghiệp phải xây dựng các ứng dụng phần mềm và phần cứng tùy chỉnh dành riêng cho việc quản lý thiết bị cụ thể và dữ liệu của họ”. “Những ứng dụng để xây dựng này đắt tiền, không có quy mô tốt cho khối lượng lớn các loại thiết bị khác nhau, và thường không linh hoạt,” ông nói.

Tìm kiếm thành công với phân tích IoT

Các công ty đã triển khai nền tảng phân tích IoT đang thấy lợi ích rõ ràng.

Georgia Pacific, một trong những nhà sản xuất bột giấy, giấy, bao bì, sản phẩm xây dựng và hóa chất liên quan hàng đầu thế giới, đã triển khai AWS IoT Analytics.

Các nhà phân phối của công ty cho phép hãng phân phối sản phẩm cho khách hàng và Georgia Pacific tập trung vào việc làm cho các máy rút này “thông minh” bằng cách thêm cảm biến và kết nối, Erik Cordsen, kiến ​​trúc sư chương trình IoT và quản lý sản phẩm cho biết.

Điều đó cho phép công ty cải thiện trải nghiệm của khách hàng bằng cách cung cấp thông tin thời gian thực về khối lượng sản phẩm và các thống kê khác, Cordsen nói. Với hàng ngàn điểm cuối liên tục tạo ra dữ liệu, Georgia Pacific đang sử dụng AWS IoT Analytics để làm phong phú thêm thông điệp với vị trí và siêu dữ liệu sản phẩm, nhằm cung cấp dịch vụ khách hàng tốt hơn.

KONE Americas, nơi cung cấp thang máy, thang cuốn và cửa xây dựng tự động, đang sử dụng nền tảng IBM để phân tích dữ liệu IoT. Danilo Elez, phó chủ tịch phụ trách dịch vụ của KONE cho biết: “Chúng tôi luôn tìm cách để các công nghệ và đổi mới mới có thể cho phép chúng tôi phục vụ khách hàng tốt hơn”.

“Thang máy và thang cuốn tạo nhiều dữ liệu và chúng tôi muốn tận dụng dữ liệu để mang lại giá trị cho khách hàng và cá nhân hóa trải nghiệm của khách hàng từ tầng này sang tầng khác hoặc một không gian khác trong tòa nhà”, Elez nói.

Sau khi triển khai nền tảng IBM vào năm 2016 để xây dựng trí thông minh và phân tích, KONE đã có thể khởi chạy các dịch vụ mới như KONE 24/7 Connected Services. Các dịch vụ cho phép công ty để dự đoán tốt hơn trục trặc trước khi chúng xảy ra và tăng hiệu suất thiết bị và độ tin cậy. “Nó có nghĩa là cải thiện an toàn, minh bạch đầy đủ, và dễ dàng kiểm soát, bởi vì nếu một cái gì đó sẽ xảy ra, chúng tôi đã biết từ trước”, Elez nói.

KONE phục vụ 450.000 khách hàng và có 1,2 triệu thang máy và thang cuốn trong cơ sở dịch vụ của mình. Nền tảng IBM Watson IoT và IBM Cloud có thể phân tích theo thời gian thực từ một lượng lớn dữ liệu từ các thiết bị cảm biến thang máy và thang cuốn. Khi phân tích dữ liệu IoT phát hiện sự cố sắp xảy ra, kỹ thuật viên sẽ xuất hiện tại hiện trường với các bộ phận phù hợp và ở đúng vị trí, để thực hiện các bản sửa lỗi cần thiết.

“Điều này giúp dự đoán chính xác nhu cầu thiết bị và giúp các kỹ thuật viên của chúng tôi thực hiện bảo trì đúng nơi và đúng thời điểm”, Elez nói. Kết quả là KONE có thể dự đoán và đáp ứng tốt hơn các vấn đề kỹ thuật trong thời gian thực, giữ thiết bị vận hành ổn định, đồng thời tiết kiệm thời gian và tiền bạc.

“IoT trao quyền cho các kỹ thuật viên với hơn 20.000 người trên toàn thế giới của chúng tôi để cung cấp dịch vụ tốt hơn, khả năng cung cấp thiết bị tốt hơn và nhiều trải nghiệm được cá nhân hóa hơn cho người tiêu dùng”, Elez nói.

Khôi Linh