Gia tăng số lượng doanh nghiệp sử dụng dữ liệu lớn
Trong thời đại số hóa, điện toán đám mây, và IoT ngày càng phát triển, dữ liệu từ mọi hoạt động thường ngày trong cuộc sống đều có thể được thu thập và lưu trữ, tạo ra những tập hợp dữ liệu khổng lồ được gọi là dữ liệu lớn (Big data). Khi dữ liệu ngày càng được lưu trữ với tốc độ nhanh và đa dạng chủng loại, việc phân tích dữ liệu lớn có thể cung cấp những thông tin vô cùng quý giá để cải thiện nhiều phương diện của cuộc sống, bao gồm kinh doanh, dịch vụ khách hàng và quản lý chuỗi cung ứng. Trong những năm gần đây, dữ liệu lớn được đánh giá là chủ đề được quan tâm nhiều nhất và được cho là thiết thực nhất đối với việc xây dựng chiến lược chuỗi cung ứng của doanh nghiệp.
Theo báo cáo của hãng nghiên cứu thị trường Supply Chain Insight, ước tính hiện có 18% doanh nghiệp trên thế giới đã và đang bắt dầu tìm cách sử dụng dữ liệu lớn để cải thiện hoạt động kinh doanh. Con số này được dự báo sẽ tăng lên 43% trong vòng 10 năm tới. Supply Chain Insight cũng ước tính rằng mặc dù hiện chỉ có 6% doanh nghiệp sở hữu dữ liệu lớn đúng nghĩa (trên 1 triệu Gigabyte), trong 10 năm tới con số này sẽ tăng lên 38%. Theo dự báo, dữ liệu lớn sẽ không ngừng tăng về cả khối lượng lẫn chủng loại và vận tốc khi mà IoT ngày càng phát triển.
Theo các chuyên gia, có rất nhiều lợi ích khi sử dụng dữ liệu lớn trong kinh doanh. Đối với ngành thương mại điện tử, việc phân tích dữ liệu hoạt động của người truy cập trang web thương mại điện tử có thể cung cấp thông tin về thị hiếu, hành vi và tâm lý của người tiêu dùng. Những thông tin này cho phép công ty hiểu được quá trình chuyển đổi từ người truy cập thành khách hàng và chuyển từ giỏ hàng thành đơn hàng. Big data cũng chứa đựng những thông tin cho phép cải thiện dịch vụ chăm sóc khách hàng, xây dựng chiến lược kinh doanh và phát triển sản phẩm mới.
Bên cạnh đó, sử dụng dữ liệu lớn giúp cải thiện dự báo và lập kế hoạch ngắn và dài hạn. Khả năng phân tích dữ liệu lớn cho phép dự báo nhu cầu tiêu dùng một cách chính xác hơn, thậm chí ở mức độ chi tiết như từng sản phẩm hay từng địa điểm bán hàng. Nó cho phép kết hợp nhiều chủng loại dữ liệu đa dạng để xây dựng các mô hình dự báo phức tạp có khả năng dự đoán sát với thực tế. Khi doanh nghiệp dự báo chính xác với mức độ chi tiết cao thì cũng sẽ lập kế hoạch hiệu quả hơn. Các doanh nghiệp sở hữu năng lực phân tích và sử dụng dữ liệu lớn như Google, Amazon, Walmart có thể biết trước được người tiêu dùng sẽ mua sản phẩm nào trong khi khi bản thân người tiêu dùng còn chưa nghĩ đến sản phẩm đó. Trên thực tế, Walmart đã theo dõi giao dịch của khách hàng tại từng điểm bán với lưu lượng một triệu giao dịch mỗi giờ để phục vụ cho marketing và dự báo nhu cầu.
Bên cạnh đó, kết hợp phân tích big data với ứng dụng Business Intelligence cung cấp cho các nhà quản lý cấp cao một cái nhìn toàn diện trên thời gian thực toàn bộ hoạt động đang diễn ra trên chuỗi cung ứng. Dựa vào đó các nhà quản lý có thể phát hiện ra những biến cố hoặc những xu hướng mới cho phép hành động kịp thời để tận dụng cơ hội hoặc giảm thiểu rủi ro.

Dữ liệu lớn: Những thách thức về an ninh mạng
Khi dữ liệu lớn ngày càng trở nên dễ truy cập hơn, các mối quan tâm về bảo mật và tính riêng tư cũng ngày càng tăng. Việc thu thập, khai thác và chia sẻ dữ liệu đã trở nên phổ biến đối với các hãng tiếp thị, các nhà nghiên cứu và các tổ chức. Tuy nhiên, các công cụ để giám sát và bảo vệ dữ liệu lớn hiện có lại không được tích hợp các giải pháp bảo mật tốt nhất. Trong khi đó, các tổ chức, doanh nghiệp thường thiếu các chính sách bắt buộc để đảm bảo nhân viên tuân thủ đầy đủ các quy trình và phương pháp bảo mật.
Từ góc nhìn bảo mật, thách thức chính phía trước của dữ liệu lớn chính là là sự an toàn và quyền riêng tư của người dùng. Do dữ liệu lớn có chứa các thông tin cá nhân nhạy cảm cao nên sẽ là mục tiêu hấp dẫn của tin tặc. Thực tế, dữ liệu Lớn có thể gây ra những vụ vi phạm dữ liệu lớn, gây thiệt hại lớn về tài chính và thời gian.
Những thách thức chính về an ninh mạng đối với dữ liệu lớn bao gồm:
Từ ngay chính dữ liệu lớn
Phần lớn các tổ chức, doanh nghiệp hiện nay đều tuân thủ theo một tập các chính sách bảo mật tiêu chuẩn bất kể họ đang sử dụng và xử lý loại dữ liệu nào. Thách thức lớn nhất của dữ liệu lớn chính là đặc tính 3V (Volume, Velocity, Variety).
- Khối lượng (Volume): Lợi ích lớn nhất của dữ liệu lớn là nó có thể quản lý khối lượng lớn dữ liệu nhưng kèm theo đó là sự gia tăng các lỗ hổng bảo mật.
- Tốc độ (Velocity): Thách thức thứ hai liên quan đến dữ liệu lớn là tốc độ. Đặc biệt là trong các tổ chức công nghệ cao, nơi việc đưa ra quyết định dựa trên dữ liệu thường đòi hỏi rất nhanh. Do đó cần có một giải pháp bảo mật thời gian thực không chỉ để cảnh báo và giám sát mà còn để ngăn chặn các yêu cầu trái phép.
• Đa dạng (Variety): Do khối lượng lớn nên việc cấp phép cho người dùng truy cập đúng vào tài nguyên và dữ liệu trở nên phức tạp hơn.
Môi trường
Môi trường là thách thức quan trọng thứ hai ở đây.
- Nhiều lớp: Các môi trường dữ liệu lớn hiện nay thường không đơn giản. Nó có nhiều lớp từ lưu trữ phân tán cho đến hệ thống quản lý. Sự phức tạp này lớn hơn rất nhiều so với các hệ thống truyền thống làm, khiến cho việc đảm bảo an toàn gặp nhiều khó khăn
- Nhiều công nghệ: Với mọi môi trường dữ liệu lớn, bạn cần phải xử lý nhiều công nghệ khác nhau như NoSQL, BI, Data Warehouse,… Tất cả các công nghệ này được liên kết nối với môi trường khác nhau, đó là lý do tại sao việc triển khai các giải pháp bảo mật toàn diện gặp khó khăn.
Con người
Thách thức cuối cùng nhưng rất quan trọng đối với dữ liệu lớn là con người. Đây thường là mắt xich yếu nhất khi nói tới vấn đề bảo mật.
Một số giải pháp đảm bảo an toàn cho dữ liệu lớn
Bảo mật phần mềm ứng dụng
Các kỹ thuật cho dữ liệu lớn thường có tính bảo mật yếu. Bằng cách sử dụng các công nghệ như phiên bản 20.20x của Hadoop hoặc cao hơn hay Apache Accumulo, người ta có thể giải quyết vấn đề này. Hơn nữa, bạn có thể sử dụng các công nghệ độc quyền như Cloudera Sentry để cung cấp bảo mật mạnh mẽ ở lớp ứng dụng. Các công nghệ này cũng giúp kiểm soát truy cập dựa để tăng cường bảo mật cho cơ sở dữ liệu NoSQL.
Duy trì kiểm tra nhật ký, giám sát và phân tích
Bước tiếp theo là triển khai các giải pháp kiểm tra để theo dõi và phân tích các nhóm dữ liệu Lớn. Luôn ghi nhớ rằng cần phải gán nhiệm vụ giám sát và phân tích các tập tin này cho một hoặc một nhóm kỹ sư bảo mật. Để giữ cho cơ sở dữ liệu an toàn, việc kiểm tra, duy trì và phân tích các bản ghi nhất quán là cần thiết.
Cấu hình phần cứng và phần mềm phù hợp
Luôn triển khai các máy chủ dựa trên các giải pháp bảo mật cho kiến trúc dữ liệu lớn của doanh nghiệp bạn. Đảm bảo rằng các bản vá được cập nhật thường xuyên và chỉ những người dùng được phân quyền mới có quyền truy cập vào các tài nguyên quan trọng.
Giám sát và kiểm soát tài khoản
Luôn luôn áp đặt các chính sách xác thực mạnh mẽ. Xác thực là bước đầu tiên để ngăn chặn tin tặc xâm nhập vào hệ thống của bạn. Triển khai các chính sách mật khẩu mạnh, yêu cầu người dùng thay đổi mật khẩu của họ định kỳ thường xuyên, giáo dục họ không chia sẻ mật khẩu với bất kỳ ai khác là rất cần thiết. Ngoài ra cũng có thể triển khai giải pháp chứng thực hai yếu tố (2FA). Việc triển khai 2FA đảm bảo rằng người dùng cần phải trải qua quá trình xác thực an ninh nhiều lần để có thể truy cập. Mặc dù không đảm bảo an toàn 100%, nhưng đây là một giải pháp hiệu quả để giảm thiểu các mối đe dọa an ninh mạng.