Vấn đề về Lưu trữ dữ liệu khi Big Data được ứng dụng
Chính phủ số - Ngày đăng : 20:58, 19/03/2019
Mặc dù Big Data - Dữ liệu lớn không phải là một khái niệm mới, nhưng thực sự trong hai năm qua, các công ty Mỹ đã lưu ý và lưu trữ tất cả các thông tin. Theo nghiên cứu, các công ty mới chỉ phân tích khoảng 12% dữ liệu họ có, hầu như không khai thác hết tiềm năng của dữ liệu lớn. Trên thực tế, các tập đoàn này mất khoảng 3,1 nghìn tỷ đô la hàng năm vì dữ liệu xấu. Đối với các tập đoàn, lợi thế cũng có nhược điểm, dữ liệu lớn chiếm lĩnh thị trường nhờ có khối lớn dữ liệu, đồng thời họ cũng đối mật với trách nhiệm lưu trữ lớn.
Vì vậy, chúng ta quay trở lại với các cuộn băng từ.
Gã khổng lồ công nghệ đã lên tiếng, và những doanh nghiệp trong lĩnh vực lưu trữ cần phải thực hiện một số bổ sung thay đổi để hỗ trợ cho việc lưu trữ dữ liệu trực tuyến. Google, NASA và Microsoft đều biết lưu trữ dữ liệu của họ trên các cuộn băng. Mặc dù nhiều người dùng có thể nghĩ rằng tất cả thông tin chỉ trôi nổi, nhưng vẫn có những cơ sở lưu trữ chứa một số dữ liệu quan trọng nhất trên hành tinh. Nhưng quy mô của các cơ sở lưu trữ đang dần tăng lên khi dữ liệu lớn xuất hiện, khiến việc lưu trữ an toàn ngày càng khó khăn.
Tuy nhiên, nhờ vào công nghệ mới, các nhà nghiên cứu từ IBM tại Zurich đã phát hiện ra cách lưu trữ 201 gigabyte dữ liệu trên một inch vuông của cuộn băng. Công nghệ này có nghĩa là không chỉ kích thước của các cơ sở lưu trữ có thể chứa dữ liệu tích lũy, mà còn có thể giảm chi phí lưu trữ chuyển thành lợi nhuận. Lưu trữ ngoại tuyến an toàn có nghĩa là các tập đoàn và thậm chí cả các cá nhân sẽ quyết định sử dụng các cuộn băng từ để lưu trữ dữ liệu, nhằm đảm bảo an toàn thông tin trước các tin tặc và vi rút.
Lưu trữ ngoại tuyến nên tăng tốc
Trí tuệ nhân tạo là trung tâm của dữ liệu lớn. Trong khi công nghệ đã sẵn sàng, cơ sở hạ tầng để hỗ trợ tất cả có vẻ vẫn còn đáng nghi ngờ. Một trong những rào cản lớn nhất cần khắc phục đối với các doanh nghiệp sử dụng dữ liệu này là giảm tắc nghẽn lưu lượng truy cập đến và đi từ đám mây, vì tất cả thông tin này được truy cập trên các nền tảng khác nhau. Mặc dù lưu trữ tạm thời là bắt buộc, nhưng các doanh nghiệp lớn và vừa, và thậm chí các doanh nghiệp nhỏ vẫn sẽ cần nhiều giải pháp lưu trữ bằng phần cứng bao gồm thẻ SD, ổ cứng ngoài và ổ đĩa flash.
Lý do tại sao lưu trữ ngoại tuyến sẽ giảm bớt tắc nghẽn bao gồm: đầu tiên là ít thông tin được lưu trữ trên đám mây, vì nó chỉ có thể truy cập được từ bộ lưu trữ bên ngoài. Thứ hai là những người có thông tin được bảo mật cao có thể đưa nó trở lại đám mây, điều đó có nghĩa là lưu lượng truy cập sẽ giảm đi một lần nữa.
Nơi lưu trữ khả thi sẽ đảm bảo phân tích dữ liệu trong tương lai
Một trong những lý do lớn nhất khiến dữ liệu lớn trải qua một thời gian tạm lắng dù được các tập đoàn công nghệ quan tâm, là do thực tế không có nơi nào để lưu trữ tất cả thông tin này. Ngoài ra, nó cần phải được truy cập để trở nên hữu ích. Hiện nay, chi phí lưu trữ cả trực tuyến và ngoại tuyến đã giảm đáng kể, điều này làm cho việc sử dụng tất cả dữ liệu thu thập được có giá cả phải chăng và hợp lý hơn. Bây giờ, để một công ty chạy phân tích trên các mẫu hành vi trong quá khứ của người tiêu dùng là một bài tập đơn giản và khiến cho việc triển khai phân tích dữ liệu lớn trở nên quan trọng. Lưu trữ cũng rất quan trọng đối với AI, vì AI sẽ không hữu ích trừ khi nó có các luồng dữ liệu để xử lý. Dữ liệu lớn mà không có AI thì chỉ là một khối thông tin và AI không có dữ liệu thì chỉ là một khoản đầu tư vô ích. Do vậy điều quan trọng là cần nơi lưu trữ đủ lớn.
Đối với các doanh nghiệp, việc sử dụng dữ liệu lớn hiện tại và thông tin trong quá khứ sẽ cung cấp cho họ thông tin cần thiết để xây dựng kế hoạch trong thời gian thực cho các bước đi tiếp theo, vì chúng được cung cấp các thông tin phù hợp. Mặc dù một số thông tin yêu cầu phải lưu trữ đám mây, nhưng vẫn có một thị trường lưu trữ ngoại tuyến rất khả thi dường như đang phát triển mạnh mẽ.
Kết luận
Không thể phủ nhận rằng Big Data có tiềm năng lớn và đáng để khám phá. Và trong khi các tập đoàn bắt đầu nắm bắt được khả năng của Big Data, thì nó không có nghĩa là kế hoạch lưu trữ dữ liệu có thể giảm sự quan tâm. Tóm lại, chúng ta tiếp tục tạo ra nhiều dữ liệu hơn thì chúng ta cũng cần đảm bảo rằng chúng tôi đã sẵn sàng sử dụng nó.