DataSphere toàn cầu sẽ đạt 175 Zettabyte vào năm 2025
Diễn đàn - Ngày đăng : 17:05, 03/12/2018
Tỷ lệ tăng trưởng hàng năm đạt 61% này xuất phát từ báo cáo “Dữ liệu 2025” mới nhất của IDC, nơi nó đưa ra nghiên cứu mới nhất về sự tăng trưởng phi thường của dữ liệu và tác động của số hóa trên thế giới xung quanh chúng ta. Con số 175 ZB cao hơn 9% so với dự báo năm 2025 mà IDC đã công bố vào năm ngoái.
Báo cáo mới, được tài trợ bởi nhà sản xuất ổ đĩa cứng Seagate và có thể được truy cập ở đây, chứa một số phát hiện mới về trạng thái dự báo của dữ liệu lớn vào năm 2025, bao gồm:
- Ngành công nghiệp lưu trữ sẽ vận chuyển 42ZB công suất trong bảy năm tới;
- 90 ZB dữ liệu sẽ được tạo trên các thiết bị IoT vào năm 2025;
- 49% dữ liệu sẽ được lưu trữ trong môi trường đám mây công cộng vào năm 2025;
- và gần 30% dữ liệu được tạo ra sẽ được tiêu thụ trong thời gian thực vào năm 2025;
IDC định nghĩa DataSphere là bao gồm ba vị trí. Đầu tiên, đó là "core - lõi", bao gồm các trung tâm dữ liệu truyền thống và đám mây. Sau đó, có " edge - cạnh", bao gồm cơ sở hạ tầng cứng của doanh nghiệp như tháp di động và văn phòng chi nhánh. Cuối cùng, có “endpoint - điểm cuối”, bao gồm máy tính để bàn, điện thoại thông minh và thiết bị IoT.
IDC kiểm tra DataSphere không phân biệt các sự kiện trong vòng đời của một đoạn dữ liệu cụ thể, bao gồm cả khi nó được tạo hoặc được thu thập, khi được sao chép hoặc chuyển giao và khi được sử dụng hoặc xem lần cuối. Vì vậy, cùng một mẩu dữ liệu cơ bản có thể được đếm nhiều lần - hoặc lên tới một triệu lần, như trường hợp của các memes hình mèo phổ biến.
Cố gắng hiểu được nhiều dữ liệu này rõ ràng là vượt ra ngoài khả năng của con người chúng ta. Tuy nhiên, David Reinsel của IDC vẫn cho nó một sự thay đổi.
Reinsel nói trong một video được phát hành với báo cáo chính thức: "Nếu một người có thể lưu trữ 175 ZB dữ liệu vào đĩa BluRay, thì bạn sẽ có một chồng đĩa có thể đưa bạn lên tận mặt trăng - 23 lần. Ngay cả khi bạn có thể tải 175ZB xuống ổ đĩa cứng lớn nhất hiện nay, nó sẽ tiêu thụ 12,5 tỷ ổ đĩa. Và như một ngành công nghiệp, chúng tôi gửi một phần nhỏ trong số đó ngày hôm nay”.
Chúng tôi sử dụng kết hợp các phương tiện khác nhau để lưu trữ DataSphere của ngày hôm nay và cách tiếp cận hỗn hợp đó sẽ tiếp tục trong tương lai. Điều thú vị là, sự pha trộn không được dự báo sẽ thay đổi đáng kể trong những năm tới, mặc dù sự phân bổ sẽ thay đổi một chút.
Theo dự án IDC, chúng tôi sẽ tiếp tục lưu trữ phần lớn dữ liệu trên ổ đĩa cứng truyền thống (HDD), với số lượng ổ đĩa trạng thái rắn (SSD) cũng tăng nhanh. Công nghệ bộ nhớ siêu nhanh NVM-NAND được dự đoán sẽ phát triển nhanh chóng trong những năm tới khi giá có xu hướng giảm xuống, và IDC cũng nhận thấy “NVM-Other” sẽ bắt đầu xuất hiện vào năm 2023.
Ổ đĩa băng thường bị coi là phương tiện lưu trữ cũ, nhưng việc sử dụng chúng thực sự được dự đoán sẽ tăng lên đáng kể vào năm 2025. Bộ nhớ quang học, chẳng hạn như đĩa BlueRay, được dự đoán vẫn giữ nguyên.
Lượng dữ liệu được tạo ra vượt quá khả năng của chúng tôi để lưu trữ dữ liệu. Đó sẽ vẫn là thực tế trong một khoảng thời gian, và nó sẽ tiếp tục diễn biến và thay đổi. Tuy nhiên, vị trí của các kho dữ liệu của chúng tôi được dự báo sẽ trải qua một sự chuyển đổi trong những năm tới.
Theo IDC, đến năm 2024, lượng dữ liệu được lưu trữ trong lõi sẽ gấp đôi số lượng được lưu trữ tại điểm cuối, “hoàn toàn đảo ngược động lực từ năm 2015”, nhóm phân tích viết. "Lưu trữ cạnh cũng sẽ thấy tăng trưởng đáng kể như các dịch vụ và ứng dụng nhạy cảm với độ trễ sinh sôi nảy nở trên toàn thế giới của chúng ta".
Các dịch vụ đám mây công cộng như AWS, Azure và GCP sẽ chiếm tỷ trọng tăng trưởng lưu trữ lớn và phần lớn DataSphere sẽ kết thúc trên đám mây. Vào năm 2020, IDC tin rằng đám mây công cộng sẽ có nhiều dữ liệu được lưu trữ hơn so với các thiết bị tiêu dùng và đến năm 2021, đám mây sẽ có nhiều dữ liệu hơn so với các trung tâm dữ liệu truyền thống.
Sự dịch chuyển sang dữ liệu “thời gian thực” (trái ngược với dữ liệu mô tả điều gì đó đã xảy ra trong quá khứ) là một hiện tượng khác sẽ bắt đầu tăng tốc trong những năm tới. Theo IDC, người dùng trung bình sẽ có gần 5.000 tương tác kỹ thuật số mỗi ngày vào năm 2025, tăng đáng kể từ 700 lên 800 tương tác từ người dùng trung bình hiện nay.
IDC cũng giới thiệu một khái niệm với tên gọi là Chỉ số điều kiện sẵn sàng dữ liệu (Data Readiness Condition Index), hoặc DATCON, sẽ đề cập đến vấn đề của loạt DataSphere. Các tổ chức được định vị tốt trên các số liệu khác nhau cho việc số hóa các ngành, doanh nghiệp và xã hội sẽ được coi là “tối ưu hóa” và sẽ xếp hạng 5 điểm cao nhất trong chỉ mục, trong khi một tổ chức phần lớn không có sự chuẩn bị sẽ được đánh giá "tiêu cực" và sẽ chỉ ghi được 1 điểm.
Cảnh quan dữ liệu mới nổi và thay đổi cực kỳ nhanh chóng. IDC cung cấp một số hiểu biết sâu sắc về cách tổ chức có thể theo kịp với những thay đổi này.
IDC kết luận: "Các công ty tìm kiếm có liên quan từ nay đến năm 2025 sẽ cần hiểu vai trò của dữ liệu trong tổ chức của họ và cách mà Datasphere sẽ phát triển trong thời gian đó. Họ sẽ cần phải nắm lấy vai trò của mình như là người bảo vệ dữ liệu, tận dụng đám mây và tiếp cận toàn cầu đến dữ liệu của họ. Các ngành công nghiệp khác nhau có mức độ trưởng thành dữ liệu khác nhau, vì vậy các công ty nên xem xét báo cáo chỉ số IDC DATCON để biết họ đứng ở đâu so với chỉ số ngành và những gì họ cần làm để không chỉ tồn tại - mà quan trọng hơn là phát triển - trong Datasphere của riêng họ”.