Điều gì đang thúc đẩy sự bùng nổ của kho dữ liệu đám mây

Thùy Linh, Trương Khánh Hợp| 12/11/2018 20:02
Theo dõi ICTVietnam trên

Sự ra đời của những nhà kho dữ liệu mạnh mẽ trên đám mây đang thay đổi bộ mặt của phân tích dữ liệu lớn khi các công ty di chuyển khối lượng công việc của họ vào đám mây. Theo các nhà phân tích và giám đốc điều hành đám mây, hiện tượng này đang tăng tốc, phần lớn nhờ vào tiềm năng tiết kiệm chi phí, khả năng phân tích các tập dữ liệu lớn và loại bỏ những rắc rối trong việc quản lý các cụm được cài đặt tại doanh nghiệp.

Kết quả hình ảnh cho What’s Driving the Cloud Data Warehouse Explosion

Dịch vụ web Amazon (Amazon Web Services-AWS) được đa số công nhận là người khởi động làn sóng lưu trữ dữ liệu đám mây (Cloud Data Warehousing-CDW) với Redshift. Kể từ khi tung ra nó vào năm 2012, AWS đã thu hút 6.500 khách hàng đến Redshift và vẫn duy trì vị trí đứng đầu nhờ vào sự tích hợp với danh mục dịch vụ đa dạng của AWS, theo một báo cáo của Forrester về CDW được phát hành tuần trước.

Nhưng AWS Redshift đang phải đối mặt với cạnh tranh gay gắt, theo báo cáo của Forrester, xác định tổng cộng có 14 nhà cung cấp trong lĩnh vực CDW. Những đối thủ trong tầm bắn của AWS bao gồm Google Cloud, Snowflake và Oracle, những công ty cũng được Forrester xác định là các nhà lãnh đạo CDW trong báo cáo của mình.

Snowflake, kêu gọi thành công 450 triệu đô la đầu tư liên doanh vào tháng trước, đã phát triển nhanh chóng nhờ vào tính dễ sử dụng, hiệu suất cao và chi phí thấp cho việc cung cấp dựa trên SQL của mình. Trong khi đó, BigQuery của Google Cloud nổi bật với tích hợp AI và các dịch vụ dữ liệu khác. Oracle góp tên vào danh sách những nhà lãnh đạo CDW của Forrester nhờ vào kho dữ liệu tự động mới của mình (Autonomous Data Warehouse-ADW).

Dễ sử dụng là một trong những nhân tố thúc đẩy lớn nhất của CDW, theo nhà phân tích hàng đầu của Forrester, Noel Yuhanna. “Bạn có thể cung cấp kho dữ liệu trên đám mây chỉ trong vài phút mà không cần yêu cầu bất kỳ chuyên môn kỹ thuật nào, cho phép các nhà phân tích kinh doanh và những người dùng không có nền tảng kỹ thuật khác truy cập, lưu trữ và xử lý một lượng lớn dữ liệu để cho ra những thông tin chi tiết sâu sắc”.

Mặc dù những người sử dụng CDW sớm hầu hết là các công ty nhỏ và các công ty kỹ thuật số, nhưng các tổ chức được thành lập lâu đời cũng đang có xu hướng chuyển kho dữ liệu tại chỗ của họ sang đám mây. Một số khách hàng chuyển kho dữ liệu tại chỗ hoặc cụm Hadoop sang CDW cho biết họ đã tiết kiệm được hàng triệu đô la mỗi năm.

Yuhanna viết: “Hầu hết các tổ chức đều tiết kiệm được ít nhất 20% so với kho dữ liệu tại chỗ, một số tổ chức tiết kiệm được 70% đến 80% khi triển khai giải pháp CDW”. Ngoài ra, nhiều giải pháp CDW cung cấp khả năng tách tính toán khỏi lưu trữ, cho phép các tổ chức chỉ phải chi trả cho mức tiêu thụ tài nguyên thực tế, giúp tiết kiệm tiền. ”

Khả năng hỗ trợ một loạt các loại dữ liệu đa dạng là một đặc điểm khiến cho CDW được ưu thích hơn so với kho dữ liệu truyền thống, theo Forrester. “Kho dữ liệu truyền thống không xử lý được dữ liệu IoT”, Yuhanna viết. “Tuy nhiên, CDW cung cấp khả năng lưu trữ, xử lý và truy cập một cách hiệu quả khối lượng lớn dữ liệu IoT từ các cảm biến và thiết bị.”

Google Cloud cũng đạt được tăng trưởng khách hàng ấn tượng với BigQuery ra mắt vào năm 2011. Nhà cung cấp cho biết, từ năm 2016 đến 2017, lượng dữ liệu được lưu trữ trong BigQuery tăng gấp đôi trong khi tổng mức sử dụng Google Cloud tăng gấp 4 lần. "Chúng tôi thấy rất nhiều động lực với việc khách hàng tiếp nhận mọi thứ chúng tôi đang làm", Sudhir Hasbe, giám đốc quản lý sản phẩm cho phân tích dữ liệu tại Google Cloud cho biết.

Google đã chia sẻ một số con số khổng lồ với Datanami về quy mô khách hàng của BigQuery. Môi trường BigQuery lớn nhất có 62PB và tỷ lệ tiêu thụ cao nhất cho một khách hàng là 4,5 triệu hàng mỗi giây. Truy vấn lớn nhất liên quan đến 5PB và BigQuery quét 23 nghìn tỷ hàng dữ liệu cho một truy vấn.

Công ty đang thu hút các công ty đã đầu tư rất nhiều thời gian và tiền bạc vào Hadoop. King, công ty đứng sau Candy Crush, điều hành một trong những cụm Hadoop lớn nhất ở châu Âu, theo Hasbe. Tuy nhiên, thách thức với Hadoop đã khiến công ty đầu tư vào BigQuery.

Hasbe nói: “Họ đã nhìn vào những thách thức mà họ phải đối mặt từ việc quản lý và mở rộng quy mô các cụm, đặc biệt là khi các trò chơi mới được ra mắt”. "Đó là một vấn đề lớn đối với họ."

King hiện đang đẩy 50 tỷ sự kiện mỗi ngày vào môi trường BigQuery, hay 18 nghìn tỷ hàng dữ liệu vào CDW, Hasbe nói. Các dữ liệu được phân tích bằng cách sử dụng phần mềm từ AtScale, ông nói.

Twitter là một “cửa hàng” Hadoop lớn đang hoạt động với BigQuery. Hasbe cho biết: “Họ có một trong những cụm Hadoop lớn nhất trên thế giới, hơn 300PB với hàng chục nghìn lõi."Họ đang sử dụng cơ sở hạ tầng cốt lõi cũng như BigQuery để phân tích cho các trường hợp sử dụng đó".

Không chỉ có các công ty kỹ thuật số chuyển sang BigQuery, Hasbe đã trích dẫn quyết định của Home Depot về việc chuyển một số khối lượng công việc phân tích từ Teradata sang BigQuery (Teradata cũng là một nhà cung cấp CDW lớn theo đánh giá của Forrester).

Ngân hàng HSBC có trụ sở ở Luân Đôn đang chuyển các phân tích rủi ro và hoạt động chống rửa tiền từ các cụm Hadoop tại chỗ sang BigQuery. “Bạn muốn thực hiện quy trình và phân tích quy mô lớn, nhưng làm việc đó tại chỗ với các cụm Hadoop có khả năng tính toán quy mô lớn là thực sự lãng phí vì hầu hết thời gian bạn sẽ không sử dụng cơ sở hạ tầng đó để phân tích. Vì vậy, họ đã chuyển sang nền tảng Google Cloud. ”

Nếu khoản tiết kiệm được duy trì, chúng ta sẽ thấy nhiều công ty truyền thống hơn di chuyển vào đám mây, đặc biệt nếu họ có thể chuyển những khoản tiết kiệm này thành phân tích dữ liệu lớn hơn.

"Điều quan trọng là, khi bạn lưu trữ tại chỗ ... bạn phải liên tục suy nghĩ làm thế nào để giảm kích thước của dữ liệu để không phải trả rất nhiều tiền cho cơ sở hạ tầng đó từ góc độ chi phí," ông nói. "Vì vậy, những thứ mà khách hàng chỉ có thể lưu trữ sáu tuần hoặc 12 tuần hay 3 tháng – giờ đây họ có thể lưu trữ nó mãi mãi."

Nổi bật Tạp chí Thông tin & Truyền thông
  • Bộ TT&TT đẩy mạnh ứng dụng AI hẹp
    Bộ trưởng Bộ TT&TT Nguyễn Mạnh Hùng nhấn mạnh trí tuệ nhân tạo (AI) đã vào giai đoạn ứng dụng rộng rãi. Trong quý 2 này, Bộ TT&TT sẽ đưa ra một số ứng dụng mẫu để các cơ quan nhà nước có thể áp dụng rộng rãi.
  • Giải pháp nào cho tổ chức, DN trước tấn công ransomware gia tăng?
    Ngoài việc lên kế hoạch cho các giải pháp phát hiện và phòng chống, các tổ chức và doanh nghiệp (DN) cần lên kế hoạch và giải pháp khôi phục lại dữ liệu trong tình huống tội phạm mạng tấn công và vượt qua tất cả các hàng rào bảo mật và phá hủy hoàn toàn hệ thống.
  • Bia Trúc Bạch kiệt tác chinh phục đỉnh cao
    Khám phá một kiệt tác, một di sản dẫn lối tinh hoa. Hoa Bia Saaz quý tộc vùng Zatec một kinh nghiệm bậc thầy tạo ra hương vị tinh túy bậc nhất đẳng cấp vượt thời gian, trải nghiệm đỉnh cao hoàn mỹ. Bia Trúc Bạch kiệt tác chinh phục đỉnh cao
  • Lan tỏa kinh nghiệm, mô hình CĐS cho các cơ quan báo chí
    Trong quý I-2024, Bộ Thông tin và Truyền thông (TT&TT) tiếp tục tăng cường thực hiện công tác đấu tranh, ngăn chặn thông tin xấu độc trên mạng xã hội (MXH) xuyên biên giới.
  • Tam Đảo - điểm đến cho một không gian âm nhạc riêng
    Từng được mệnh danh là “Hòn Ngọc Đông Dương” - Tam Đảo luôn khiến những kẻ lãng du nao lòng bởi không gian bảng lảng sương mù lẩn khuất giữa những kiến trúc biệt thự tráng lệ. Và còn gì quyến rũ hơn, khi giữa không gian ấy lại được đắm mình trong những giai điệu trữ tình, ngọt ngào sâu lắng.
Đừng bỏ lỡ
  • Alibaba sẽ xây dựng trung tâm dữ liệu tại Việt Nam
    Trong thời gian chờ xây dựng, tập đoàn công nghệ Trung Quốc thuê không gian máy chủ từ các công ty viễn thông của Việt Nam.
  • CMC hợp tác cùng NVIDIA đưa TP. HCM trở thành trung tâm AI của cả nước
    Mới đây, tại Tổ hợp không gian sáng tạo CMC TP.HCM CCS, Chủ tịch Tập đoàn CMC Nguyễn Trung Chính đã có cuộc gặp với lãnh đạo của Tập đoàn NVIDIA nhằm tăng cường hợp tác chiến lược toàn diện của hai doanh nghiệp (DN).
  • Khai thác dữ liệu phục vụ chỉ đạo, điều hành tại trung tâm IOC: Kinh nghiệm của Bình Phước
    Xác định dữ liệu là nguồn tài nguyên quý trong kỷ nguyên số - một trong những yếu tố quan trọng quyết định sự thành công của quá trình chuyển đổi số (CĐS), tỉnh Bình Phước đã sớm tập trung quan tâm tạo lập, khai thác, sử dụng, tăng cường chia sẻ, kết nối dữ liệu số cùng với việc thành lập IOC và những kết quả bước đầu thu được rất đáng ghi nhận.
  • Hiệu quả thiết thực từ mô hình tiếp công dân trực tuyến
    Với sự phát triển của công nghệ truyền thông, họp trực tuyến, xét xử trực tuyến, tiếp công dân trực tuyến cũng đã được một số địa phương áp dụng. Việc tiếp công dân trực tuyến phần nào mang lại hiệu quả thiết thực so với tiếp công dân trực tiếp.
  • Nhà báo phát thanh trước yêu cầu chuyển đổi số
    Nhà báo phát thanh trong kỷ nguyên số cần hội đủ những kỹ năng cơ bản.
  • Tuyên Quang: Tăng cường các giải pháp chuyển đổi số báo chí
    Các chi hội nhà báo tại tỉnh Tuyên Quang đã đẩy mạnh công tác chuyển đổi số (CĐS) báo chí với nhiều giải pháp từ ứng dụng công nghệ mới vào sản xuất tin bài; duy trì hiệu quả chuyên mục “Chuyển đổi số” cho tới phát triển tác phẩm báo chí số.
  • 5 cách để nâng cao bảo mật khi sử dụng trình duyệt Chrome
    Trình duyệt Chrome đang được rất nhiều người tin dùng bởi độ ổn định và khả năng bảo mật. Tuy nhiên, sự phổ biến này cũng khiến nó trở thành mục tiêu của tin tặc.
  • Mỹ phạt nhà mạng vì chia sẻ vị trí của người dùng
    Chính phủ Mỹ đã đưa ra mức phạt hàng triệu USD đối với các nhà mạng AT&T, Sprint, T-Mobile và Verizon sau một cuộc điều tra cho thấy các nhà mạng lớn của nước này đã chia sẻ bất hợp pháp dữ liệu cá nhân của thuê bao mà không có sự đồng ý của họ.
  • Các công cụ bảo mật đám mây dựa trên AI
    Ngày nay, AI tiên tiến đang được đưa vào sử dụng ở mọi loại hình doanh nghiệp (AI). Một loạt các nhà cung cấp bảo mật bên thứ ba đã phát hành các công cụ bảo mật đám mây dưới sự hỗ trợ của AI. Dường như đây là một trong những xu hướng nóng nhất trong ngành.
  • Những người làm báo từ rừng về phố
    Ngày 30/4/1975, trong những cánh Giải phóng quân từ khắp nẻo tiến về Sài Gòn, có cả một đội quân nhà báo xuất phát từ các chiến khu hoặc hành quân theo các binh chủng, đã kịp thời có mặt, chứng kiến giây phút trọng đại: Giải phóng hoàn toàn miền nam, thống nhất đất nước.
Điều gì đang thúc đẩy sự bùng nổ của kho dữ liệu đám mây
POWERED BY ONECMS - A PRODUCT OF NEKO