Chuyển động ICT

Dữ liệu dưới dạng dịch vụ DaaS - Nền tảng cho các hệ thống AI

Hoài Bắc 10/02/2025 06:30

Không hề phóng đại khi cho rằng có một cơn sốt vàng thời hiện đại đang diễn ra trong quá trình phát triển trí tuệ nhân tạo (AI). Theo Chỉ số xu hướng công việc năm 2024 của Microsoft và Linkedin, hơn 40% các nhà lãnh đạo doanh nghiệp dự đoán sẽ thiết kế lại hoàn toàn các quy trình kinh doanh của họ bằng cách sử dụng AI trong vài năm tới.

Tóm tắt:
- Sự phát triển nhanh chóng của AI làm tăng nhu cầu về dữ liệu chất lượng cao, nhưng cũng đặt ra thách thức về: chất lượng, sở hữu trí tuệ, và đạo đức trong xử lý dữ liệu, đặc biệt khi nội dung do AI tạo ra vượt xa nội dung con người tạo ra.
- Dữ liệu xấu (không đầy đủ, không chính xác) gây ảnh hưởng nghiêm trọng đến độ chính xác, làm khuếch đại thiên kiến, và tăng chi phí vận hành các mô hình AI.
- Trong bối cảnh này, dữ liệu đáng tin cậy từ bên thứ nhất trở nên cực kỳ quan trọng để duy trì hiệu quả và tính bền vững của AI.
- Dữ liệu dưới dạng Dịch vụ (DaaS) là mô hình cung cấp dữ liệu theo yêu cầu thông qua đám mây, giúp truy cập nhanh chóng, tiết kiệm chi phí, hỗ trợ AI, và tối ưu hóa dữ liệu.
- DaaS tăng cường ra quyết định dựa trên dữ liệu, loại bỏ các rào cản về cơ sở hạ tầng, và thúc đẩy hợp tác trong tổ chức.
- Kiến trúc DaaS bao gồm các bước: thu thập dữ liệu từ nhiều nguồn, chuyển đổi dữ liệu để dễ sử dụng, phân phối qua hệ thống đám mây, và cung cấp truy cập linh hoạt.
- DaaS hỗ trợ phân tích, trí tuệ kinh doanh, và tối ưu hóa dữ liệu, nhưng gặp thách thức về quyền riêng tư, quản trị và xử lý dữ liệu. Nó giúp doanh nghiệp tận dụng dữ liệu sạch, chính xác để thúc đẩy AI và đổi mới, đồng thời yêu cầu quản lý dữ liệu chặt chẽ để đảm bảo hiệu quả và an toàn.
- Với tiềm năng lớn, DaaS dự kiến sẽ trở thành trọng tâm trong phân tích và dữ liệu lớn trong tương lai.

Sự thay đổi lớn này không chỉ là một bản nâng cấp công nghệ, mà còn là sự chuyển đổi cơ bản về cách thức các doanh nghiệp (DN) vận hành, đưa ra quyết định và tương tác với khách hàng.

Nhu cầu cấp bách khi AI phát triển quá nhanh

Sự phát triển nhanh chóng của AI đang thúc đẩy nhu cầu về dữ liệu và các công cụ quản lý dữ liệu của bên thứ nhất. Theo Forrester, có tới 92% các nhà lãnh đạo công nghệ đang có kế hoạch tăng ngân sách quản lý dữ liệu và AI của họ vào năm 2024.

Chúng ta đang nhanh chóng tiến đến một “điểm bùng phát” – nơi mà nội dung không phải do con người tạo ra sẽ vượt xa số lượng nội dung do con người tạo ra. Những tiến bộ trong bản thân AI đang cung cấp các công cụ mới để làm sạch và xác thực dữ liệu. Tuy nhiên, số lượng lớn nội dung do AI tạo ra trên web đang tăng theo cấp số nhân.

Sự gia tăng của nội dung do AI tạo ra tạo ra một số thách thức lớn cho ngành:

- Kiểm soát chất lượng: Việc phân biệt giữa dữ liệu do con người tạo ra và dữ liệu do AI tạo ra ngày càng khó khăn, khiến việc đảm bảo chất lượng và độ tin cậy của dữ liệu được sử dụng để đào tạo các mô hình AI trở nên khó khăn hơn.

- Mối quan ngại về sở hữu trí tuệ (SHTT): Khi các mô hình AI vô tình thu thập và học hỏi từ nội dung do AI tạo ra, các câu hỏi sẽ phát sinh về quyền sở hữu và các quyền liên quan đến dữ liệu, có khả năng dẫn đến các vấn đề pháp lý phức tạp.

- Hệ quả về mặt đạo đức: Việc thiếu minh bạch về nguồn gốc dữ liệu có thể dẫn đến các vấn đề về đạo đức, chẳng hạn như lan truyền thông tin sai lệch hoặc củng cố thành kiến.

Dữ liệu xấu

Trong Khảo sát toàn cầu mới nhất của McKinsey về AI, 65% số người được hỏi cho biết tổ chức của họ thường xuyên sử dụng công nghệ AI tạo sinh. Mặc dù việc áp dụng này biểu thị một bước tiến đáng kể, nhưng nó cũng nêu bật một thách thức quan trọng: chất lượng dữ liệu cung cấp cho các hệ thống AI. Trong một ngành mà AI hiệu quả chỉ tốt bằng dữ liệu mà nó được đào tạo, dữ liệu đáng tin cậy và chính xác ngày càng trở nên khó có được.

Dữ liệu xấu không phải là vấn đề mới, nhưng tác động của nó được phóng đại trong thời đại AI. Quay trở lại năm 2017, một nghiên cứu của Viện Công nghệ Massachusetts (MIT) ước tính rằng dữ liệu xấu khiến các công ty mất 15% đến 25% doanh thu. Năm 2021, Gartner ước tính rằng dữ liệu xấu khiến các tổ chức mất trung bình 12,9 triệu USD một năm.

Dữ liệu xấu - dữ liệu không đầy đủ, không chính xác hoặc không nhất quán - có thể có tác động lan tỏa đến các hệ thống AI. Khi các mô hình AI được đào tạo trên dữ liệu chất lượng kém, các thông tin chi tiết và dự đoán thu được về cơ bản là sai sót. Điều này không chỉ làm suy yếu hiệu quả của cá cứng dụng AI mà còn gây ra rủi ro đáng kể cho các DN dựa vào các công nghệ này để đưa ra các quyết định quan trọng.

Điều này đang gây nhiều khó khăn cho các nhóm khoa học dữ liệu của công ty, những người phải tập trung ngày càng nhiều nguồn lực hạn chế của mình vào việc dọn dẹp và sắp xếp dữ liệu. Trong báo cáo về tình hình kỹ thuật gần đây do DBT thực hiện, 57% chuyên gia khoa học dữ liệu đã nêu chất lượng dữ liệu kém là vấn đề chủ yếu trong công việc của họ.

Những tác động của dữ liệu xấu lên các mô hình AI

Tác động của dữ liệu xấu đến việc phát triển các hệ thống AI thể hiện theo ba cách chính:

1. Giảm độ chính xác và độ tin cậy: Các mô hình AI phát triển mạnh dựa trên các mẫu và mối tương quan có được từ dữ liệu. Khi dữ liệu đầu vào bị ô nhiễm, các mô hình tạo ra các đầu ra không đáng tin cậy, được biết đến rộng rãi là “ảo giác AI”. Điều này có thể dẫn đến các chiến lược sai lầm, sản phẩm thất bại và mất lòng tin của khách hàng.

2. Sự khuếch đại thiên vị: Dữ liệu xấu thường chứa các thiên vị, khi không được kiểm tra, sẽ ăn sâu vào các thuật toán AI. Điều này có thể dẫn đến các hành vi phân biệt đối xử, đặc biệt là trong các lĩnh vực nhạy cảm như tuyển dụng, cho vay và thực thi pháp luật. Ví dụ, nếu một công cụ tuyển dụng AI được đào tạo trên dữ liệu tuyển dụng lịch sử thiên vị, nó có thể thiên vị một số nhóm nhân khẩu học nhất định hơn những nhóm khác một cách không công bằng.

3. Chi phí vận hành tăng: Các hệ thống AI bị lỗi đòi hỏi phải liên tục điều chỉnh và đào tạo lại, điều này tiêu tốn thêm thời gian và nguồn lực. Các công ty có thể thấy mình đang trong chu kỳ sửa lỗi liên tục thay vì đổi mới và cải thiện.

Khi ngày càng nhiều nội dung do AI tạo ra được đưa lên web và nội dung đó được tạo ra bởi các LLM được đào tạo về nội dung do AI tạo ra, chúng ta phải hướng tới một tương lai mà dữ liệu của bên thứ nhất và đáng tin cậy sẽ trở thành hàng hóa có giá trị.

daas.png

Dữ liệu dưới dạng dịch vụ trở thành nền tảng cơ bản

Ngày càng có nhiều giải pháp dữ liệu dưới dạng dịch vụ (DaaS) được tìm kiếm để bổ sung và nâng cao dữ liệu của bên thứ nhất cho mục đích đào tạo. DaaS xây dựng trên khái niệm rằng sản phẩm dữ liệu của nó có thể được cung cấp cho người dùng theo yêu cầu, bất kể sự tách biệt về mặt địa lý hoặc tổ chức giữa nhà cung cấp và người tiêu dùng. Kiến trúc hướng dịch vụ (SOA) và việc sử dụng rộng rãi API đã khiến nền tảng mà dữ liệu lưu trú trở nên không liên quan.

Lợi ích của DaaS: Các tổ chức đang quá tải dữ liệu; quá nhiều đến nỗi các cơ hội bị mất vì họ không thể truy cập đúng dữ liệu, các giao thức bảo mật khó tiếp cận hoặc dữ liệu trở nên lỗi thời trước khi có thể sử dụng. DaaS có tiềm năng loại bỏ những thách thức này, cho phép các tổ chức có được giá trị thực sự từ dữ liệu của họ.

Tốc độ: Bằng cách cung cấp quyền truy cập dữ liệu theo thời gian thực, DaaS có thể tăng cường khả năng phản ứng nhanh chóng của công ty với những thay đổi của thị trường và cơ hội kinh doanh.

Việc di chuyển dữ liệu giữa các nền tảng và hệ thống khác nhau có thể khiến việc truy cập dữ liệu bị trì hoãn và làm giảm năng suất do thời gian ngừng hoạt động của máy chủ. DaaS cung cấp tính linh hoạt cho các tổ chức triển khai các dự án chuyển đổi kỹ thuật số hoặc nâng cấp lên công nghệ mới mà không bị khóa chặt bởi các hệ thống dữ liệu cũ.

Tăng trưởng doanh thu: DaaS cho phép xác định các xu hướng và cơ hội tiềm ẩn trong dữ liệu thị trường, tạo ra các nguồn doanh thu mới và thúc đẩy tăng trưởng kinh doanh với sự sắp xếp dữ liệu phù hợp. DaaS dân chủ hóa quyền truy cập dữ liệu và khuyến khích các nhóm cộng tác bằng cách chia sẻ thông tin chi tiết từ các phân tích dữ liệu, bất kể họ ở đâu. Điều này phá vỡ các rào cản, trao cho các nhóm quyền tự chủ để giải quyết các thách thức và đổi mới các giải pháp mới.

Hiểu sâu hơn về hồ sơ khách hàng lý tưởng: Với DaaS, DN sẽ có được bức tranh rõ ràng hơn dựa trên dữ liệu về thói quen và sở thích của khách hàng lý tưởng, nâng cao khả năng tùy chỉnh sản phẩm và dịch vụ.

Hoạt động tiết kiệm chi phí: DaaS loại bỏ nhu cầu về cơ sở hạ tầng lưu trữ và quản lý dữ liệu tốn kém, giải phóng các nguồn lực có thể được sử dụng tốt hơn ở những nơi khác trong DN.

Ra quyết định dựa trên dữ liệu: Bằng cách cung cấp dữ liệu chính xác và kịp thời, DaaS tạo nền tảng cho các quyết định hợp lý dựa trên dữ liệu giúp công ty tiến tới thành công.

AI, học máy và mô hình dự đoán: Dữ liệu chính xác do các dịch vụ DaaS cung cấp là yếu tố sống còn của các hệ thống AI và học máy, cho phép đưa ra những dự đoán chính xác hơn và các quy trình tự động thông minh hơn.

Các dự án AI tạo sinh đặc biệt phụ thuộc vào khối lượng lớn dữ liệu đáng tin cậy, chất lượng cao trong các ứng dụng B2B - nếu không có dữ liệu chất lượng, các ứng dụng AI tạo sinh có thể nhanh chóng đi chệch hướng và “ảo tưởng” ra kết quả có nguy cơ khiến lỗi lan rộng hơn và nhanh hơn cả lỗi của con người.

Dữ liệu chất lượng cao mọi lúc, mọi nơi: Các nhà cung cấp DaaS chuyên cung cấp dữ liệu sạch, có cấu trúc tốt, giúp DN tiết kiệm thời gian cho công việc chuẩn bị và dọn dẹp dữ liệu.

Thời gian chết là một khái niệm mà các nhà lãnh đạo tổ chức dựa trên dữ liệu phải rùng mình khi nghĩ đến. Đối với quản lý dữ liệu truyền thống, nếu một máy chủ ngừng hoạt động hoặc cần bảo trì, khả năng thu thập và sử dụng dữ liệu sẽ dừng lại. DaaS giải quyết vấn đề này vì việc truy cập dữ liệu không phụ thuộc vào trạng thái hoạt động của một máy chủ duy nhất. Máy chủ đám mây hoạt động dự phòng, do đó, khi một máy chủ ngừng hoạt động, các máy chủ khác có thể thay thế.

Giá trị thực sự của DaaS là bản thân dữ liệu đã được chuẩn hóa, làm sạch và đánh giá cho các trường hợp sử dụng ứng dụng thương mại và độ trung thực khác nhau, cũng như chuẩn hóa các quy trình để phù hợp với Hệ thống xử lý dữ liệu.

Theo chu kỳ cường điệu của Gartner, DaaS vẫn còn 5 - 10 năm nữa mới đạt đến đỉnh cao hiệu suất. Dự kiến DaaS sẽ có tác động lớn hơn hầu hết các tiến bộ liên quan đến dữ liệu khác vì DaaS có tiềm năng trở thành trung tâm của phân tích/dữ liệu lớn.

chu-ky-cuong-dieu-cua-gartner.png
Chu kỳ cường điệu của Gartner

Các nhà cung cấp Dữ liệu dưới dạng Dịch vụ (DaaS) cung cấp dữ liệu theo yêu cầu cho người dùng thông qua giao diện m2m (máy với máy). Có 2 hình thức dịch vụ DaaS:

1. Nhà cung cấp DaaS: Một công ty cung cấp dữ liệu theo yêu cầu cho một công ty khác thông qua giao diện m2m

2. Nhà cung cấp công nghệ cho nhà cung cấp DaaS: Nhà cung cấp công nghệ cho phép một công ty khác cung cấp dữ liệu của mình dưới dạng dịch vụ. DaaS có thể được cung cấp cho các công ty khác hoặc được sử dụng nội bộ

Ở cả hai dạng, DaaS là một chiến lược quản lý dữ liệu đám mây cung cấp khả năng truy cập dữ liệu từ nhiều nguồn khác nhau để thúc đẩy các ứng dụng và hệ thống kỹ thuật số mới. DaaS loại bỏ nhu cầu cài đặt và quản lý phần mềm tại chỗ; cho phép các tổ chức thuê ngoài dịch vụ lưu trữ, tích hợp, xử lý và phân tích dữ liệu trên đám mây.

Tầm quan trọng ngày càng tăng của dữ liệu và phân tích đang thúc đẩy tầm quan trọng của dữ liệu dưới dạng dịch vụ. Các dịch vụ DaaS bên ngoài cho phép các công ty dễ dàng truy cập dữ liệu bên ngoài. Các dịch vụ DaaS nội bộ giúp các công ty dễ dàng dân chủ hóa phân tích và trao quyền cho người dùng doanh nghiệp của họ.

Kiến trúc dữ liệu dưới dạng dịch vụ

Dữ liệu trong giải pháp DaaS thông thường trải qua nhiều giai đoạn, từ khi thu thập ban đầu cho đến khi người dùng cuối sử dụng. Sau đây là phân tích chi tiết từng bước trong hành trình:

1. Thu thập dữ liệu: Bước đầu tiên này bao gồm việc thu thập dữ liệu từ nhiều nguồn khác nhau, như cơ sở dữ liệu công cộng, thiết bị IoT (Internet vạn vật), nền tảng truyền thông xã hội, hệ thống DN, v.v. Việc tạo ra một tập dữ liệu toàn diện là rất quan trọng để phục vụ các nhu cầu khác nhau của người dùng cuối. Các nhà cung cấp DaaS sử dụng các công nghệ và phương pháp tiên tiến để tạo ra một phổ rộng các loại dữ liệu cung cấp nền tảng dữ liệu thô vững chắc, sẵn sàng để xử lý thêm.

2. Chuyển đổi dữ liệu: Chuyển đổi làm cho dữ liệu dễ tiếp cận và có ý nghĩa hơn, chuẩn bị dữ liệu cho phân tích và ứng dụng. Sau khi dữ liệu được thu thập, dữ liệu cần được làm sạch bằng cách loại bỏ các điểm không chính xác hoặc trùng lặp, chuẩn hóa theo các định dạng chuẩn hóa và làm giàu bằng ngữ cảnh hoặc thông tin bổ sung.

3. Phân phối và quản lý dữ liệu: Bước tiếp theo bao gồm lưu trữ dữ liệu đã chuyển đổi trong các hệ thống dựa trên đám mây để người dùng có thể truy cập. Các nền tảng DaaS sử dụng các hệ thống quản lý dữ liệu tinh vi để sắp xếp, lập chỉ mục và bảo mật dữ liệu; đồng thời triển khai kiểm soát truy cập và giám sát việc sử dụng để đảm bảo an ninh dữ liệu và tuân thủ các quy định.

4. Truy cập và sử dụng dữ liệu: Bước cuối cùng trong hành trình là nơi dữ liệu đã sẵn sàng để người dùng truy cập và sử dụng. Tùy thuộc vào dịch vụ của nhà cung cấp DaaS, họ có thể truy cập dữ liệu thông qua API, cổng thông tin web hoặc nguồn cấp dữ liệu trực tiếp. Giai đoạn này tập trung vào việc làm cho việc sử dụng dữ liệu trở nên liền mạch, cho phép người dùng tích hợp dữ liệu vào ứng dụng, công cụ phân tích hoặc quy trình ra quyết định của họ.

nen-tang-daas.png
Nền tảng DaaS

Hành trình này nhấn mạnh giá trị đề xuất của DaaS: tóm tắt sự phức tạp của quản lý dữ liệu, cung cấp cho DN quyền truy cập sẵn sàng vào dữ liệu khi họ cần dưới dạng sẵn sàng sử dụng. DaaS xử lý phần việc phức tạp nhất trong quy trình quản lý dữ liệu, cho phép các tổ chức tập trung vào việc tận dụng dữ liệu để thúc đẩy kinh doanh.

DaaS là một cấu trúc kiến trúc chứ không phải là một công nghệ của một nhà cung cấp duy nhất. Do đó, nó cung cấp nhiều cách khác nhau để phân phối, thu thập và xử lý dữ liệu từ nhiều nguồn khác nhau ở nhiều định dạng khác nhau. Các công nghệ nằm trong danh mục DaaS là:

- Giải pháp quản lý vòng đời thông tin
- Mô hình hóa dữ liệu/chất lượng/sao chép/chuyển đổi - Quản lý nội dung

Mặc dù các nền tảng DaaS thường có phương pháp định giá theo khối lượng, một số nhà cung cấp cũng có thể cung cấp dịch vụ đăng ký theo loại dữ liệu.

Các trường hợp sử dụng

Đánh giá chuẩn

Dữ liệu dưới dạng dịch vụ là một công cụ hữu ích khi bạn muốn so sánh hiệu suất của tổ chức mình với các đối thủ. Với DaaS, các tổ chức có thể truy cập dữ liệu toàn cầu và tạo báo cáo chuẩn, có thể bao gồm hiệu suất tài chính, doanh thu, hiệu quả lãnh đạo với sự phân tích phần trăm.

Thị trường dữ liệu

Việc tìm đúng dữ liệu một cách nhanh chóng là điều cần thiết trong thời đại phân tích tự phục vụ (Self-service Analytics). Các nhà khoa học dữ liệu có thể không có khả năng hiển thị đầy đủ các tập dữ liệu có sẵn, nội dung và chất lượng của các tập dữ liệu này. Thị trường dữ liệu cung cấp cho người tìm kiếm dữ liệu các dịch vụ cần thiết để tìm các tập dữ liệu và đánh giá mức độ phù hợp của chúng bằng cách đọc các đánh giá của người khác. Các nền tảng này làm cho các tập dữ liệu có thể tái sử dụng cho đối tượng mới.

Trí tuệ kinh doanh

Các công ty có thể cung cấp dữ liệu của họ như một dịch vụ cho người dùng nội bộ để tạo điều kiện cho trí tuệ kinh doanh. DaaS hợp lý hóa việc chuẩn hóa dữ liệu, thống nhất các nguồn dữ liệu khác nhau, ảo hóa dữ liệu và tự động hóa phân tích. Các nhà khoa học dữ liệu có thể truy cập dữ liệu theo thời gian thực để có thể thực hiện bất kỳ chuyển đổi và tích hợp dữ liệu cần thiết nào một cách năng động và diễn giải dữ liệu để đưa ra quyết định.

Các nghiên cứu điển hình

- Công ty khởi nghiệp AI, AMPLYFI, cần thu thập và xử lý một lượng lớn dữ liệu trực tuyến cho máy học. Tuy nhiên, một giải pháp nội bộ ở quy mô DN sẽ khó đạt được. Họ đã hợp tác với BrightPlanet để giải quyết vấn đề bằng giải pháp DaaS. Nền tảng DaaS của BrightPlanet thu thập một lượng lớn dữ liệu web bao gồm cả dữ liệu Deep Web và cung cấp cho AMPLYFI. Các kỹ sư của BrightPlanet đã xử lý việc thu thập và quản lý dữ liệu cùng với việc xác định nội dung web: Ngày xuất bản thực tế; Vị trí thực tế của ấn phẩm; Từ khóa theo ngành cụ thể.

- ClosingCorp là nhà cung cấp dữ liệu về chi phí đóng cửa bất động sản nhà ở. Chi phí đóng cửa bao gồm các khoản chi phí, ngoài giá của bất động sản, mà người mua và người bán thường phải chịu để hoàn tất giao dịch bất động sản. ClosingCorp đã hợp tác với ATTOM để có được dữ liệu của cơ quan thuế và cơ quan ghi chép của quận để họ có thể cung cấp chi phí đóng cửa chính xác theo thời gian thực. Sau khi ATTOM ra mắt nền tảng DaaS, ClosingCorp đã tích hợp giải pháp để có thể truy cập vào các bản cập nhật hàng ngày mà không cần phải quản lý một lượng lớn dữ liệu truyền đi.

3 thách thức của dữ liệu dưới dạng Dịch vụ

Mặc dù các công ty nhận ra tầm quan trọng và tiềm năng của phân tích, các tổ chức vẫn phải đối mặt với những thách thức trong quá trình triển khai. Tùy thuộc vào ngành, quy mô, sự giám sát của chính phủ và các thông số khác, DaaS có thể đưa ra những thách thức cần được giảm thiểu.

- Mối quan ngại về quyền riêng tư: Các nhà cung cấp DaaS là bên thứ ba lưu trữ, quản lý và xử lý dữ liệu cho các doanh nghiệp khác, điều này gây ra mối quan ngại về cách xử lý thông tin nhận dạng cá nhân (PII). Rủi ro phơi bày dữ liệu thông qua việc xử lý sai hoặc các tác nhân xấu cần được giải quyết. Đảm bảo tuân thủ các quy định bảo vệ dữ liệu toàn cầu (ví dụ: GDPR, CCPA) trở nên phức tạp hơn khi dữ liệu được quản lý bên ngoài. Các tổ chức nên tin tưởng các nhà cung cấp này để quản lý an toàn thông tin nhạy cảm và bí mật và xác nhận việc tuân thủ các quy định của họ.

- Độ phức tạp trong việc xử lý dữ liệu: Tích hợp dữ liệu từ nhiều nguồn, xử lý và phân tích là những quy trình phức tạp. Sự đa dạng của các định dạng dữ liệu, cấu trúc và tiêu chuẩn chất lượng đòi hỏi các công cụ và chuyên môn tinh vi để đảm bảo dữ liệu luôn đáng tin cậy và có thể sử dụng được. Cơ sở hạ tầng CNTT và hệ sinh thái dữ liệu hiện tại có thể cần điều chỉnh hoặc nâng cấp để phù hợp với khả năng của DaaS.

- Quản trị dữ liệu: Đảm bảo các chính sách quản trị dữ liệu để đảm bảo chất lượng dữ liệu, tuân thủ, bảo mật và sử dụng là rất quan trọng. Vì DaaS yêu cầu từ bỏ một số quyền kiểm soát cho nhà cung cấp bên ngoài, nên nhà cung cấp phải chứng minh rằng các giao thức xử lý dữ liệu của họ phù hợp với các chính sách và tiêu chuẩn của tổ chức.

Kết luận

Chi phí cao của dữ liệu bẩn trong phát triển AI là một vấn đề cấp bách không thể bỏ qua. Chất lượng dữ liệu kém làm suy yếu nền tảng của hệ thống AI, dẫn đến những hiểu biết sai lệch, chi phí tăng và những cạm bẫy đạo đức tiềm ẩn. Bằng cách áp dụng các chiến lược quản lý dữ liệu toàn diện và thúc đẩy văn hóa coi trọng tính toàn vẹn của dữ liệu, các tổ chức có thể giảm thiểu những rủi ro này.

Khi AI tiếp tục thâm nhập vào nhiều ngành công nghiệp khác nhau, tầm quan trọng của chất lượng dữ liệu sẽ chỉ tăng lên. Các công ty ưu tiên dữ liệu sạch có được lợi thế cạnh tranh, trong khi những công ty bỏ qua nó sẽ rất nhanh chóng tụt hậu.

Trong thời đại mà dữ liệu là dầu mỏ mới, việc đảm bảo độ tinh khiết của dữ liệu không chỉ là một nhu cầu kỹ thuật mà còn là một mệnh lệnh chiến lược. Các DN dẫn đầu đổi mới sáng tạo trong tương lai.

(Bài đăng ấn phẩm in Tạp chí TT&TT số 12 tháng 12/2024)

Bài liên quan
Nổi bật Tạp chí Thông tin & Truyền thông
  • Robot, AI và những rủi ro về an ninh đối với con người
    Theo GlobalData, thị trường robot toàn cầu sẽ có giá trị 218 tỷ USD vào năm 2030. Những tác động đa chiều của robot ngày nay, chứng tỏ robot không chỉ là sản phẩm của khoa học viễn tưởng mà còn là một phần không thể thiếu trong cuộc sống hàng ngày của chúng ta.
  • Những xu hướng công nghệ trong năm 2025
    Công nghệ đang bước vào giai đoạn phát triển mang tính cách mạng khi các đột phá mới không chỉ thay đổi cách con người sống, làm việc mà còn định hình lại toàn bộ xã hội.
  • DTI 2023: Đà Nẵng lần thứ tư liên tiếp đứng đầu cả nước về chuyển đổi số
    Bộ Thông tin và Truyền thông vừa công bố "Báo cáo chỉ số đánh giá chuyển đổi số của các bộ, cơ quan ngang bộ, cơ quan thuộc Chính phủ và tỉnh, thành phố trực thuộc Trung ương - DTI cấp bộ, cấp tỉnh năm 2023".
  • Hào hứng “mùa viết” báo xuân
    “Mùa” báo Tết chào xuân Ất Tỵ 2025 vừa tiếp tục thể hiện truyền thống đẹp của người làm báo cũng như bạn đọc mua giai phẩm xuân. Góp nên sự đa mầu sắc của trang báo Tết không thể thiếu các tác giả thuộc nhiều thế hệ cầm bút. Nhân số báo tân niên, Thời Nay có cuộc phỏng vấn nhà thơ Nguyễn Hữu Quý, nhạc sĩ Nguyễn Quang Long và nhà văn Tống Phước Bảo về niềm vui viết báo Tết.
  • Bộ Công an hướng dẫn tra cứu, nhận diện website lừa đảo
    Trong thời đại số, việc sử dụng Internet trở nên phổ biến, với lượng thông tin và website khổng lồ, đa dạng, là phương tiện cho người dân trong cuộc sống. Tuy nhiên, môi trường mạng luôn tiềm ẩn nhiều rủi ro, nguy cơ.
Đừng bỏ lỡ
Dữ liệu dưới dạng dịch vụ DaaS - Nền tảng cho các hệ thống AI
POWERED BY ONECMS - A PRODUCT OF NEKO