Tìm hiểu về Web Sematic – Web ngữ nghĩa
Diễn đàn - Ngày đăng : 10:12, 30/09/2018
Sematic Web – trang web ngữ nghĩa tương tự với World Wide Web, được tạo ra bởi Sir Tim Berners-Lee vào năm 1989. Tuy nhiên, thay vì tập trung vào các tài liệu, nó được xây dựng dựa trên dữ liệu. Giống như biểu thức được sử dụng rộng rãi hơn World Wide Web, web ngữ nghĩa cũng được tạo ra bởi Sir Berners-Lee, người bây giờ cũng được biết đến với tư cách là giám đốc của World Wide Web Consortium (W3C).
Khái niệm web ngữ nghĩa lần đầu tiên được Berners-Lee thảo luận cùng với nhà nghiên cứu James Hendler của AI và nhà khoa học máy tính Ora Lassila trong một bài báo khoa học Mỹ năm 2001.
Định nghĩa chính thức của W3C về web ngữ nghĩa là “một khung cộng tác chung cho phép dữ liệu được chia sẻ và sử dụng lại trên các ranh giới ứng dụng, doanh nghiệp và cộng đồng”.
Web ngữ nghĩa về cơ bản cho phép kết nối thông tin bằng cách sử dụng mạng có thể dễ dàng đọc bằng máy - cho dù máy tính, thiết bị IoT, điện thoại di động hoặc thiết bị khác thường được sử dụng để truy cập thông tin.
Nó được xây dựng trên tiền đề rằng dữ liệu trong các trang web là hữu ích, nhưng không phải trong mọi trường hợp. Một trong những rào cản lớn nhất của Internet đối với nó là phần lớn dữ liệu được tạo ra bằng cách sử dụng nhiều hình thức và không có cách thống nhất để xuất bản dữ liệu để bất cứ ai cũng có thể quản lý nó. Cách dữ liệu được trình bày bằng cách sử dụng HTML có thể khó xử lý và do đó, web ngữ nghĩa có ý tưởng rằng nếu dữ liệu này có thể được tái định nghĩa, nó hữu ích hơn cho mọi người.
Schema.org đã được hình thành bởi một số tổ chức (đặc biệt là Google, Bing và Yahoo) để tăng mức độ siêu dữ liệu. Mục tiêu của việc này là trả lời các câu hỏi từ các nguồn tốt nhất trên web, thay vì phục vụ trang tìm kiếm đầy đủ các liên kết tài liệu.
Phần quan trọng nhất của công nghệ web ngữ nghĩa là Khung Mô tả Tài nguyên (RDF). Đây là một khung chung để mô tả tài nguyên. Nó có thể đại diện cho siêu dữ liệu có thể được phân tích cú pháp và xử lý bởi các hệ thống thay vì chỉ hiển thị cho người dùng.
Trường hợp sử dụng
Web ngữ nghĩa có thể giải quyết một số trường hợp sử dụng nhất định.
Dữ liệu silo - dữ liệu silo có thể được loại bỏ bằng cách liên kết dữ liệu và thông tin trên một tổ chức và hơn thế nữa. Dữ liệu có thể vẫn ở định dạng gốc trong khi thông tin thẻ siêu dữ liệu ngữ nghĩa, sau đó có thể tìm kiếm được thông qua web ngữ nghĩa. Nếu dữ liệu được liên kết với dữ liệu mở trên web, người dùng có thể tìm thấy các mối quan hệ và ý nghĩa ngoài phạm vi dữ liệu của riêng họ.
Quản lý truyền thông - Việc sử dụng công khai nhất của web ngữ nghĩa là do BBC. Trang web World Cup 2010 của đài truyền hình đã sử dụng các công nghệ web ngữ nghĩa để sử dụng cho một nhóm gồm 700 người
Lợi ích
Một trong những lợi ích chính của web ngữ nghĩa là có một lượng lớn dữ liệu, kiến thức và thông tin được thực hiện dễ hiểu và dễ tiếp cận với máy móc, đặc biệt là các chương trình thông minh nhân tạo, trợ lý ảo.
Sự đơn giản của cấu trúc dữ liệu RDF và tính chất tùy chọn của lược đồ có nghĩa là dễ dàng kết hợp các bộ dữ liệu khác nhau. Điều này đặc biệt hữu ích cho các dự án dữ liệu lớn, nơi mà nhiều loại dữ liệu trong một tổ chức có thể trình bày như một thách thức.