Chuyển động ICT

Mô hình bản sao kỹ thuật số dựa trên biểu đồ tri thức

Nguyễn Thu Hương, Nguyễn Sĩ Thìn, Nguyễn Thị Huyền Thương 10/05/2023 06:15

Bản sao kỹ thuật số (Digital Twin - DT) là một khái niệm cốt lõi trong quá trình số hóa của nền công nghiệp 4.0. Theo đó các đối tượng vật lý của hệ thống thực tế sẽ được số hóa thành một bản sao kỹ thuật số cho phép việc giám sát, vận hành, chẩn đoán và dự đoán lỗi dễ dàng và hiệu quả trên chính bản sao này.

Tóm tắt:
- Bản sao kỹ thuật số (Digital Twins - DT) gồm 3 phần chính: Sản phẩm vật lý trong không gian thực; Sản phẩm ảo trong không gian ảo; Kết nối dữ liệu và thông tin liên kết các sản phẩm ảo và thực với nhau.

- Biểu đồ tri thức (Knowledge Graph - KG): có thể xem như phương tiện biểu diễn tri thức của thế giới thực thông qua một tập hợp liên kết các mô tả và thực thể và mối quan hệ giữa chúng dựa trên một sơ đồ ở mức khái niệm là bản thể luận.

- Quy trình xây dựng mô hình DT dưới dạng KG: Xác định các
thực thể quan sát được (thực thể vật lý); Mô hình hóa; Thêm chú thích ngữ nghĩa; Xây dựng giao diện tương tác; Triển khai.

Tuy nhiên, một thách thức quan trọng là phải thực sự hiểu dữ liệu nào là có ý nghĩa, và làm thế nào để kết nối, biểu diễn chúng một cách tốt nhất. Ngoài ra, việc quản lý và liên kết các mô hình kỹ thuật số phức tạp, năng động cũng như dữ liệu không đồng nhất của bản sao kỹ thuật số đưa ra những thách thức mở. Do khả năng dễ mở rộng và thích ứng, biểu đồ tri thức (Knowledge Graph - KG) là một khái niệm phù hợp để vượt qua những thách thức này và cho phép lập luận đạt được những hiểu biết mới.

Bài báo này sẽ trình bày tổng quan về mô hình bản sao kỹ thuật, biểu đồ tri thức và mối liên quan giữa hai khái niệm này. Từ các phân tích trên, một phương pháp dùng để phát triển bản sao kỹ thuật số dựa trên biểu đồ tri thức được giới thiệu. Đây cũng là bước nền tảng cho hướng phát triển sâu hơn lĩnh vực này.

Giới thiệu

Việc chuyển đổi số hướng đến ứng dụng những công nghệ số đã tạo ra những giá trị mới và dần thay đổi toàn bộ cách vận hành cũ. Một trong những công nghệ số nổi bật, thu hút rất nhiều sự quan tâm hiện nay đó chính là bản sao kỹ thuật số (Digital twins - gọi tắt là DT).

Mô hình thực tế là vô cùng đa dạng bởi tính đặc thù khác nhau từng lĩnh vực. Tuy nhiên việc sao chép các mô hình này không thực sự là một vấn đề lớn bởi DT có thể được tạo bằng nhiều công nghệ với cơ sở dữ liệu khác nhau như dựa trên các cơ sở dữ liệu tài liệu, cơ sở dữ liệu chuỗi thời gian hay cơ sở dữ liệu quan hệ. Vấn đề thực sự ở đây đó là làm thế nào tối ưu trong việc quản lý dữ liệu khi mà bản sao này cần tương tác với một lượng dữ liệu cực lớn từ hệ thống với rất nhiều cảm biến. Điều này là rõ ràng bởi hệ thống bản sao càng gần với hệ thống thực thì càng phải mô phỏng nắm bắt toàn bộ dữ liệu, trạng thái luôn thay đổi, cập nhật trong thời gian thực. Biểu đồ tri thức (Knowledge graph - gọi tắt là KG) là ứng viên số một để giải quyết vấn đề này.

Trong bài báo này, chúng ta sẽ cùng tìm hiểu về việc sử dụng KG trong triển khai bản sao kỹ thuật số. Đầu tiên, những khái niệm sơ lược của bản sao kỹ thuật số cũng như KG sẽ được giới thiệu ở mục 2. Việc áp dụng KG trong bài toán bản sao kỹ thuật số sẽ được trình bày ở mục 3. Một số hướng phát triển của chủ đề cũng như kết luận sẽ được chỉ ra trong mục cuối cùng của bài báo.

Các khái niệm

Bản sao kỹ thuật số - Digital Twins (gọi tắt là DT)

Nguồn gốc: Ý tưởng về DT được đưa ra bởi NASA vào đầu những năm 1960, khi việc mô phỏng được xem như là công cụ hiệu quả để có thể hiểu được các hiện tượng khoa học, những hệ thống phức tạp. Ví dụ, mặc dù nhiều hiện tượng vật lý và phương trình cơ bản đã được hiểu rõ, nhưng chính phương pháp mô phỏng mới cho phép xử lý các hệ thống phức tạp như tên lửa và tàu vũ trụ.

NASA đã sử dụng nhiều thiết bị mô phỏng để đánh giá sự cố và mở rộng mô hình vật lý của các phương tiện (tên lửa, tàu vũ trụ) bằng các thành phần kỹ thuật số. Các thiết bị mô phỏng này sẽ cho phép nhập dữ liệu liên tục để lập mô hình dự đoán các sự kiện có thể dẫn đến sự cố và nhằm phân tích đánh giá, đề xuất ra các bước thực thi tiếp theo. Vì vậy, việc mô phỏng các hệ thống trở thành phương tiện quan trọng trong việc hiện thực hóa các hệ thống phức tạp và được xem như tiêu chuẩn trong nhiều ngành kỹ thuật qua nhiều thập kỷ sau này. Điều này đồng thời đã kéo theo sự gia tăng của kỹ thuật mô phỏng hệ thống dựa trên mô hình cho phép việc tạo bản sao kỹ thuật số được cập nhật ở mọi cấp độ từ cấp thành phần cho đến cấp độ hệ thống tổng quát.

Đặc điểm: Về bản chất, DT gồm 3 phần chính: Sản phẩm vật lý trong không gian thực; Sản phẩm ảo trong không gian ảo; Kết nối dữ liệu và thông tin liên kết các sản phẩm ảo và thực với nhau.

DT có khả năng tiếp nhận dữ liệu đầu vào từ thế giới thực thông qua các bộ phận cảm biến hỗ trợ thu thập dữ liệu. Các thiết bị vật lý sẽ được tích hợp hệ thống cảm biến để theo dõi các thông số hoạt động, tình trạng vận hành, vị trí, và các yếu tố quan trọng khác. Các cảm biến này được kết nối với nền tảng đám mây, nơi các dữ liệu sẽ được thu thập, lưu trữ, xử lý, và phân tích. Các dữ liệu vận hành sẽ được phân tích dưới các điều kiện ngữ cảnh khác nhau sẽ mô phỏng ra các kết quả khác nhau.

Về bản chất, DT sẽ tích hợp tất cả các loại dữ liệu từ dữ liệu liên quan kiểm thử, hoạt động, các loại mô hình (gồm bản vẽ thiết kế, mô hình kỹ thuật, phân tích,...) cho đến các loại thông tin khác (yêu cầu, mệnh lệnh, kiểm tra) của các vật thể vật lý được tạo ra trong suốt vòng đời của chúng. Hình 1 minh họa về mô hình hoạt động của DT.

h11.jpg
Hình 1. Mô hình hoạt động của DT

DT như một mô hình kết nối giữa thế giới thực và thế giới ảo, cung cấp những thông tin phù hợp đúng thời điểm, được sử dụng dự đoán những hành vi, những lỗi tiềm ẩn và tối ưu hóa hiệu suất của các đối tượng vật lý đang xem xét như các hệ thống vật lý. Một đặc điểm quan trọng ở đây là thông tin trong DT liên quan đến toàn bộ vòng đời của vật thể vật lý nên đòi hỏi phải được cập nhật liên tục để phản ánh đúng thực tế theo thời gian thực. Việc mô phỏng các vật thể vật lý trong môi trường ảo hóa này sẽ giúp quá trình triển khai chúng ở thế giới thực diễn ra nhanh hơn và ít rủi ro có thể xảy ra.

DT như một mô hình kết nối giữa thế giới thực và thế giới ảo, cung cấp những thông tin phù hợp đúng thời điểm, được sử dụng dự đoán những hành vi, những lỗi tiềm ẩn và tối ưu hóa hiệu suất của các đối tượng vật lý đang xem xét như các hệ thống vật lý. Một đặc điểm quan trọng ở đây là thông tin trong DT liên quan đến toàn bộ vòng đời của vật thể vật lý nên đòi hỏi phải được cập nhật liên tục để phản ánh đúng thực tế theo thời gian thực. Việc mô phỏng các vật thể vật lý trong môi trường ảo hóa này sẽ giúp quá trình triển khai chúng ở thế giới thực diễn ra nhanh hơn và ít rủi ro có thể xảy ra.

Biểu đồ tri thức - Knowledge Graph (KG)

Thuật ngữ “Biểu đồ tri thức” (gọi tắt là KG) được đề xuất lần đầu tiên bởi Google vào năm 2012 hướng đến như một mô hình biểu diễn tri thức dựa trên công nghệ Web ngữ nghĩa (Semantic Web). Mặc dù rằng khái niệm “mạng ngữ nghĩa” được đưa ra từ rất lâu trong lĩnh vực AI như một các biểu diễn tri thức thông qua các mối quan hệ ngữ nghĩa giữa các khái niệm dưới dạng một đồ thị. Thực tế tồn tại nhiều đề xuất về các định nghĩa cho KG [4] nhưng không có cái nào được ghi nhận là chính thức.

Tuy vậy, có một sự trùng lặp trong số các khái niệm đó có thể đưa cho chúng ta những đặc điểm chung của một KG. Cụ thể, KG có thể xem như phương tiện biểu diễn tri thức của thế giới thực thông qua một tập hợp liên kết các mô tả và thực thể và mối quan hệ giữa chúng dựa trên một sơ đồ ở mức khái niệm là bản thể luận (ontology). Theo đặc điểm này, KG có khả năng suy luận ra những kiến thức, thông tin mới dựa trên nội dung có sẵn. Ở khía cạnh trực quan hơn, KG là một đồ thị có hướng với các nút biểu diễn các thực thể và các cạnh thể hiện mối quan hệ dựa các thực thể. Hình 2 cho thấy một ví dụ về hai thực thể “xe hơi” và “phương tiện” tương ứng và mối quan hệ của chúng (“là”).

untitled(2).jpg
Hình 2. Đồ thị có hướng về quan hệ giữa hai thực thể “xe hơi” và “phương tiện”.

Một số các KG được sử dụng rộng rãi được hỗ trợ bởi lược đồ ngữ nghĩa bao gồm YAGO [12], DBpedia [8], Google Knowledge Graph [9],... Trong những năm gần đây, KG đang được tích hợp rộng rãi trong nhiều các lĩnh vực khác nhau từ chăm sóc sức khỏe [11], sản xuất [2] đến giáo dục [5],...

Mô hình bản sao kỹ thuật số dựa trên biểu đồ tri thức

Tình hình nghiên cứu

Việc áp dụng các mô hình ngữ nghĩa như KG để biểu diễn DT đã được đề cập đến trong nhiều nghiên cứu. Trên thực tế có thể tìm thấy việc sử dụng các mô hình ngữ nghĩa để xây dựng DT trong các lĩnh vực khác nhau do những lợi ích mà chúng đem lại.

Cụ thể như việc sử dụng các mô hình ngữ nghĩa mô tả DT để đơn giản hóa phân tích trong cài đặt Công nghiệp 4.0 [7]. Các nghiên cứu về cách quản lý dữ liệu trong hoạt động sản xuất tại tập đoàn Bosch bằng các mô hình ngữ nghĩa [6] đã được triển khai. Một ví dụ khác đó là mô hình kiến trúc DT cho Công nghiệp 4.0. Ở các toà nhà thông minh [3] xem xét nhiều cách tiếp cận kiến thức không gian địa lý đồ thị cho DT ở Anh [1] trong đó dữ liệu từ các lĩnh vực khác nhau sẽ được kết hợp vào một KG. Vì KG có thể được sử dụng để mô tả mọi thứ từ thế giới thực, công nghệ này cũng đã được sử dụng trong các ứng dụng IoT, làm cho việc kết nối giữa nhiều thiết bị trở nên dễ dàng hơn để có thể khám phá thông qua các truy vấn ngữ nghĩa [10]. Ngoài ra nó cũng đã được áp dụng để giải quyết vấn đề không đồng nhất của các thiết bị khác nhau mà có thể được kết nối qua IoT [13].

Quản lý dữ liệu trong hệ thống bản sao kỹ thuật số dựa trên biểu đồ tri thức

Trong kiến trúc của hệ thống DT, việc quản lý dữ liệu trung gian giữa thế giới thực và thế giới ảo đóng vai trò cốt lõi. Dữ liệu được thu thập từ một đối tượng vật lý và môi trường của nó thông qua cảm biến và được gửi đến kho lưu trữ tập trung. Như vậy kho lưu trữ này gồm dữ liệu từ các nguồn khác nhau. Các nền tảng phần mềm trung gian khác sẽ đảm nhận các tác vụ như kết nối, tích hợp dữ liệu, xử lý dữ liệu, kiểm soát chất lượng dữ liệu, trực quan hóa dữ liệu, mô hình hóa và quản trị dữ liệu, v.v..

Việc sử dụng KG mô tả các DT cho phép tích hợp dữ liệu từ các hệ thống khác nhau. Hệ thống quản lý dữ liệu ngữ nghĩa có thể được phân loại thành các kho dữ liệu dạng RDF, hoặc hệ quản lý dữ liệu quan hệ RDBMS và phi quan hệ NoSQL. Ngoài ra các kỹ thuật quản lý dữ liệu khác nhau cũng được sử dụng ví dụ như OpenLink Virtuoso [18], Apache Jena, Blazegraph, GraphDB excel. Để kiểm chứng và xác thực các yêu cầu trong mô hình DT dựa các công nghệ KG, các tiêu chuẩn đã được xây dựng. Hai bộ tiêu chuẩn SPARQL Berlin (BSBM) [16] và tiêu chuẩn của Đại học Lehigh (LUBM) [17] là bộ tiêu chuẩn RDF chung được sử dụng cho các truy vấn khác nhau trên bộ dữ liệu được tạo ra. Ngoài ra còn có các bộ tiêu chuẩn phổ biến khác như SP2Bench [15] dựa trên bộ dữ liệu thư viện DBLP và phản ánh các đặc điểm mạng xã hội của dữ liệu web ngữ nghĩa hay DBpedia SPARQL [14] sử dụng các truy vấn thực do con người và các ứng dụng thực hiện trên DBpedia.

Phương pháp xây dựng bản sao kỹ thuật số dựa trên biểu đồ tri thức

Để cung cấp một phương pháp tiêu chuẩn cho việc lập mô hình DT ngữ nghĩa sử dụng KG, một trình tự các bước đã được xác định có thể được dùng để hướng dẫn các kỹ sư và các nhà thiết kế hệ thống. Phương pháp này tuân theo cách tiếp cận dựa trên mô hình vào giai đoạn đầu của quá trình. Hình 3 mô tả các bước để lập mô hình DT dưới dạng một KG.

5.jpg

Bước 1: Xác định các thực thể quan sát được (thực thể vật lý)

Trong bước này, hệ thống thế giới thực phải được phân tích và chia thành các phần có thể quan sát riêng lẻ, nên được gọi là thực thể quan sát được. Ví dụ, thực thể “toà nhà 1” có thể được chia thành các thành phần có thể quan sát riêng lẻ là các tầng trong toà nhà như “tầng 1”, “tầng 2”,… trong mỗi tầng thì có thể quan sát riêng lẻ các phòng như “phòng 101”, “phòng 102”,… và các phòng có thể quan sát riêng lẻ các thiết bị đo nhiệt độ như “nhiệt kế 1”, “nhiệt kế 2”,...

Bước 2: Mô hình hóa

Mỗi thành phần quan sát được ở bước 1 sẽ được mô hình hóa thành các nút tương ứng và được liên kết với các thuộc tính và hoạt động của nó qua các cạnh của đồ thị. Việc tinh chỉnh có thể được thực hiện tại bước này bằng cách quay lại bước trước và cập nhật các thực thể quan sát được xác định.

Bước 3: Thêm chú thích ngữ nghĩa

Các chú thích ngữ nghĩa sẽ được thêm vào các thuộc tính và định dạng chúng theo một tiêu chuẩn chung.

Ví dụ nếu có một thiết bị nhiệt kế có thuộc tính nhiệt độ với giá trị được cung cấp dưới dạng kiểu số, tuy nhiên không rõ loại đơn vị nhiệt độ được sử dụng ở đây là gì? Độ F, độ C hay độ Kelvin? Việc thêm vào định nghĩa ngữ nghĩa bằng việc sử dụng lược đồ cho dữ liệu có cấu trúc như iotschema.org cho phép cấu hình ngữ nghĩa của nội dung theo một cách nhất quán.

Sau bước này tất cả các giao tiếp với thế giới thực được chuẩn hóa với các định nghĩa ngữ nghĩa. Các mối quan hệ giữa các thực thể sẽ được tạo ra một cách linh động theo từng trường hợp sử dụng.

Ví dụ thực thể “Nhiệt kế 1A” ở “phòng 101” sẽ có quan hệ thuộc về với thực thể “phòng 101”; thực thể “phòng 101” có mối quan hệ “thuộc về” của “tầng 1” và có mối quan hệ “thuộc về” của “nhà 1”.

Hình 4 mô tả về quá trình định nghĩa này. Đầu ra của bước này sẽ được sử dụng để xây dựng KG. Vì có thể xảy ra việc chỉnh sửa mô hình sau khi thêm vào ngữ nghĩa, nên quá trình này sẽ lặp lại cho đến khi mô hình được tạo và chú thích ngữ nghĩa đúng.

hinh-4.jpg

Bước 4: Xây dựng giao diện tương tác

Giao diện này cho phép mô hình giao tiếp với ứng dụng trong thế giới thực. Trong bước này, tất cả các chi tiết liên quan đến kết nối giữa thế giới ảo với thế giới thực được xác định. Dữ liệu có thể được được thu thập từ thế giới thực được đưa vào hệ thống trong khi các lệnh và sự điều chỉnh có thể được gửi ngược lại để thay đổi trạng thái của các thực thể vật lý.

Bước 5: Triển khai

Khi mọi thông số đã được cài đặt và thiết lập, hệ thống bắt đầu được triển khai. Cụ thể, một biểu đồ được tạo ở định dạng chứa tất cả nội dung, thuộc tính, hành động, sự kiện và các mối quan hệ. Biểu đồ này có thể được xử lý và phản ánh vào cơ sở dữ liệu đồ thị bằng việc sử dụng các công cụ như Neo4j, TypeDB hoặc các loại khác. Việc tồn tại một KG mô tả hệ thống có thể cho phép vật thể vật lý dễ dàng được phát hiện bởi các ứng dụng được xây dựng trên ý tưởng DT.

Kết luận

Với tính hiệu quả trong quản lý, điều hành hệ thống thực tế, DT đã và đang trở thành một xu thế công nghệ tất yếu không chỉ trong các lĩnh vực đòi hỏi nhiều xử lý phức tạp như lĩnh vực tên lửa, tàu vũ trụ,... mà ngay tại các hệ thống tòa nhà, công trình và thậm chí nhà ở gia đình cũng trở nên cần thiết.

Tuy nhiên, cũng như các lĩnh vực công nghệ mới khác, việc áp dụng DT một cách nhanh chóng, hiệu quả và phù hợp với từng ngành, công trình cụ thể chúng ta cần phải nắm bắt quy trình, khái niệm căn bản để từ đó có những đề xuất, phương pháp áp dụng hợp lý.

Xuất phát từ vấn đề này, tác giả đã cung cấp cái nhìn tổng quát về DT cũng như thực trạng các công trình nghiên cứu hiện nay. Với sự tổng hợp các hướng nghiên cứu về DT, nhóm tác giả đã đưa ra một sự kết hợp đáng chú ý giữa DT và KG. Bước đầu, nhóm tác giả đã đưa ra được quy trình xây dựng mô hình từ sự kết hợp hai lĩnh vực này. Trong các hướng nghiên cứu tiếp theo, nhóm tác giả sẽ tiếp tục tìm hiểu sâu về chi tiết công việc trong từng bước để xây dựng một ứng dụng cụ thể áp dụng trong môi trường giáo dục. Việc nghiên cứu này, hứa hẹn đem lại nhiều điều mới, như một môi trường nghiên cứu trao đổi không chỉ riêng nhóm tác giả mà của tất cả những người quan tâm./.

Tài liệu tham khảo:
1. Akroyd, J., Mosbach, S., Bhave, A., Kraft, M.: The national digital twin of the uk – a knowledge-graph approach (2021)

2. Buchgeher, G., Gabauer, D., Gil, J.M., Ehrlinger, L.: Knowledge graphs in manu-facturing and production: A systematic literature review. IEEE Access 9, 55537–55554 (2021)

3. Chevallier, Z., Finance, B., Boulakia, B.C.: A reference architecture for smart building digital twin. In: SeDiT@ESWC. CEUR Workshop Proceedings, vol. 2615. CEUR-WS.org (2020)

4. Ehrlinger, L., W¨oß, W.: Towards a definition of knowledge graphs. In: SEMAN-TiCS (Posters, Demos, SuCCESS). CEUR Workshop Proceedings, vol. 1695. CEUR-WS.org (2016)

5. Fettach, Y., Ghogho, M., Benatallah, B.: Knowledge graphs in education and employability: A survey on applications and techniques. IEEE Access 10, 80174–80183 (2022)

6. Kalayci, E.G., Grangel-González, I., L¨osch, F., Xiao, G., ul Mehdi, A., Kharlamov, E., Calvanese, D.: Semantic integration of bosch manufacturing data using virtual knowledge graphs. In: ISWC (2). Lecture Notes in Computer Science, vol. 12507, pp. 464–481. Springer (2020)

7. Kharlamov, E., Martín-Recuerda, F., Perry, B., Cameron, D., Fjellheim, R., Waaler, A.: Towards semantically enhanced digital twins. In: IEEE BigData. pp. 4189–4193. IEEE (2018)

8. Lehmann, J., Isele, R., Jakob, M., Jentzsch, A., Kontokostas, D., Mendes, P.N., Hellmann, S., Morsey, M., van Kleef, P., Auer, S., Bizer, C.: Dbpedia - A large- scale, multilingual knowledge base extracted from wikipedia. Semantic Web 6(2), 167–195 (2015)
9. Paulheim, H.: Knowledge graph refinement: A survey of approaches and evaluation methods. Semantic Web 8(3), 489–508 (2017)

10. Phuoc, D.L., Quoc, H.N.M., Ngo, Q.H., Nhat, T.T., Hauswirth, M.: The graph of things: A step towards the live knowledge graph of connected things. J. Web Semant. 37-38, 25–35 (2016)

11. Rajabi, E., Kafaie, S.: Knowledge graphs and explainable AI in healthcare. Inf. 13(10), 459 (2022)

12. Suchanek, F.M., Kasneci, G., Weikum, G.: Yago: A core of semantic knowledge. In: WWW. pp. 697–706. ACM (2007)

13. Xie, C., Yu, B., Zeng, Z., Yang, Y., Liu, Q.: Multilayer internetof-things middle-ware based on knowledge graph. IEEE Internet Things J. 8(4), 2635–2648 (2021)

14. Open Link Virtuoso SPARQL Query Editor - DBpedia https:// dbpedia.org/sparql. Ngày truy cập 20/03/2023

15. Schmidt, M., Hornung, T., Meier, M., Pinkel, C., Lausen, G.: Sp2bench: A SPARQL performance benchmark. In: Semantic Web Information Management, pp. 371–393. Springer (2009)

16. Bizer, C., Schultz, A.: The berlin SPARQL benchmark. In: Semantic Services, Interoperability and Web Applications, pp. 81–103. CRC Press (2011)

17. Guo, Y., Pan, Z., Heflin, J.: LUBM: A benchmark for OWL knowledge base sys-tems. J. Web Semant. 3(2-3), 158–182 (2005)

18. Open Link Software: Virtuoso Homepage https://virtuoso. openlinksw.com/. Ngày truy cập 20/03/2023

(Bài đăng ấn phẩm in Tạp chí TT&TT số 4 tháng 4/2023)

Bài liên quan
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
Mô hình bản sao kỹ thuật số dựa trên biểu đồ tri thức
POWERED BY ONECMS - A PRODUCT OF NEKO