ỨNG DỤNG PHẦN MỀM NGUỒN MỞ GREENSTONE trong xây dựng bộ sưu tập số địa phương (phần 1)

Diễn đàn - Ngày đăng : 21:44, 03/11/2015

Nhờ các tính năng nổi trội mà phần mềm nguồn mở Greenstone đã được Dự án Nâng cao khả năng sử dụng máy tính và truy nhập Internet công cộng tại Việt Nam [2][6] lựa chọn triển khai cho các điểm Bưu điện Văn hoá xã (BĐ-VHX) và thư viện Công cộng (TVCC) tạo lập bộ sưu tập số địa phương kết hợp ứng dụng Công nghệ Thông tin để tổ chức tài nguyên thông tin tạo ra không gian số và chủ động cung cấp thông tin cho người dùng

Phần mềm nguồn mở Greenstone được xuất phát từ dự án thư viện số của New Zealand tại trường Đại học Waikato và được phân phối bởi sự hợp tác với UNESCO và Human Info NGO [4]. Hiện nay Greenstone đang được các trường đại học, các tổ chức trong và ngoài nước lựa chọn tạo trong lập tài nguyên số cho riêng mình. Nhờ các tính năng nổi trội mà phần mềm nguồn mở Greenstone đã được Dự ánNâng cao khả năng sử dụng máy tính và truy nhập Internet công cộng tại Việt Nam[2][6]lựa chọn triển khai cho các điểm Bưu điện Văn hoá xã (BĐ-VHX) và thư viện Công cộng (TVCC) tạo lập bộ sưu tập số địa phương kết hợp ứng dụng Công nghệ Thông tin để tổ chức tài nguyên thông tin tạo ra không gian số và chủ động cung cấp thông tin cho người dùng [3] .

Xây dựng bộ sưu tập số địa phương

Bộ sưu tập thông tin số được xây dựng bao gồm nhiều tài liệu về một chủ đề hoặc nhóm chủ đề nào đó được lựa chọn, các tài liệu được thể hiện dưới nhiều dạng thức tập tin định dạng khác nhau như văn bản, hình ảnh, âm thanh, v.v..

Bộ sưu tập số là cơ sở để từng bước hình thành thư viện số mà theo Ian H.Witten chuyên gia thư viện số thuộc đại học Waikato, New Zealand [4] thì thư viện số là tập hợp các bộ sưu tập thông tin của các đối tượng số hoặc đã được số hóa và được tập trung theo chủ đề hay đề tài có tổ chức để thông tin dễ dàng truy cập và lưu trữ theo những tiêu chuẩn chuyên biệt [7].

Thông tin địa phương là thông tin được sử dụng cho những người ở tại một địa phương cụ thể, hoặc nội dung cho những người có cùng một ngôn ngữ hoặc những người có cùng một nền văn hóa. Thông tin được điều chỉnh để phù hợp về mặt xã hội, văn hóa, kinh tế và chính trị đối với một xã hội hoặc một cộng đồng cụ thể và được họ sử dụng [3].

Trong ngữ cảnh của Dự án Nâng cao năng lực sử dụng máy tính và truy nhập Internet công cộng tại Việt Nam thì thông tin địa phương có thể bao gồm các loại tài liệu là văn bản, hình ảnh, video, bảng biểu, đồ họa, danh mục hoặc dữ liệu khác đã được tạo ra cho đối tượng theo vùng địa lý cụ thể, điển hình là tài liệu theo khu vực địa lý được xuất bản trên websites hoặc tự tạo lập.

Trong điều kiện hiện nay với kỹ năng tìm kiếm và chọn lọc thông tin của bạn đọc tại các địa phương còn hạn chế do vậy cán bộ Bưu điện Văn hoá xã (BĐ-VHX) và thư viện công cộng (TVCC) chủ động tạo thêm các bộ sưu tập số địa phương là rất cần thiết, các bộ sưu tập được đóng gói sẽ thuận tiện cho việc tra cứu và chia sẻ thông tin qua môi trường mạng (online) và CD-ROM (offline). Bộ sưu tập số địa phương được xây dựng theo từng chủ đề cụ thể sẽ phù hợp với nhu cầu về nội dung như nông nghiệp, sức khỏe cộng đồng, giáo dục, truyền thông, du lịch .v.v [9].

Quy trình xây dựng bộ sưu tập địa phương

Việc  xây dựng bộ sưu tập số địa phươngcần phải tuân theo một quy trình để đảm bảo tính hoàn thiện cho bộ sưu tập số bao gồm các bước như sau:

Bước 1: Xây dựng đề cương chi tiết cho bộ sưu tập dựa trên cơ sở đối tượng sử dụng bộ sưu tập, xác định các chủ đề và mối quan hệ giữa chúng như loại tài liệu, định dạng, hình thức trình bày, ngôn ngữ sử dụng.

Bước 3: Biên mục, sử dụng công cụ biên mục của phần mềm Greenstone trong việc xây dựng bộ sưu tập số hoặc có thể là một phân hệ quản trị nội dung số của phần mềm quản trị được tích hợp.

Bước 4: Điều chỉnh bộ sưu tập và hoàn chỉnh bằng cách bổ sung các chức năng như điều chỉnh giao diện cho bộ sưu tập, đánh chỉ mục, v.v.

Bước 5; Đưa vào khai thác sử dụng, có thể trích xuất từng bộ sưu tập trong mạng LAN, CD-ROM hoặc trên Internet.

Chuẩn biên mục sử dụng trong tạo lập tài nguyên số

Trong tạo lập tài nguyên số được sử dụng theo chuẩn Dublin Core để mô tả dữ liệu trong các Metadata nhằm khai thác các tài liệu trong thư viện và trên các Website thông qua mạng Internet. Chuẩn Dublin Core gồm 15 yếu tố (15 trường) được thiết lập từ các hội thảo quốc tế kết hợp bởi các ngành khoa học như thư viện, tin học, bảo tàng, mã hoá văn bản v.v [8].

Đặc điểm của Dublin Core

Tính đơn giản trong tạo lập và duy trì: Dublin Core được thiết kế nhằm phục vụ những người không chuyên, dễ sử dụng và ít phải đầu tư kinh phí nhưng mang lại hiệu quả cao.

Ngôn ngữ thông dụng: Khắc phục những khó khăn trong việc hiển thị các thuật ngữ như yếu tố (Creator) được gán cho người tạo lập, nhà soạn nhạc, đạo diễn, trong vai trò là tác giả chính. 

-Phạm vi quốc tế: Được tạo lập với nền tảng kết hợp đa ngôn ngữ, phục vụ trong môi trường tài nguyên thông tin điện tử mang tính chất đa văn hoá và đa ngôn ngữ. 

-Khả năng mở rộng: với cơ chế mở thì chuẩn Dublin Core có thể được mở rộng bằng việc bổ sung thêm các yếu tố mở rộng và khả năng này còn được thực hiện một cách đơn giản thông qua việc liên kết nhiều cơ sở dữ liệu khác nhau thông qua mạng Internet.

Yếu tố cơ bản của Dublin Core

Các yếu tố cơ bản của Dublin Core đều mang thuộc tính lựa chọn và có thể lặp lại, mỗi yếu tố đều có một giới hạn nhất định và thuộc tính nhằm diễn giải ý nghĩa tương ứng của yếu tố đó.

-Nhan đề (Title): Tên của nguồn thông tin thường do tác giả hoặc nhà xuất bản đặt cho tài liệu.

Tác giả (Creator): Người hoặc cơ quan chịu tránh nhiệm chính về nội dung trí tuệ của nguồn thông tin

-Đề mục (Subject): Chủ đề của nguồn thông tin và được thể hiện bằng từ vựng có kiểm soát gồm tiêu đề đề mục, số phân loại,...

-Mô tả (Description): Phần thể hiện nội dung của nguồn thông tin bao gồm cả phần tóm tắt của tư liệu văn bản hoặc nội dung của tư liệu nghe nhìn

-Xuất bản (Publisher): Cơ quan, tổ chức chịu trách nhiệm tạo lập, xuất bản nguồn thông tin trong định dạng thực.

Tác giả phụ (Contributor): Cá nhân hay tổ chức có những đóng góp về mặt trí tuệ cho tư liệu nhưng không phải là tác giả chính.

-Ngày tháng (Date): ngày tháng  có liên quan đến việc tạo lập, xuất bản hay công bố tư liệu.

-Loại hình (Type): hình thức vật chứa nội dung tư liệu

-Mô tả vật lý (Format): Định dạng vật lý và kích thước của tư liệu như kích cỡ, thời lượng,.. Định dạng cũng còn được dùng để chỉ rõ phần mềm và phần cứng cần thiết để sử dụng tư liệu.

-Định danh tư liệu (Identifier): Là một dãy ký tự hoặc số nhằm thể hiện tính đơn nhất của tư liệu như: URLs và URNs, ISBN, ISSN,...

-Nguồn gốc (Source): Nguồn gốc mà tư liệu được tạo thành, yếu tố này có thể bao gồm siêu dữ liệu về nguồn thông tin thứ hai nhằm khai thác tư liệu hiện hành.

-Ngôn ngữ (Language): Ngôn ngữ của nội dung tư liệu được thành lập theo quy tắc RFC 1766.

-Liên kết (Relation): Một định danh cho nguồn thứ hai và những mối quan hệ của nó với tư liệu hiện hành. Yếu tố này thể hiện những kết nối giữa những nguồn tư liệu có liên quan.

-Nơi chứa (Coverage): Những đặc tính về không gian và/hoặc thời gian của tư liệu. Không gian nơi chứa chỉ ra một vùng sử dụng địa danh hoặc toạ độ. Đặc tính thời gian trong yếu tố này chỉ ra khoảng thời gian mà tư liệu đề cập tới và thường sử dụng tên thời kỳ như thời kỳ Đồ đá.

-Bản quyền (Rights): Thông tin về tình trạng bản quyền, kết nối tới thông tin về tình trạng bản quyền hoặc dịch vụ cung cấp thông tin bản quyền cho tư liệu.

(còn nữa)