Blog Đông Tác

Nguyễn Chí Công, CFLS

Trang nhà > Công nghệ > An ninh > Siêu dữ liệu

Metadata

Siêu dữ liệu

Thứ Ba 1, Tháng Sáu 2010, bởi Cong_Chi_Nguyen

Đọc sách, báo, xem TV, mạng xã hội v.v. thấy nhiều người khi viết/chép tin tức hoặc tri thức mà không kèm theo đủ bối cảnh.

Nếu họ hướng đến người đã biết rõ bối cảnh thì chẳng sao; nhưng đó lại là lỗi lớn nếu họ thực sự muốn truyền thông trung thực. Đáng sợ là người xem vội vã có thể hiểu lẩm và chia sẻ tiếp, làm cho fake news có cơ hội lan toả nhanh, rộng, lâu.

Chống tin giả trước hết cần tìm xem nó có đủ mấy chỉ dẫn có thể kiểm chứng hay không: ai, chuyện gì, ở đâu, lúc nào, vì sao, như thế nào... Bối cảnh càng trở nên rõ ràng nếu càng có thêm MD, viết tắt từ metadata, còn gọi là siêu dữ liệu.

Ngành thông tin tư liệu từ lâu đã chuẩn hoá MD cho việc biên mục (cataloging) và bộ chuẩn Dublin Core được hình thành lần đầu tiên vào năm 1995. Đó là một trong những giản đồ siêu dữ liệu đơn giản nhất và được sử dụng rộng rãi nhất. Ban đầu được phát triển để mô tả các tài nguyên web, Dublin Core hiện nay đã được sử dụng cho nhiều loại tài nguyên vật lý và kỹ thuật số khác nhau.

Dublin Core gổm có 15 dữ liệu rất cần thiết:

1. Nhan đề (Title): Nhan đề của tài liệu.

2. Tác giả (Creator): Tác giả của tài liệu, bao gồm cả tác giả cá nhân và tác giả tập thể.

3. Chủ đề (Subject): Chủ đề tài liệu đề cập dùng để phân loại tài liệu. Có thể thể hiện bằng từ, cụm từ/(Khung chủ đề), hoặc chỉ số phân loại/(Khung phân loại).

4. Tóm tắt (Description): Tóm tắt, mô tả nội dung tài liệu. Có thể bao gồm tóm tắt, chú thích, mục lục, đoạn văn bản để làm rõ nội dung...

5. Nhà xuất bản (Publisher): Nhà xuất bản, nơi ban hành tài liệu, có thể là tên cá nhân, tên cơ quan, tổ chức, dịch vụ...

6. Tác giả phụ (Contributor): Tên những người cùng tham gia cộng tác đóng góp vào nội dung tài liệu, có thể là cá nhân, tổ chức...

7. Ngày tháng (Date): Ngày, tháng ban hành tài liệu.

8. Kiểu loại (Type): Mô tả bản chất của tài liệu. Dùng các thuật ngữ mô tả phạm trù kiểu: sách, trang web, bài báo, báo cáo, từ điển...

9. Khuôn mẫu (Format): Mô tả sự trình bày vật lý của tài liệu, có thể bao gồm; vật mang tin, kích cỡ độ dài, kiểu dữ liệu (.doc, .html, .jpg, xls, phần mềm....)

10. Định danh (Identifier): Các thông tin về định danh tài liệu, các nguồn tham chiếu đến, hoặc chuỗi ký tự để định vị tài nguyên: URL (bắt đầu bằng http://), URN (Uniform Resource Name), ISBN (International Standard Book Number), ISSN (International Standard Serial Number), SICI (Serial Item & Contribution Identifier),...

11. Nguồn (Source): Các thông tin về xuất xứ của tài liệu, tham chiếu đến nguồn mà tài liệu hiện mô tả được trích ra/tạo ra, nguồn cũng có thể là: đường dẫn (URL), URN, ISBN, ISSN...

12. Ngôn ngữ (Language): Các thông tin về ngôn ngữ, mô tả ngôn ngữ chính của tài liệu: .

13. Liên kết (Relation): Mô tả các thông tin liên quan đến tài liệu khác. có thể dùng đường dẫn (URL), URN, ISBN, ISSN...

14. Diện bao phủ (Coverage): Các thông tin liên quan đến phạm vi, quy mô hoặc mức độ bao quát của tài liệu. Phạm vi đó có thể là địa điểm, không gian hoặc thời gian, tọa độ...

15. Bản quyền (Right): Các thông tin liên quan đến bản quyền của tài liệu.


Xem online : Tham khảo