Dữ liệu mở là gì

Dữ liệu mở là dữ liệu mà bất kỳ ai cũng có thể truy cập, sử dụng và chia sẻ. Từ hơn chục năm nay, các trang web như Đông Tác và HA NOI 360° đều đã và đang cung cấp dữ liệu mở. Bảo tàng Công nghệ Thông tin vừa khai trương tại Hà Nội cũng mong được công chúng đón nhận như vậy.

Gần đây xu hướng mở đang lan rộng từ Âu-Mỹ ra khắp nơi. Dưới đây là bài giảng ban đầu về dữ liệu mở với một định nghĩa so với trước kia còn rộng và thoáng hơn nhiều. Xin chân thành cảm ơn TS. David Tarrant - tác giả và KS Lê Trung Nghĩa - dịch giả.

ĐỊNH NGHĨA

  • Dữ liệu mở là dữ liệu mà bất kỳ ai cũng có thể truy cập, sử dụng và chia sẻ.
  • Dữ liệu mở trở nên khả dụng sau khi được chuẩn bị sẵn sàng ở những định dạng phổ biến mà máy tính đọc được.
  • Dữ liệu mở phải được cấp phép mở. Giấy phép của nó phải cho phép mọi người sử dụng dữ liệu đó theo bất kỳ cách gì họ muốn, bao gồm biến đổi, kết hợp và chia sẻ nó với những người khác, thậm chí một cách thương mại.

Từ dữ liệu thô tới thông tin mới và tri thức

  • Không có dữ liệu chúng ta không thể xây dựng thông tin, và không có thông tin sẽ không có tri thức mới.

Dữ liệu

  • Dữ liệu là tư liệu thô, từ đó thông tin và tri thức có thể được dẫn xuất.
  • Hãy nghĩ về dữ liệu như các địa điểm, hình ảnh, mô tả, rà soát lại, và giá cả... tạo nên cơ sở của thông tin có thể giúp bạn lập kế hoạch cho một ngày nghỉ, ví dụ thế.

    Thông tin
  • Dữ liệu trở thành thông tin khi nó được đưa ra trong một ngữ cảnh tường minh.
  • Tiếp theo từ ví dụ trước, các địa điểm, hình ảnh, mô tả và giá cả... tất cả có thể giúp cung cấp thông tin có liên quan tới điểm thu hút du lịch.
  • Bộ sưu tập và cách trình bày dữ liệu giúp tạo thành thông tin.

    Tri thức
  • Tri thức là những gì được dẫn xuất từ thông tin, và được cá nhân hóa cho các nhu cầu của bạn.
  • Việc xây dựng tri thức là một quy trình biến thông tin thành các lựa chọn.
  • Xây dựng dựa vào ví dụ ở trên, biết rằng không ai trong gia đình của bạn thích chủ đề các công viên sẽ giúp bạn quyết định những địa điểm nào nên tránh trong kỳ nghỉ, và nơi nào phù hợp hơn với gia đình của bạn.

    Điều gì làm cho dữ liệu thành mở?

  • Dữ liệu là mở nếu bất kỳ ai cũng có thể truy cập, sử dụng và chia sẻ nó.
  • Có vài điều đơn giản để cân nhắc khi định nghĩa tính mở:

Các hạn chế

  • Để dữ liệu là mở, không nên có các hạn chế cản trở nó trong việc được sử dụng theo bất kỳ cách thức cụ thể nào.
  • Bất kỳ ai cũng nên có tự do để sử dụng, sửa đổi, kết hợp và chia sẻ dữ liệu đó, thậm chí một cách thương mại.

Chi phí

  • Dữ liệu mở phải là tự do không mất tiền để sử dụng, nhưng điều này không ngụ ý nó phải là tự do không mất tiền để truy cập.
  • Thường phải có chi phí để tạo lập, duy trì, và xuất bản dữ liệu sử dụng được.
  • Lý tưởng là bất kỳ khoản phí nào để truy cập dữ liệu mở cũng không nên lớn hơn so với chi phí hợp lý để tái tạo lại đơn vị dữ liệu được yêu cầu.
  • Chi phí tái tạo lại này có xu hướng không đáng kể đối với nhiều tập hợp dữ liệu.
  • Dữ liệu sống và dữ liệu lớn có thể chịu các chi phí liên tục liên quan tới cung cấp dịch vụ tin cậy.

Sử dụng lại

  • Một khi người sử dụng có dữ liệu, họ được tự do để sử dụng, sử dụng lại và phân phối lại nó - thậm chí một cách thương mại.
  • Dữ liệu mở được đo lường bằng việc nó có thể được sử dụng cho những gì chứ không phải nó được làm cho sẵn sàng bằng cách nào.
  • Các khía cạnh như định dạng, cấu trúc và khả năng máy đọc được, tất cả làm cho dữ liệu sử dụng được nhiều hơn, và tất cả nên được cân nhắc thận trọng.
  • Tuy nhiên, chúng không làm cho dữ liệu đó mở hơn.

Vì sao chúng ta cần dữ liệu mở?

  • Dữ liệu mở có thể giúp mang lại những lợi ích khác nhau cho các chính phủ, doanh nghiệp và xã hội dân sự.

    Biến đổi chính phủ
  • Dữ liệu mở có thể giúp làm cho các chính phủ minh bạch hơn. Nó có thể cung cấp bằng chứng rằng tiền của nhà nước được chi tiêu tốt và các chính sách đang được triển khai tốt.
  • Ví dụ: theo nhà hoạt động xã hội hàng đầu về chính phủ mở David Eaves, dữ liệu mở đã cho phép các công dân ở Canada tiết kiệm cho chính phủ 3,2 tỷ USD tiền quyên góp từ thiện gian lận trong năm 2010. Xem bài báo của David Eaves
  • Dựa vào dự báo GDP của EU28+ GDP cho năm 2020, trong khi tính tới chi tiêu trung bình của chính phủ các quốc gia tương ứng, tiết kiệm chi phí cho mỗi quốc gia có thể tính được. Tổng các khoản tiết kiệm chi phí cho EU28+ trong năm 2020 là 1,7 tỷ EUR theo ước tính.
  • Lexbase là dịch vụ web cung cấp thông tin công cộng từ các tòa án và các cơ quan chức năng khác của Thụy Điển. Trên website các phán xét về các vụ kiện hình sự và dân sự có liên quan tới các cá nhân và công ty có thể được tìm thấy. Cơ sở dữ liệu đó được cập nhật với các phán xét và quyết định mới mỗi ngày. Website đó được sử dụng để cung cấp cho các công dân thông tin về các lĩnh vực tội phạm và khác.
  • Trong một ví dụ khác, theo Follow the Money (Đi theo Tiền) ở Nigeria, quy trình y hệt được sử dụng để đảm bảo công quỹ được chi tiêu để triển khai các chính sách được hứa hẹn với người dân. Xem bài "Đi theo Tiền" (Follow the Money)

    Xây dựng các cơ hội kinh doanh mới
  • Dữ liệu mở đang mở ra các cơ hội mới cho các doanh nghiệp để kết nối với các khách hàng.
  • Ví dụ: Sở Giao thông Luân Đôn phát hành dữ liệu mở mà các lập trình viên đã sử dụng để xây dựng hơn 800 ứng dụng giao thông. Xem bài Giáo thông cho Luân Đôn
  • Thomson Reuters đang sử dụng dữ liệu mở để kết nối với các khách hàng hiện đang có để cung cấp các dịch vụ tốt hơn. Xem bài Thomson Reuters
  • Các công ty khởi nghiệp trong chương trình Khởi nghiệp của ODI bây giờ sử dụng tổng số hơn 70 người và sinh ra doanh thu hơn 4 triệu £. Xem báo cáo thường niên của ODI

    Bảo vệ trái đất của chúng ta
  • Mạng Web đã trở thành phần hạ tầng chính của chúng ta và dữ liệu mở sẽ được xây dựng trên hạ tầng này.
  • Dữ liệu mở về việc liệu có thể cung cấp hệ thống cảnh báo sớm cho các thảm họa môi trường hay không, ví dụ thế. Xem trung tâm tin tức của Liên hiệp quốc
  • Dữ liệu mở cũng đang giúp những người tiêu dùng hiểu được các tác động của cá nhân họ lên môi trường, và tiến hành các bước để cải thiện nó. Xem báo cáo Các lựa chọn tốt hơn làm được tốt hơn