Blog Đông Tác

Nguyễn Chí Công, CFLS

Trang nhà > Công nghệ > Thông tin > Chuẩn ODF thích hợp cho toàn cầu

Chuẩn ODF thích hợp cho toàn cầu

Thứ Ba 7, Tháng Tám 2007, bởi From FB

Thế giới văn bản đang đứng trước 2 sự lựa chọn ODF và OOXML. Chọn ODF là chọn tự do, còn chọn OOXML là chọn áp đặt. Về bản chất, số phận của OOXML là chưa được quyết định và nó còn có quá nhiều lỗi.

Chúng ta đã có rất nhiều kinh nghiệm về sự phức tạp của các kiểu cách gõ tiếng Việt và quá nhiều chuẩn mực về chúng, từ đó mất quá nhiều chi phí (thời gian và tiền của) để chuẩn hoá các tài liệu trong cơ quan, doanh nghiệp. Đã quá thấm thía về sự phức tạp này và chúng ta không thể đọc được các tài liệu hiện tại (từ nhiều công ty khác nhau hay Cơ quan nhà nước) chính vì các chuẩn khác nhau.

Chính vì thế, việc để tồn tại hơn một chuẩn dữ liệu (dù có một hoặc nhiều sự tương đồng) đều là không thể ở một nước nào. Vậy, chúng ta đợi chờ gì việc lựa chọn ODF hay OOXML làm chuẩn dữ liệu?

Hãy nhìn theo quan điểm thực tại và định hướng tương lai. Trong bài viết này, tôi muốn chia sẻ một cách sâu sắc về hai mặt của chuẩn dữ liệu. Đó là tính kinh tế và tính phù hợp (chấp nhận dễ dàng) cũng như khả năng độc lập của các định dạng này.

OOXML là cách Microsoft hoá định dạng toàn cầu

Sẽ rất khó khăn cho người lập trình, các nhà sản xuất phần mềm... thực hiện việc chuyển đổi sang OOXML cho phù hợp với dữ liệu của họ. Như đã được đề cập trong phần http://en.wikipedia.org/wiki/Office_Open_XML về các đặc trưng của OOXML cũng như thực tế mà Microsoft phải công nhận, OOXML có độ phức tạp quá lớn, điển hình là:

  • Bề dày 6.000 trang tài liệu để miêu tả chúng và rất phức tạp để hiểu. Tuy thế, việc xem xét tài liệu chỉ trong vòng 30 ngày cũng đã phát hiện ra quá nhiều lỗi trong OOXML. Sau khi cộng đồng nhận xét về những sai phạm trong tài liệu này, Microsoft không phản ứng và cũng không giải quyết các lỗi của chúng. Tài liệu này vẫn cứ thế, giữ quan điểm lập trường riêng của mình.
  • Chứa định dạng binary.
  • Sử dụng quá nhiều từ vựng (27 namespace và 89 schema module).
  • Chưa được công nhận là chuẩn ISO.
  • Chỉ có Microsoft đang phát triển và hỗ trợ.
  • Không có tính tương thích tốt (ngay chính các tài liệu theo định dạng của Microsoft như trong MSOffice 2003 cũng không thể đọc được).
  • Thay đổi liên tục (không ổn định về mặt quan điểm ngay trong nội bộ của Microsoft).
  • Nhiều sự dư thừa, trùng lặp và không tương thích để có thể làm việc với định dạng chuẩn ISO ODF.
  • Sai luôn cả về các dữ liệu dạng ngày tháng (ví dụ: OOXML không thể dùng ngày 1/3/1900) và không theo chuẩn ISO trong định dạng ngày tháng năm.
  • Không theo chuẩn tên kích thước, cỡ trang giấy và tự ý thay đổi chúng. Vì thế, không thể hoạt động tốt với các dữ liệu chuẩn khác.
  • Nhiều lỗi trong chính việc thiết lập các công thức của bảng tính trong chương trình bảng tính của Microsoft.
  • Không hỗ trợ cho các ứng dụng trên nền khác, kể cả chính công cụ của Microsoft. Hiện nay, các phần mềm đang dùng MS Office như MacOS MS Office 2008 cũng chưa được hoàn thiện.

Và vô số những khó khăn khác mà tôi không thể đề cập hết.

Tuy nhiên, OOXML vẫn có những điểm cần quan tâm. Microsoft đang nỗ lực hoàn thiện các bộ lọc và chuyển đổi để đối phó những chỉ trích về OOXML. Họ cũng có những nỗ lực không ngừng trong việc đưa OOXML thành chuẩn ISO. Về sự phức tạp, OOXML hầu hết tạo ra một định dạng khá hoàn thiện về mặt lý thuyết (không phải tuyệt đối, như chính ODF) và có những hỗ trợ trong bộ Microsoft Office 2007.

ODF đơn giản, gọn nhẹ và đã được công nhận chuẩn ISO

  • Định dạng là 100% theo chuẩn XML và nội dung được nén theo chuẩn lossless để nhẹ hoá kích thước tập tin. Rất tốt cho việc truyền thông tin cũng như trao đổi thông tin, mã hoá cần thiết.
    Ví dụ, Microsoft 2007 với một văn bản bình thường chứa 2 trang A4, sẽ có kích thước gấp 5 lần kích thước OpenOffice (theo chuẩn ODF). Như vậy, để chuyển tải văn bản này, Microsoft phải trả 5 lần chi phí dung lượng đường truyền. Một khía cạnh khác, nếu tính đến bảo mật dữ liệu, Microsoft chiếm đến 5 lần thời gian so với một tập tin OpenOffice theo chuẩn ODF để mã hoá hết dung lượng. Nên biết rằng, bảo mật dữ liệu là cần thiết và việc bảo mật sẽ tốn rất nhiều thời gian. ODF là rất phù hợp để giải quyết công việc này.
  • Khả năng hỗ trợ cho người không thể đọc văn bản trong chuẩn ODF là rất quan trọng. Tuy đang trên đường được công nhận, nhưng ODF đã là một chuẩn cho phép hỗ trợ khả năng này.
  • Hỗ trợ cho cả OOXML và các loại văn bản khác (hầu hết).
  • Không có một sai sót nào trong định dạng và đã được kiểm tra rất công phu.
  • Chuẩn do cộng đồng đánh giá (không phải là một tổ chức 110 người như OOXML đã làm và cũng không phải chỉ có 30 ngày xem xét) kỹ lưỡng trước khi thành chuẩn ISO.
  • Miễn phí (ngay cả những ứng dụng).
  • Hỗ trợ luôn chuẩn công thức toán học cho các học giả soạn thảo văn bản định dạng báo cáo khoa học (Microsoft chưa hỗ trợ công cụ này cũng như định dạng chuẩn trên).
  • Hỗ trợ định dạng chuẩn cho chữ ký số (như PDF đang hỗ trợ). Nghĩa là, khả năng lưu trữ chữ ký số đã được chuẩn hoá trong khi OOXML thì chưa được thông qua. Chuẩn lưu trữ chữ ký số của ODF dựa theo chuẩn nổi tiếng XMLDSig.

Nhìn về khía cạnh lợi ích

Chúng ta thấy rằng: lựa chọn một chuẩn áp dụng cho từng quốc gia là rất đúng đắn. Tuy nhiên, chúng ta cũng thừa nhận rằng, trên bình diện toàn thế giới thì không thể có một chuẩn vì cần có sự cạnh tranh sáng tạo để đi lên. Nếu chỉ có OOXML thì LINUX và OpenOffice sẽ không tồn tại, hay ngược lại. Vì thế, hai chuẩn tồn tại là tất yếu.

Tuy nhiên, chúng ta không thể chấp nhận có hai chuẩn song song trong một quốc gia. Điều cần thiết là chúng ta chọn chuẩn nào cho phù hợp. Theo quan điểm cá nhân tôi, ODF là thích hợp nhất cho Việt Nam vì những lý do sau:

  • Giảm chi phí cho việc phát triển về lâu dài.
  • Tự do cạnh tranh vào thị trường công nghệ thông tin. Chúng ta đã tạo một sức bật công nghệ qua việc áp đặt người dùng vào thế quyết định ứng dụng công nghệ thông tin cần có bản quyền thì chúng ta cần mở ra cho họ một cơ hội tạo thế cạnh tranh với các hãng lớn. Chúng ta cần buộc các chuẩn phải mở và tự do hoá. Chuẩn dữ liệu phải có tính chất bình đẳng, khách quan và tôn trọng các nguyên tắc cơ bản (nghĩa là không sai sót).
  • Nâng cao tốc độ, khả năng an toàn và khách quan về mặt công nghệ. Hiện nay, OOXML chỉ có Microsoft thống lĩnh, trong khi ODF là toàn cầu. Vì thế, chúng ta có thể bảo mật dữ liệu theo chuẩn của mình và lưu trong tài liệu theo chuẩn ODF.
  • Làm việc qua mạng thì vấn đề vấn đề cơ bản là tối ưu đường truyền. Hãy tưởng tượng có 40 triệu người gửi nhận văn bản hàng ngày trên cả nước thì chỉ riêng việc chi phí cho 1 byte dữ liệu trên đường truyền sẽ tiêu tốn bao nhiêu tiền của.
  • ODF là chuẩn ISO và OOXML cần phải chấp nhận sửa đổi để phù hợp. Nghĩa là, OOXML cần phải tuân thủ ODF và ngược lại. OOXML không chấp nhận ODF, trong khi nỗ lực ODF là kết hợp một cách hoàn mỹ (xem www.openoffice.org) với OOXML và mọi định dạng khác. Vì thế, ODF là chuẩn tốt.
  • Chữ ký số trong ODF đã được thông qua, trong khi OOXML còn đang bàn cãi.
  • Cơ hội cho LINUX và chúng ta qua sự xuống dốc của MS VISTA trong phiên bản vừa qua đi ngược với sự hưng thịnh của LINUX.
  • Cuối cùng, chọn ODF là chọn tự do, còn chọn OOXML là chọn áp đặt.

Vì bản chất OOXML là chưa được quyết định và OOXML còn quá nhiều lỗi chủ quan cũng như khách quan OOXML cần được hoàn thiện tốt và nên hỗ trợ ODF như một yêu cầu trước khi đưa ra một chuẩn dữ liệu.

Nguyễn Văn Hiền