THẤY GÌ QUA HAI CUỘC HỘI THẢO LIÊN NGÀNH NGÔN NGỮ VÀ CÔNG NGHỆ THÔNG TIN?

Sau khi báo chí rộ lên việc có một dự án tiếng Việt định đưa 4 ký tự F, J, W, Z vào bảng chữ cái tiếng Việt mà nhiều người cho rằng sở dĩ có chuyện này là do nhu cầu phát triển của ngành công nghệ thông tin (CNTT), Hội Trí thức trẻ đã hai lần tổ chức hội thảo liên ngành để bàn một vấn đề có tính chất rộng hơn: ngôn ngữ học và tin học cần phối hợp với nhau như thế nào để hỗ trợ cùng phát triển?

Cuộc hội thảo thứ nhất ở quy mô “toạ đàm” ngày 7/9/2011 mang chủ đề “Công nghệ thông tin và tiếng Việt”. Tham gia hội thảo phía ngôn ngữ có các ông Dương Kỳ Đức (Hội Ngôn ngữ học), Phạm Văn Tình (Viện Từ điển học và Bách khoa thư), Đào Hồng Thu (Đại học Bách khoa), Nguyễn Văn Hiệp (Đại học Khoa học Xã hội và Nhân văn), Đào Tiến Thi (Nhà Xuất bản Giáo dục),…; phía CNTT có các ông Nguyễn Ái Việt (Viện CNTT – ĐHQG Hà Nội), Quách Tuấn Ngọc (Cục CNTT, Bộ Giáo dục và Đào tạo). Với một vấn đề lớn như vậy mà số người tham dự như vậy là quá ít ỏi. Tuy nhiên, đối chiếu với chủ đề đặt ra, cuộc hội thảo cũng đã đạt được ở mức “đề dẫn”, rằng có sự liên quan giữa ngành khoa học CNTT và ngôn ngữ học, chỉ thế thôi, chứ cũng chưa ai rõ quan hệ đó bao gồm những gì, trách nhiệm của mỗi bên đến đâu. Nội dung hội thảo cuối cùng lại xoay quanh mấy chữ F, J, W, Z có nên đưa vào bảng chữ cái tiếng Việt hay không. Thực ra vấn đề ấy đâu đơn giản như nhiều người nghĩ, đưa vào quy mô “toạ đàm” này là quá tầm. Đưa thêm vào hay để thay thế một số ký tự cũ trong bảng chữ cái tiếng Việt là quy mô cả một cuộc cải cách chữ viết, ở tầm quốc gia đại sự chứ đâu phải chuyện chơi.

Cuộc hội thảo thứ hai, chính danh là “hội thảo”, ngày 30/11/2011, mang chủ đề “Xử lý tiếng Việt – nhiệm vụ quan trọng nhất của Đề án đưa Việt nam thành nước mạnh về CNTT”.

Ngoài việc số người tham gia vẫn ít ỏi, chúng ta thấy có nhiều điều không ổn. Chủ đề hội thảo không được rõ ràng. Theo tôi “xử lý tiếng Việt” là một vấn đề của CNTT nhưng chắc không phải là vấn đề quan trọng nhất để biến Việt Nam thành nước mạnh về CNTT. Nói thế thì như là CNTT phải bắt đầu từ tiếng Việt, và CNTT còn kém là do “tắc” từ tiếng Việt? Chắc không phải thế.

Số người tham dự đã ít mà cuối cùng cũng giống như lần trước, lại trở về chuyện F, J, W, Z. Một số người bảo đây là chuyện nhỏ. Kỳ thực đây là chuyện cực kỳ lớn như trên đã nói. Tiến hành ở quy mô quốc gia chưa chắc đã giải quyết được gì nữa là một nhóm người.

Và cuối cùng, chủ đề của hội thảo - “xử lý tiếng Việt” - cũng không rõ là xử lý cái gì. Cách đặt vấn đề như trên có lẽ cũng chưa chính xác. Tiếng Việt (gồm ngữ âm, chính tả, ngữ pháp,…) là cái đã định hình, ổn định, nếu muốn thay đổi phải là quá trình từ từ, chậm chạp, nghĩa là không thể “xử lý” (hiểu là tạo ra những thay đổi) được. Tiếng Việt không thể chiều theo CNTT mà thay đổi trước. Như thế có khác nào gọt chân cho vừa giày. Lẽ ra vấn đề phải xử lý là CNTT chứ đâu phải xử lý tiếng Việt.

Mặt khác, qua tìm hiểu ý kiến một số chuyên gia CNTT, tôi chưa thấy ai nêu một rào cản nào do đặc điểm tiếng Việt mang lại. Một người làm CNTT cho tôi biết nhiều chuyên gia CNTT giỏi người Nhật, người Hàn Quốc không giỏi tiếng Anh, họ hoàn toàn làm việc trên phương tiện tiếng mẹ đẻ. Một chuyên gia CNTT nói rằng cái khó cho họ là hệ thống thuật ngữ CNTT của Việt Nam hiện nay chưa khoa học, kém thống nhất. Nếu thế thì lỗi thuộc về ngành CNTT chứ đâu thuộc về tiếng Việt. Trong ngành ngôn ngữ học nói chung, Việt ngữ học nói riêng cũng có chuyện hệ thống thuật ngữ bất cập, lộn xộn, thì đó là lỗi của ngôn ngữ học, Việt ngữ học chứ đâu của tiếng Việt. Từ lâu những nhà khoa học lớn của Việt Nam đều khẳng định tiếng Việt có đủ khả năng để diễn tả mọi khái niệm khoa học không thua kém bất cứ một ngôn ngữ nào.

Một số ý kiến đề xuất cần có Luật tiếng Việt. Luật tiếng Việt nếu có thì nó có thể góp phần nào cho việc giao tiếp, chủ yếu là việc thảo văn bản đỡ tùy tiện. Nhưng trong tình hình hình hiện nay, nhiều luật (hoặc việc thực hiện luạt đó) cấp thiết hơn nhiều, chứ không phải luật tiếng Việt. Còn việc tác động đến CNTT điều quan trọng là quy luật (chữ “luật” viết thường, đó là các đặc điểm ngữ âm, chữ viết, ngữ pháp,…) do các nhà khoa học tổng kết từ thực tiễn, chứ không phải cái luật hành chính (viết hoa) như các luật khác do nhà nước ban hành. Luật tiếng Việt, theo tôi là không cần thiết, vì hai lẽ sau:

- Bản thân việc sử dụng tiếng Việt đã tự nó có luật rồi. Nó gồm hai loại luật: luật thành văn và luật bất thành văn. Luật thành văn là những quy định có tính pháp lý, chủ yếu là quy định chính tả. Luật bất thành văn là các quy tắc (ngữ âm, chính tả, ngữ pháp,…) mà cộng đồng mặc nhiên thừa nhận, có thể được đúc rút thành quy tắc trong cách sách dạy về Việt ngữ học mà cũng có thể không. Nếu không có luật về giao thông, người ta có thể đi lung tung, nhưng không có luật về tiếng Việt, không ai có thể nói (viết) lung tung (lung tung hiểu là bất chấp các quy tắc tiếng Việt), vì nói (viết) lung tung thì không ai hiểu. Cho nên dù muốn dù không mỗi người khi sử dụng đều phải tuân theo các luật (quy tắc) mang tính khách quan ấy (nếu không tuân theo như nói ngọng, viết sai chính tả, ngữ pháp,… thì thuộc về năng lực, thuộc về điều bất khả kháng).

- Thay vì công sức, tiền bạc bỏ ra làm Luật tiếng Việt (“Luật” viết hoa, tức pháp lệnh hoá việc sử dụng tiếng Việt) thì hãy làm “luật” tiếng Việt viết thường, ấy là nghiên cứu kĩ để có những chuẩn hoá về ngữ âm, ngữ pháp, đặc biệt là về chính tả, trong đó chủ yếu là vấn đề nan giải hiện nay: viết tên riêng nước ngoài, tên riêng các dân tộc thiểu số ở Việt Nam.

Vấn đề xúc tiến hiện nay theo tôi trước hết là ngành CNTT thấy “tắc” những gì thì từ đó đề xuất ngành ngôn ngữ học nghiên cứu, trợ giúp. Ví dụ, quy tắc đánh dấu thanh điệu, quy tắc viết hoa, quy tắc viết i/y,… kể cả các quy tắc ngữ pháp. Theo tôi biết, hiện nay một số chuyên gia làm phần mềm dịch tự động, họ không cần căn cứ vào các từ điển hay sách ngữ pháp tiếng Việt. Họ để cho máy tính tự tìm ra luật sau khi đã nạp cho nó một số dữ liệu văn bản nhất định. Tức là chỉ căn cứ vào cái ngôn ngữ tự nhiên, chọn một cách ngẫu nhiên, chưa bao gồm hết các hiện tượng. vả lại, nếu may, chọn được văn bản đúng, hay, thì có luật đúng; nếu không may chọn phải văn dởm thì cái luật mà máy tính tìm ra một cách “rất máy” đó cũng là luật dởm. Trên nguyên lý này, ngành ngôn ngữ học có thể giúp CNTT hoàn thiện. Ví dụ, khi sử dụng phần mềm sửa chính tả tự động, tôi thấy có những chữ đúng nhưng bị máy cho là lỗi. Ví dụ khi nạp “trở về” là đúng thì tất cả mọi chỗ viết “chở về” đều được máy đánh dấu sai, nhưng thực tế lại có kết hợp “chở về” trong trường hợp “khai thác khoáng sản chở về Pháp”.

Thiết nghĩ ban đầu sự hợp tác liên ngành chỉ ở quy mô nhỏ với một số đề tài xác định. Quá trình hợp tác chắc sẽ nảy sinh nhiều vấn đề hơn, và những bước sau sẽ nghiên cứu và hợp tác toàn diện hơn. Cho nên ở bước đầu này không cần thành lập ban bệ cồng kềnh. Chỉ cần ngành CNTT đặt ra một số vấn đề cần để giới ngôn ngữ học nghiên cứu sau đó đem ra trao đổi. Người chủ trì có thể là Liên hiệp hội khoa học – kỹ thuật Việt Nam hoặc một tổ chức của CNTT hoặc Hội ngôn ngữ học, chưa cần đến sự tham gia của nhà nước.

ThS Đào Tiến Thi
(Biên tập viên NXB Giáo dục Việt Nam,
Ủy viên BCH Hội Ngôn ngữ học Việt Nam)