Nước Anh có thể ngăn Chủ nghĩa Cộng sản AI?
by ASHLEY RINDSBERG
AILiệu ai có thể cạnh tranh với siêu hệ thống AI (Trí tuệ Nhân tạo) của Trung Quốc? Những chính quyền quan liêu đang mơ ngủ trên khắp thế giới cuối cùng cũng phải bừng tỉnh trước thực tại phũ phàng rằng chẳng ai có cửa mà cạnh tranh cả.
Trung Quốc đã đang bứt tốc tiếng rất xa rồi. Chỉ mới tháng trước thôi, họ đã cho ra mắt Moss Bot, đối thủ mới nhất của bộ AI ChatGPT của San Francisco, và dự định sẽ phát hành một AI khác nữa trong tháng này. Trong khi đó, nước Anh đang tụt lại rất xa.
Tony Blair nghĩ rằng nước Anh nên đặt mình vào tình trạng kinh tế thời chiến và dồn tài nguyên vào việc phát triển một bộ khung AI mới có thể cạnh tranh được với Trung Quốc. Tuy nhiên, thật khó mà nhìn ra được tính khả thi - hay thậm chí là những kỳ vọng - của điều đó.
Lý do chính của điều này là AI cần có dữ liệu mới vận hành được. Rất rất nhiều dữ liệu. Bằng cách cung cấp một lượng lớn thông tin cho các AI, hệ thống học sâu (Deep Learning) có thể huấn luyện cho chúng cách tìm những mối tương quan giữa các điểm dữ liệu có thể cho ra kết quả mong muốn. Vì việc học sâu sẽ phát triển cho AI, nó cần có nhiều dữ liệu hơn, từ đó học được nhiều hơn, và lại cần thêm dữ liệu.
Trong khi nhiều nước có thể gặp khó khăn với nhu cầu dữ liệu lớn vô độ của một AI, Trung Quốc lại không hề thiếu nguồn cung. Vì đất nước này hoàn toàn nối mạng trong những năm đầu thiên niên kỷ mới, Trung Quốc đang dần tạo nên một hệ thống giám sát nhà nước nhờ thu thập một lượng dữ liệu vô tận về những người dân trong nước. Sáng kiến này bắt nguồn từ Chính sách Một Con: động lực kiểm soát tổng thể dân số - ở mức độ nhân khẩu học - phát triển thành nhu cầu kiểm soát dân số ở mức độ cá nhân.
Điều này trở nên rõ ràng vào năm 1997, khi Trung Quốc đưa ra những điều luật đầu tiên về “tội phạm mạng”, và tiếp tục phát triển vào đầu những năm 2000 khi CCP bắt đầu xây dựng Tường Lửa Lớn để kiểm soát những gì người dân của họ có thể truy cập trên mạng. Những nguyên tắc chỉ đạo của nó được thể hiện qua một câu cách ngôn của cựu lãnh tụ Đặng Tiểu Bình: “Nếu mở cửa sổ cho thoáng thì phải cần thận có ruồi bay vào.” Tường Lửa Lớn là cách để Trung Quốc tránh ruồi.
Trung Quốc có định nghĩa rất rộng về loại “ruồi” này. Vào năm 2017, khu vực Tân Cương của Trung Quốc, nơi sinh sống của dân tộc thiểu số Duy Ngô Nhĩ, đã triển khai cơ sở dữ liệu mống mắt đầu tiên trên cả nước, trong đó chứa dữ liệu nhận diện sinh trắc học của 30 triệu người. Đây là một phần trong một nỗ lực lớn hơn nhằm trấn áp người dân Duy Ngô Nhĩ bằng những chiến thuật chống khủng bố, hùng biện và giám sát, hay còn được biết đến là Strike Hard Campaign.
Đây là một bước tiến lớn trong công cuộc phát triển nhà nước giám sát của Trung Quốc. Tuy nhiên, bước tiến này vẫn là rất nhỏ so với chiến lược Zero COVID của CCP, trong đó nhà nước đã lấy mẫu và theo dõi tất cả 1.4 tỉ người dân của họ. Khi bạn nghĩ đến rằng cơ sở dữ liệu di truyền của toàn bộ dân số này được gắn liền với trung tâm cuộc sống trên mạng của họ - tức là điện thoại di động của họ - thông qua mã QR, bạn sẽ thấy rằng trong ba năm qua, Trung Quốc đã có được trong tay một siêu đại dương dữ liệu với quy mô lớn chưa từng thấy trong lịch sử loài người.
Tuy nhiên, sự “dư thừa dữ liệu” này, như ông Lý Khai Phục, cựu CEO của chi nhánh Trung Quốc của Google, đã miêu tả trong cuốn sách AI Superpower của mình, không thể giải thích đầy đủ về mức độ lợi thế về dữ liệu của Trung Quốc. Tuy Hoa Kỳ cũng đang có một khối dữ liệu lớn tương đương nhưng vẫn có những điểm khác biệt rất lớn. Thứ nhất, dữ liệu của Hoa Kỳ đang nằm trong tay những công ty cá nhân nắm độc quyền với chúng, và làm cho những kho dữ liệu này bị tách rời. Tuy hệ thống giám sát nhà nước của Hoa Kỳ rất rộng và sâu, nhu cầu duy trì bảo mật dữ liệu từ cả góc độ cá nhân lẫn an ninh quốc gia không cho phép phần lớn số dữ liệu ấy được đem ra để phát triển AI. Ngược lại, Trung Quốc đang xóa mờ ranh giới giữa nhà nước và các công ty cá nhân, cho phép họ truy cập một lượng dữ liệu vô hạn được tập trung lại.
Điểm khác biệt thứ hai cũng quan trọng không kém. Như ông Lý đã chỉ ra, dữ liệu của Hoa Kỳ được khai thác từ thế giới trên mạng – từ những ứng dụng và trang web ngấu nghiến hấp thụ dữ liệu. Trong khi đó, nhờ tính phổ biến của nhà nước giám sát, dữ liệu của Trung Quốc được lấy từ thế giới thật. Nó bao gồm những nơi bạn thực sự đi tới, những gì bạn làm, nói chuyện, làm việc, hẹn hò, tranh luận hay qua lại với ai. Khi AI đang biến thế giới thực thành một thế giới kết hợp giữa hiện thực và kỹ thuật số, lượng dữ liệu của Trung Quốc thể hiện một lợi thế đáng kể. Do đó, theo lời của ông Lý, nó chính là “Saudi Arabia dữ liệu”.
Liệu nước Anh có hy vọng bắt kịp gã khổng lồ này không? Tony Blair tin rằng bằng cách huy động trí tuệ của người Anh trong việc phục vụ mục tiêu quốc gia, nước Anh có thể trở thành một thế lực cạnh tranh tầm cỡ thế giới trong lĩnh vực AI. Ý tưởng này có cơ sở vững chắc trong thực tế lịch sử, vì những đóng góp của nước Anh cho việc phát triển AI đều thuộc trọng tâm cơ bản. Từ DeepMind, công ty AI gốc Anh đã được công ty mẹ của Google là Alphabet mua lại vào năm 2014, đến những nhân vật vĩ đại như George Hinton, cựu sinh viên Cambridge và nhà tiên phong trong lĩnh vực AI, nước Anh là một trụ cột trong tam đầu chế Anh-Mỹ-Canada của ngành phát triển và nghiên cứu AI.
Tất cả những điều này đều rất khả quan. Tuy nhiên, chúng vẫn né tránh sự thật rằng công nghệ AI đã hiện diện rồi. Cái đang thiếu là dữ liệu. Như thể thế giới đang có một bản thiết kế không có bản quyền cho một loại tên lửa mới mạnh mẽ hơn nhưng lại thiếu nhiên liệu trầm trọng. Ai cũng có thể chế tên lửa, nhưng chỉ có những người có đủ nhiên liệu mới có thể phóng nó đi.
Sức cám dỗ của việc dựa vào chính phủ để hoàn thành nhiệm vụ này có thể rất lớn, nhưng nó cũng phải dựa vào một mô hình chính phủ không còn tồn tại ở phương Tây nữa. Dù trước đây chính phủ Anh có kiến thức và ý chí chính trị để theo đuổi những dự án khổng lồ như hầm vượt eo biển Manche, một kỳ tích về kỹ thuật, những ngày đó có vẻ như đã qua rồi. Đường tàu Elizabeth tại London tốn mất 20 năm mới gần hoàn thiện, trong khi đường tàu siêu tốc HS2 giờ đã vượt ngân quỹ 50 tỉ bảng Anh và chậm tiến độ trong nhiều năm.
Trớ trêu thay, con đường tiến bước của Anh lại có thể được tìm thấy trong sổ tay kinh tế Trung Quốc. Vào năm 2010, Trung Quốc biến Trung Quan Thôn, một đoạn “Phố Điện Tử” đang suy thoái ở Bắc Kinh, thành vùng trung tâm phát triển công nghệ do liên doanh hỗ trợ. Nhờ tiền thuê nhà rẻ và nguồn tài trợ lớn của chính phủ, Trung Quan Thôn chỉ mất một thập kỷ để trở thành nơi sản sinh ra hàng chục ngàn công ty khởi nghiệp, một số trong đó sau này đã phát triển thành những công ty công nghệ lớn nhất thế giới, ví dụ như Tiktok.
Nước Anh có tinh hoa kinh tế, kinh nghiệm nghiên cứu và phát triển và sức hút với nước ngoài – tất cả có thể biến thành lợi thế để tạo ra một nơi thuận lợi cho những phát triển nhờ AI. Câu hỏi bây giờ là liệu nó có đủ ý chí chính trị để hoàn thành việc đó không.
Ngay cả khi chính phủ Anh có được ý chí cạnh tranh nghiêm túc trong “cuộc cách mạng công nghiệp lần thứ tư”, thì câu hỏi đặt ra vẫn là: Công dân của họ có thực sự muốn điều đó không?
Một câu nói thường thấy trong cộng đồng công nghệ là “AI là cộng sản”.
Bản chất độc quyền của AI đòi hỏi lượng dữ liệu khổng lồ và năng lực tính toán mà chỉ những công ty khổng lồ như Microsoft và Google mới có thể duy trì. Như hai công ty kể trên, những công ty có ưu thế trong cuộc đang ngày càng hợp tác với chính phủ (bao gồm cả Trung Quốc) để kiểm duyệt ngôn luận, giám sát hành vi và xây dựng xã hội, ý nghĩ rằng AI là cộng sản sẽ lặp lại nỗi sợ hãi có cơ sở rằng nó sẽ được sử dụng để kiểm soát từ trên xuống giống như một chính phủ.
Trong tay một chính phủ thực sự, AI chắc chắn sẽ khuyến khích nhà nước can thiệp sâu hơn vào cuộc sống của người dân. AI có chủ quyền cần có dữ liệu quốc gia, mà dữ liệu quốc gia thì cần sự kiểm soát từ trên xuống. Trong một quốc gia không ủng hộ việc đăng ký thẻ chứng minh nhân dân và đăng ký nhận dạng quốc gia (một việc làm khôn ngoan nhưng không phải không có cái giá của nó), cách tiếp cận này có vẻ không được khả thi. Bất chấp những tiềm năng khổng lồ mà AI đem lại cho việc cải thiện cuộc sống con người, nó cũng tiềm tàng những nguy cơ lớn không kém.
Một số lời bình luận
Andrew Dalton: Bất chấp nguy cơ bại lộ danh tính, tôi xin nói rằng tôi làm việc trong lĩnh vực của cuộc cách mạng công nghiệp lần thứ tư, mặc dù chủ yếu là trong việc ứng dụng công nghiệp của công nghệ này chứ không phải ứng dụng xã hội và chính trị của nó. Hậu quả của các công nghệ mới nổi là rất lớn và mặc dù tôi không muốn đưa ra các mốc thời gian cho sự phát triển và hậu quả của các công nghệ được triển khai, nhưng rõ ràng là tác động của chúng đến tất cả mọi mặt trong cuộc sống sẽ rất đáng kể.
AI không phải là chuyên môn về máy tính và phần mềm của tôi nhưng nó đã bắt đầu gây ngạc nhiên: cả về quá trình phát triển cũng như mức độ ngu ngốc mà đôi khi nó thể hiện (trừ khi nó đang cố ý đưa chúng ta vào trạng thái an tâm không đúng lúc). Điều khiến tôi băn khoăn là cách hoạt động của sự đổi mới, thường là các công nghệ hiện có được hợp nhất để tạo ra thứ gì đó mới.
Không khó để dự đoán rằng máy móc/người máy tiên tiến + AI sẽ khiến rất nhiều công việc trở nên dư thừa. Ngay khi điều này rẻ hơn so với người lao động rẻ nhất ở một địa điểm cụ thể, nó sẽ trở thành phương pháp được lựa chọn để trục lợi cho công ty trong quá trình toàn cầu hóa. Nó cũng có thể mang lại lợi ích cho chuỗi cung ứng (và do đó tác động đến môi trường) bằng cách cho phép các xí nghiệp và nhà máy đến gần nguồn nguyên liệu thô. Các nhà văn khoa học viễn tưởng và các nhà tương lai học đã dự đoán điều này trong nhiều thập kỷ.
Việc sử dụng AI như một hệ thống kiểm soát xã hội ít được thảo luận hơn một chút nhưng không phải là chưa từng có. Tuy nhiên, đó rõ ràng là sự đổi mới của việc hợp nhất mạng xã hội, hồ sơ công khai và AI. Giới thiệu các khái niệm cách mạng công nghệ lần thứ 4 khác như tiền ảo (trữ trong ngân hàng trung ương hoặc các ngân hàng khác), thật không khó để tiên đoán hệ thống tín dụng xã hội sẽ phát huy tác dụng ở đâu. Hãy nghĩ về việc robot đảm nhận công việc của con người, bạn sẽ thấy nó trở nên cần thiết (ít nhất là từ quan điểm chính trị).
Phúc lợi nhà nước, vốn đã được mở rộng rất nhiều sau khi các công việc lành nghề bị chuyển ra nước ngoài sẽ cần phải mở rộng trở lại. Trong một thế giới mà một công dân/người tiêu dùng cá nhân bị tách rời khỏi hoạt động sản xuất, thì khả năng chi tiêu của họ sẽ được kiểm soát như thế nào? Do đó, tôi thấy một điều không thể tránh khỏi là hệ quả của việc tự động hóa các công việc sẽ đòi hỏi hình thức phản hồi này.
Vâng, cách nhìn của tôi rất bi quan, Huxley hẳn sẽ tự hào lắm. Tầm nhìn “không tưởng” hơn đối với một xã hội tự động hóa, chẳng hạn như của Jacque Fresco, cần phải loại bỏ quá nhiều quyền lực khỏi tay chính phủ, các lợi ích siêu quốc gia và doanh nghiệp; và tôi không thấy bằng chứng nào cho thấy những nhóm đó sẽ từ bỏ quyền kiểm soát của mình. Một lần nữa chúng ta sẽ chứng kiến sự hợp nhất giữa lợi ích doanh nghiệp và lợi ích chính trị: một trong những điều yêu thích của Tony Blair.
Norman Powers: Vâng, bài luận rất hay, nhưng thật tệ là sai bét. Tôi không phản đối các nhà báo và cây viết bày tỏ ý kiến của mình về các chủ đề kỹ thuật nhưng ít nhất họ nên cố gắng tìm một người có kiến thức để kiểm tra luận điểm của mình trước khi bắt tay vào viết. Không, Lý Khai Phục không được tính, vì chủ trương hiện tại của ông ta là coi trọng việc làm Trung Quốc có vẻ hùng mạnh hơn là nói ra sự thật.
Để huấn luyện các LLM như ChatGPT hay “MossBot”, người ta cần rất nhiều dữ liệu, nhưng những dữ liệu đó có thể lấy được từ mạng Internet công khai, bao gồm cả sách/tạp chí/báo/vv... Đó không phải là loại dữ liệu giám sát như bài viết này đang nói tới. Có cả tỉ hình ảnh mống mắt lưu trong cơ sở dữ liệu à? Tốt thôi, chúng sẽ cực kỳ có ích nếu cần huấn luyện một AI có thể tạo ra những hình ảnh mống mắt ngẫu nhiên trông cực kỳ giống thật, nhưng hầu như không có ích gì khác. Cỏ một tỉ mẫu mô? Cũng tốt, giờ người ta có thể tạo ra những mẫu mô giả.
Đã hiểu ra chưa nào? Lý do người ta cần nhiều dữ liệu lấy được từ trên mạng để huấn luyện AI hiện đại là vì ta cần bộ AI đó tạo ra thứ mà mình tìm được trên Internet: trả lời câu hỏi, bài báo, ảnh, thơ, mã chương trình...
Vậy là dữ liệu không phải là mỏ dầu mới, nó thậm chí còn không giống với dầu. Dầu thì thùng nọ với thùng kia là như nhau. Còn dữ liệu thì không, đó là lý do tại sao những phép so sánh gượng ép như “Saudi Arabia của dữ liệu” là dấu hiệu cho thấy tác giả đang tỏ ra bác học chứ không phải người có chuyên môn (mà cũng chẳng cần biết nhiều cũng hiểu được điều này!).
Liệu chính phủ Anh có huấn luyện được một LLM không lồ nếu muốn hay không? Uh, tất nhiên? DeepMind có trụ sở ở London và họ đã làm được điều đó, vấn đề chỉ là cung cấp cho những người đó số lương cao gấp đôi và sau đó cho họ thời gian và kinh phí cần thiết để thu thập nhiều lần dữ liệu web, scan sách, v.v. cùng với một vài chục triệu đô tiền thiết bị phần cứng từ NVIDIA. Nhưng tại sao chính phủ Anh lại phải làm thế? Có thể những người như Blair cho rằng có điều gì đó mang tính chiến lược trong việc này nhưng không phải vậy. Anh ta nói Bộ khung AI nghĩa là gì? TensorFlow của Anh sao? Chắc chắn là không phải vậy.
“Một câu nói thường thấy trong cộng đồng công nghệ là “AI là cộng sản”.”
Tôi là một thành viên của cộng đồng công nghệ, thường xuyên đọc bài nghiên cứu về AI, tham gia thảo luận về AI và tôi chưa bao giờ nghe thấy ai nói như vậy. Câu đó có nghĩa gì chứ? Việc phát triển AI là ngược lại hoàn toàn với “Cộng sản”, những AI tối tân nhất đang được các công ty cá nhân huấn luyện, và AI nổi tiếng nhất bây giờ (ChatGPT) là của một công ty khởi nghiệp có nhiều vốn. Tôi không nghĩ được trên đời này có cái gì kém trong tính cộng sản hơn một công ty khởi nghiệp.
Michael Coleman: Không phải dữ liệu nào cũng có cùng giá trị. Trung Quốc đúng là đang theo giõi và ghi chép lại nhiều cuộc nói chuyện hơn bất cứ tổ chức nào (có lẽ là chỉ trừ NSA?) và việc đó sẽ giúp huấn luyện tốt hơn các AI dựa vào LLM như ChatGPT. Tương tự vậy, số lượng hình ảnh chụp con người sẽ giúp cho các AI nhận diện mặt người và hình ảnh.
Nhưng như nhiều người khác hiểu biết hơn tôi đã chứng minh, các mô hình học sâu hiện tại có rất ít sự hiểu biết thực sự và khác xa so với một AI nói chung. Hãy tham khảo Substack xuất sắc của Gary Marcus về AI.
Tôi không chắc chắn rằng liệu các mô hình có lợi thế hiện tại sẽ là con đường hướng tới AGI và việc đạt được AGI chỉ là có nhiều bộ xử lý hơn và nhiều dữ liệu hơn hay không.
(DG: Vũ Ngọc Bảo, 11/7/2023)