Cuộc chạy đua phát hiện AI đang diễn ra

Christofer Beam

AI

Tương lai của văn chương thế giới khéo phụ thuộc vào nhân sinh quan của mấy tài năng chưa đến tuổi uống rượu ! Ứng dụng GPTZero có thể phát hiện được văn bản do AI (Trí tuệ nhân tạo) viết ra đã được cậu sinh viên Edward Tian hoàn thành trong một quán café ở Toronto, Canada.

Edward Tian, không nghĩ mình là nhà văn. Cậu chỉ học thêm mấy khóa căn bản về viết báo khi đang học Khoa học máy tính ở Princeton. Mặc dù các thầy cô và bạn bè đều yêu mến vẻ ngoài rạng rỡ và sự tò mò không dấu diếm của cậu, Tian tự nhận phong cách viết của mình lúc đó “rất tệ”, công thức và cứng nhắc. Một trong các giáo sư nhận thấy rằng Tian có năng lực đặc biệt trong việc nhận biết các “mẫu” trong văn bản, rất có ích khi tạo ra các bản sao. Bởi thế cậu rất ngạc nhiên khi năm thứ hai, cậu được nhận vào lớp học độc nhất của John McPhee về viết báo.


Mỗi tuần, 16 sinh viên ngồi lại để nhà báo huyền thoại của tờ New Yorkers là McPhee ra bài tập buộc họ phải nghĩ ngợi kỹ lưỡng chọn từng từ, để miêu tả một tác phẩm nghệ thuật hiện đại trong trường hoặc cắt tỉa bài phát biểu Gettysburg của Abraham Lincoln. Giáo sư McPhee chia sẻ các sơ đồ do chính tay ông tạo ra, để miêu tả các cách mà ông cấu trúc bài viết của mình: thẳng, tam giác, hay đường xoắn ốc. Tian nhớ rằng, giáo sư nói ông không thể dạy bọn cậu cách viết, nhưng ông có thể giúp cậu có một giọng văn độc đáo duy nhất.

Nếu McPhee truyền cho Tian cách nhìn lãng mạn về ngôn ngữ, thì khoa học máy tính lại miêu tả ngôn ngữ như một thống kê. Trong thời gian đại dịch, cậu nghỉ một năm để làm việc tại BBC và thực tập ở dự án báo chí mở Bellingcat, nơi cậu viết một chương trình để phát hiện Twitter bots. Mùa thu 2022, cậu bắt đầu viết luận văn về việc phân biệt giữa văn bản do AI tạo ra với văn bản do người tạo ra.

Khi ChatGPT ra đời vào tháng 11, cả thế giới phát điên lên vì con bot thông minh đột xuất này, Tian bỗng thấy mình ở một vị trí đặc biệt. Cậu đã nắm được công nghệ nền của GPT-3. Và như một phóng viên đang chiến đấu chống lại những chiến dịch tin giả, cậu hiểu rõ tác động của AI lên ngành công nghiệp nội dung.

Khi về nhà nghỉ đông ở Toronto, Tian miệt mài thử viết một chương trình phát hiện ChatGPT. Ý tưởng của cậu đơn giản. Phần mềm sẽ duyệt văn bản để tìm 2 yếu tố: “sự lộn xộn – perplexity” – tính ngẫu nhiên của việc chọn từ, và “sự bùng nổ - burstiness”, độ phức tạp và biến hóa của các câu. Văn bản do người viết thường được cho điểm cao hơn AI ở cả hai yếu tố, giúp Tian đoán xem văn bản đã được tạo thế nào. Cậu đặt tên cho phần mềm của mình là GPTZero, trong đó “Zero” ngụ ý sự thật, quay về với bản năng, và đưa link lên Twiter tối 2/1/2023 với dòng trạng thái: “Liệu giáo viên có muốn sinh viên dùng ChatGPT để viết luận lịch sử không? Chắc là không!”, rồi đi ngủ.

Cậu tỉnh dậy sáng hôm sau và thấy server của mình bị chết vì quá nhiều người truy nhập. “Thật là điên rồ. Điện thoại của tôi nổ tung.” Một người bạn chúc mừng cậu thành ngôi sao trên internet. Giới teen trên Tiktok gọi cậu là “narc - cảnh sát chuyên bắt tội phạm ma túy”.

Tian cười toe toét khoe, có rất nhiều những căm hận ban đầu cổ điển kiểu “thằng ranh này rảnh việc, hay mách lẻo, chắc chẳng bao giờ có bạn gái.” Thực ra là cậu đã có bạn gái từ lâu. Mấy ngày sau, phóng viên khắp nơi gọi cậu, từ NPR tới Bưu điện Hoa Nam buổi sáng, cho đến Anderson Cooper 360 trên CNN. Trong vòng một tuần, tweet ban đầu của cậu có đến 7 triệu view.

GPTZero là một điểm đột biến trong biển tin tức về ChatGPT. Nó tạo cảm hứng cho một đợt “săn phù thủy” trong toàn ngành nhằm tới những nội dung của AI. Các nhà nghiên cứu đã tạo nên GPT-2 detector, nhưng Tian là người đầu tiên nhằm tới ChatGPT. Các thầy cô cám ơn cậu, vì đã giúp họ cuối cùng vạch trần mưu mô của lũ học trò. Nhân loại đã có người cứu rỗi khỏi thảm họa robot.

Phần mềm của Tian là tiếng súng khởi động cuộc đua tạo ra công cụ có thể xác định rõ ràng văn bản của AI. Trong thế giới người - máy lẫn lộn này, chúng ta phải xác định được cái gì là do người tạo ra. GPTZero là lời hứa. Tian, cậu sinh viên học giỏi, trung thực, hay cười, khẳng định với các phương tiện truyền thông: “có những thứ không bao giờ có thể biến được thành số” và mặc cho AI có thông minh đến đâu, sẽ có những công cụ để vạch trần chúng.

Cuộc sống trên Net là cuộc chiến giữa sản xuất và phát hiện tin giả. Cả hai bên đều kiếm bộn. Những chương trình phát hiện thư “rác” đầu tiên tìm kiếm các từ khóa, chặn các email có chữ “miễn phí” hoặc “chỉ dành cho tuổi 21+”, dần dần học được cách phát hiện cả những cách viết đáng ngờ. Các tác giả thư rác đối phó lại bằng cách pha trộn những trích đoạn rất người, từ những cuốn sách kinh điển. Có hẳn một từ riêng để miêu tả loại thư rác này gọi là “litspam”. Khi xuất hiện các cỗ máy tìm kiếm, các tác giả dùng chiêu “word stuffing –nhồi từ”, lặp đi lặp lại một từ nhiều lần để được ưu tiên. Bên này lại thay đổi thuật toán để hạ bậc những website đó. Khi Google đưa ra thuật toán PageRank, xếp hạng website dựa trên link dẫn đến nó, những kẻ lừa đảo bỏ công xây dựng các một hệ sinh thái những trang liên kết đến nhau.

Quãng đầu thiên niên kỷ, xuất hiện công cụ captcha để phân biệt người và máy dựa trên năng lực nhận biết những chữ cái bị bóp méo. Khi các bot học được cách qua mặt, thì captcha thêm tính năng nhận dạng ảnh moto hay cây cối, hoặc di chuột và các hành vi khác của người dùng. Trong một thử nghiệm gần đây, một phiên bản của GPT-4 còn biết cách thuê người trên chợ “Taskrabbit” (một nền tảng cho thuê lao động tức thời), để điền captcha hộ mình. Thậm chí số phận của cả một công ty phụ thuộc vào năng lực phát hiện tin giả: Elon Musk, chẳng hạn, đã dùng máy phát hiện bot để chứng minh rằng Twitter báo cáo láo về số lượng bots trên nền tảng của mình.

AI tạo sinh đã nâng tầm cuộc đua. Mặc dù các mô hình ngôn ngữ lớn và công cụ biến văn bản thành hình ảnh đã phát triển từ hơn chục năm trước, năm 2022 chứng kiến sự bùng nổ của các công cụ như ChatGPT và Dall-E. Những người bi quan cảnh báo chúng ta sẽ bị nhấn chìm bởi các nội dung “tổng hợp”.

Nhà bình luận Kevin Roose của tờ Thời báo NewYork cảnh báo: “trong vài năm tới, đại đa số những văn bản, ảnh, video trên internet sẽ do AI tạo ra.” Tờ Atlantic thì tưởng tượng ra cảnh tận thế trong các ồn ào tạo sinh. Các chiến dịch tranh cử sẽ tận dụng AI để quảng cáo, còn Amazon thì tràn ngập các tiểu thuyết do ChatGPT sáng tác (mà đa số lại bàn về AI). Đọc các nhận xét sản phẩm còn rắm rối hơn là làm Turing test (một phép kiểm tra trí tuệ máy tính mang tên nhà toán học Turing) và chẳng bao lâu nữa thay vì nhận thư từ các hoàng tử Nigeria, chúng ta sẽ nói chuyện với các bot của hoàng tử.

Chẳng bao lâu sau khi Tian ra mắt GPTZero, các sản phẩm tương tự ào ào xuất hiện. OpenAI ra mắt công cụ của riêng mình vào cuối tháng Giêng. Nhà khổng lồ chống đạo văn Turnitin ra mắt sản phẩm vào tháng Tư. Chúng có mô hình giống nhau, nhưng được huấn luyện bằng các tập dữ liệu khác nhau. (Turnitin sử dụng dữ liệu từ các bài viết của sinh viên). Bởi thế độ chính xác cũng lệch nhau nhiều. Trong khi OpenAI nói rằng chỉ có thể phát hiện tầm 26% văn bản do AI tạo ra, thì một công ty có tên Winston AI lại lạc quan tuyên bố độ chính xác tới 99.6%.

Tian vừa phải làm luận án tốt nghiệp vừa nâng cấp phần mềm để cạnh tranh. Cậu bổ nhiệm ngay người bạn phổ thông là Alex Cui làm CTO, và mời thêm một nhóm lập trình viên từ Princeton and Canada. Đến mùa xuân, cậu tuyển 3 lập trình viên Uganda mà cậu đã gặp được khi làm việc trong một startup đào tạo kỹ sư ở châu Phi. (Tian là một công dân toàn cầu, cậu sinh ra ở Tokyo, sống ở Bắc Kinh đến năm 4 tuổi và chuyển cùng gia đình đến Ontario). Cả đội bắt đầu làm Chrome-plugin giúp người dùng có thể quét ngay trang web để xem có phải do AI tạo ra không?

Một mối đe dọa cho GPTZero lại đến từ chính GPTZero. Ngay sau khi ra mắt, một số người bi quan đã đưa lên mạng những ví dụ nó đánh giá văn bản rất ngớ ngẩn. Như cho rằng một đoạn của hiến pháp Mỹ là do AI tạo ra Sự bất mãn biến thành phẫn nộ khi các câu chuyện sinh viên bị GPTZero đánh dấu nhầm là đạo AI, bắt đầu tràn ngập trên Reddit. Một phụ huynh còn lần ra được đến giáo sư Soheil Feizi của Đại học Maryland. “Họ thực sự giận dữ”, giáo sư kể lại. Từ mùa thu năm ngoái, ông cùng một số đồng nghiệp đã bắt đầu nghiên cứu về các vấn đề mà các công cụ phát hiện AI có thể gặp phải dẫn đến kết quả không ổn định. Ông bắt đầu nghĩ rằng GPTZero và các công cụ tương tự có thể tạo ra tác hại nhiều hơn lợi ích.

Tian còn đau đầu vì các sinh viên ranh ma, bắt đầu tìm cách qua mặt công cụ. Một người dùng trên Twitter mách chèn một ký tự đặc biệt () ngay trước mỗi chữ “e” trong văn bản do ChatGPT tạo ra. Một người dùng Tiktok khác thì viết một chương trình thay thế một chữ cái tiếng Anh nào đó bằng chữ cái trông giống thế từ bảng chữ cái Kiril. Một số thì cho văn bản AI qua một công cụ diễn giải lại là QillBot. Tian vá hết các lỗi, nhưng lại xuất hiện các tiểu xảo khác. Chẳng mấy chốc sẽ xuất hiện công cụ chống phát hiện tin giả.

Vào đầu tháng Ba, một sinh viên mới của Stanford là Joseph Semrai đang cùng với mấy người bạn lái xe dọc đường Cao tốc ven biển tới LA thì bị đuổi ra khỏi xe zipcar của họ ở Ventura. Họ vào quán Starbucks gần đấy và ngồi đợi. Mãi không có xe, họ phải nghĩ cách giết thời giờ. Semrai có bài tập về nhà tuần sau là viết một bài luận thể hiện tư duy logic, đúng kiểu cậu ghét nhất.

ChatGPT có vẻ là giải pháp hiển nhiên. Nhưng đáng tiếc lúc đó nó xuất ra mỗi lần chỉ được mấy đoạn. Để ghép thành một bài dài, phải làm vài thao tác. Semrai muốn tạo ra một công cụ, ấn nút phát là phụt ra bài văn. Cậu cũng biết rằng, cậu có thể bị GPTZero phát hiện. Được mấy cậu bạn cổ vũ, Semrai rút laptop ra và bắt đầu code một đoạn script để tạo ra bài viết, rồi chạy qua GPTZero, chỉnh sửa rồi lại chạy lại cho đến khi AI không bị phát hiện – bản chất là dùng GPTZero để chống lại chính nó.

Mấy ngày sau, Semrai giới thiệu phần mềm của mình ở Ngày Gia đình và Bạn bè, một kiểu khoe sản phẩm của sinh viên Stanford. Đứng trước khán phòng toàn bạn bè cũng lứa, cậu đề nghị mọi người đưa ra một chủ đề cho bài luận. Ai đó đề xuất: “Ăn ngon ở Cali”. Và ấn nút. Mấy giây sau, máy phun ra một bài luận 8 đoạn, không có gì đặc sắc, nhưng có lý, có dẫn chứng hẳn hoi. “Tôi có lẽ sẽ không nộp bài kiểu này, nhưng ai biết được, đỡ mất thời gian.” Cậu đặt tên cho phần mềm của mình là WorkNinja và đưa lên AppStore 2 tháng sau đó. Nhờ chương trình khuyến mãi, có sử dụng một KOL gen Z là David Dobrik và món quà 10 Tesla khi đăng ký, đã có 350 ngàn lượt tải trong tuần đầu tiên. Sau đó thì chậm dần và đạt mốc khoảng vài trăm lượt tải một ngày. Semrai không tiết lộ ai là người đầu tư cho chương trình khuyến mãi này.

Hình ảnh lạnh lùng bình thản của Semrai trên Zoom, che dấu một nhiệt huyết sôi sục. Trong khi Tian nhảy nhót khắp nơi trên thế giới, thì Semrai tỏ ra rất tập trung và vô cảm. Cậu trai 19 tuổi phát biểu tự tin như trên đài, kiểu của các nhà khởi nghiệp Silicon Valley nhìn thế giới như một tập hợp các vấn đề cần giải quyết, mỗi câu nói đều kết thúc bằng “Có đúng thế không?” Lắng nghe cậu bình luận về các “rào cản” và “đường cong-S” phát triển của xã hội, ta dễ dàng quên mất là cậu còn chưa đến tuổi được uống rượu. Chỉ có thi thoảng mới lộ ra đó chỉ là một cậu sinh viên đang háo hức tìm chỗ đứng của mình trong thế giới. Kiểu như khi cậu cùng bạn bè dạo quanh bến cảng Santa Monica lúc 3h sáng để hiểu xem “giá trị của mình là gì?”. Semrai nghĩ rất nhiều về việc cân bằng và hạnh phúc, nhưng “tôi còn trẻ, có lẽ cần phải thám hiểm những hậu quả, thử lên voi xuống chó xem sao.”

Lớn lên ở NewYork và sau đó là Florida, bố mẹ Semrai– một lính cứu hỏa ở Yonkers và một phụ nữ Trung quốc đảm việc nhà , khá thả lỏng cậu. “Đại khái là tôi có thể làm bất cứ thứ gì mà tôi thấy hứng thú thời thơ ấu. Và tôi thích viết phần mềm máy tính.” Năm lên 6 cậu đã tạo ra plug-in – phần mềm cài thêm để cấp quyền truy nhập vào các servers Minecraft, lên 7 cậu đã viết sửa lỗi cho Windows 7 để có thể chạy Windows XP trên đó. Cậu thừa nhận “tôi thấy sung sướng khi làm được cái gì đó cho người khác.”

Năm lên 9, nhà cậu chuyển từ Queens lên Palm City, và Semrai nhận thấy sự khác nhau giữa các hệ thống trường công. Những khóa cơ bản về máy tính mà cậu cho là đương nhiên phải có ở NewYork hóa ra là hàng hiếm ở Florida. Thế là cậu phải viết chương trình để bù đắp cho sự thiếu sót trong hệ thống giáo dục, con đường cho phép cậu phát biểu ở tuổi 19 là “đã suốt đời làm việc cho ed tech”. Trong năm đầu tiên ở cấp trung học, cậu dành được đầu tư cho phần mềm học trực tuyến của mình từ một cuộc thi khởi nghiệp địa phương. Trước dịch Covid, cậu đã phát triển hệ thống giấy thông hành số, sau này thành cơ sở cho việc theo dõi giao tiếp được triển khai ở 40 sở giáo dục ở miền Đông Nam Mỹ.

Semrai là một nhà kỹ nghệ lạc quan. Cậu cho rằng chúng ta cần phải đẩy nhanh tiến độ phát triển của công nghệ, trong đó có AI, vì chúng sẽ dẫn ta đến xã hội “Hậu thiếu thốn.”, một quan điểm đôi khi được gọi là “chủ nghĩa tăng tốc hiệu quả” (xin đừng nhầm lẫn với “chủ nghĩa vị tha hiệu quả” cổ súy việc tối đa hóa đầu ra “tốt”, bất kể định nghĩa thế nào là “tốt”). Phần mềm WorkNinja của cậu dựa trên logic tăng tốc đó. Dùng AI để viết luận là tốt, không phải vì nó giúp sinh viên gian lận, mà nó buộc các trường học phải xem xét lại chương trình.

“Nếu bạn có công thức để viết một bài luận, thì chắc đó không phải là một bài tập tốt.” Cậu dự đoán tương lai, sinh viên nào cũng có thể tiếp cận được nền giáo dục vốn chỉ dành cho giới tinh hoa. Trước đây, khi viết chương trình, cậu phải dựa vào Youtube và internet forums, Semrai đã ước gì có tutor hướng dẫn. Giờ khi AI tutor đang trở thành hiện thực, sao lại ngăn cản.

Tôi cũng mới thử dùng WorkNinja để tạo ra vài bài luận, trong đó có 1 bài về thuyết tiến hóa của Darwin. Bản đầu tiên khá vụng về và có vẻ bị lặp đi lặp lại. Nhưng về cơ bản là ổn, giải thích những ảnh hưởng của học thuyết đến sinh học, công nghệ gen và triết học. GPTZero phát hiện ra ngay đây là bài của AI. Tôi ấn nút “Viết lại – Rephrase” trên WorkNinja. Văn bản được sửa đi đôi chút, một số từ được thay bằng từ đồng nghĩa. Sau 3 lần “Rephrase”, GPTZero xác nhận bài luận là do người viết. Vấn đề ở chỗ là có 1 số câu trở nên vô nghĩa.

Ví dụ câu “Thuyết tiến hóa của Darwin cho rằng các cơ thể sống tiến hóa theo thời gian nhờ sự giao tiếp với môi trường sống của chúng” bị sửa thành “Thuyết tiến hóa của Darwin là ý tưởng cho rằng các cơ thể sống giành được qua cái kẹp nhờ sự giao tiếp với thế giới xung quanh.”

Tóm lại, sinh viên có lười biếng đến đâu, cũng nên bớt chút thời gian xem lại sản phẩm của WorkNinja trước khi nộp bài. Nhưng nó vẫn chỉ ra một vấn đề thực tế: mới chỉ là một phần mềm nghiệp dư dở dang của một cậu sinh viên mà đã qua mặt được máy phát hiện, thì điều gì sẽ xảy ra khi có những đầu tư nghiêm túc.

Vào tháng Ba, giáo sư Soheil Feizi từ đại học Maryland công bố kết quả nghiên cứu của mình về các phần mềm phát hiện AI. Ông cho rằng độ chính xác rõ ràng phụ thuộc vào cách các công cụ đó làm việc. Khi cố gắng phát triển độ nhạy, tác giả vẫn phải chấp nhận số lượng “báo động giả” càng ngày càng tăng. Không thể có cả hai cùng một lúc. Và với việc AI học được cách phân bố từ giống người, hiệu quả của các phần mềm phát hiện sẽ bị suy giảm. Ông cũng chỉ ra rằng, bằng cách diễn đạt lại – paraphrasing, có thể làm cho kết quả của việc phát hiện “gần như chỉ là ngẫu nhiên”. Tóm lại ông kết luận: “Không thấy tương lai tươi sáng gì cho các phần mềm phát hiện AI.”

Kỹ thuật “in mờ - watermaking” cũng không ăn thua. Theo cách này, các công cụ tạo sinh như ChatGPT thườngchủ động điều chỉnh “trọng số” của một số từ “có dấu riêng” nhưng thay thế được nhau, ví dụ “start” thay “begin” hay “pick” thay bằng “chọn”, người đọc khó nhận ra, nhưng thuật toán có thể phát hiện được. Một đoạn văn với những từ đó được lặp lại theo một tần số nào đó, có thể đoán là do “công cụ” nào tạo ra. Nhưng Feizi đã phát hiện ra rằng, chỉ cần vài lần “paraphrasing – diễn đạt lại” là đủ để rửa sạch watermark.

Còn hiện tại, ông cho rằng, các công cụ phát hiện đang làm hại sinh viên. Ví dụ, công cụ có tỷ lệ false positive – tức là bị tố là “đạo” mà ko phải, giả sử lý tưởng là 1% đi. Tức là nếu lớp có 100 sinh viên, phải viết 10 bài luận về nhà, sẽ có 10 sinh viên bị tố cáo sai là “lừa đảo”. Quá cao. Feizi cho rằng 1 trên 1000 sinh viên thì có thể chấp nhận được. “Thật là ngớ ngẩn khi dùng các công cụ như vậy để giám sát việc sử dụng AI.”

Tian thì cho rằng mục tiêu của GPTZero không phải là tìm các sinh viên láu cá. Kết quả bây giờ còn có thêm dòng chữ “kết quả này không nên dùng để trừng phạt sinh viên.” Nhưng thực tế người ta vẫn dùng nó với mục đích đó. Còn về tỷ lệ chính xác, Tian nói, có thể đạt 96% nếu được huấn luyện bằng dữ liệu cập nhật nhất. Một số công cụ khác tuyên bố con số cao hơn, nhưng Tian cho rằng cần phải cẩn trọng với những tuyên bố đó, vì có thể họ đã điều chỉnh tập dữ liệu cho phù hợp với công cụ. Cậu nói: “cần phải đặt AI và người bình đẳng.”

Thật đáng ngạc nhiên là ảnh, video hay clip âm thanh do AI tạo ra dễ phát hiện hơn nhiều so với văn bản, ít nhất là đến hiện nay. Reality Defender là một startup thành lập năm 2018 do Y Combinator đầu tư, tập trung vào các ảnh và video giả, sau đó mở rộng sang audio và văn bản. Intel mới ra mắt một sản phẩm có tên là FakeCatcher, phát hiện video giả bằng cách phất tích các mẫu mạch máu trên mặt mà chỉ có ống kính mới nhìn ra. Một công ty có tên là Pindrop lại sử dụng “số đo sinh học” để phát hiện âm thanh bị giả mạo, xác nhận người gọi trong các vấn đề bảo mật.

Văn bản AI khó bị phát hiện hơn vì không có nhiều điểm dữ liệu để phân tích, tức là ít cơ hội để đầu ra của AI khác với chuẩn mực của con người. Lấy trường hợp FakeCatcher của Intel chẳng hạn. Ilke Demir, nhà khoa học của Intel, vốn đã từng làm cho hãng phim hoạt hình Pixar, nói rằng, sẽ cực kỳ khó để tạo nên tập dữ liệu đủ lớn và chi tiết để bọn chế hàng giả có thể mô phỏng lại các mạch máu “chữ ký” trên mặt, để đánh lừa các công cụ phát hiện. Tất nhiên là công nghệ làm giả sẽ phát triển nhanh và các nhà nghiên cứu luôn phải đi trước.

Bel Colman, CEO của Reality Defender nói rằng, công cụ phát hiện hàng giả của công ty ông rất khó bị cộng như GPTZero, ai cũng có thể đưa văn bản vào và chỉnh sửa cho đến khi nó qua mặt được. Reality Defender, ngược lại, kiểm tra người người dùng và tổ chức nào dụng, phát hiện những nghi vấn trong sử dụng. Nếu một tài khoản nào đó chạy đi chạy lại 1 ảnh, sẽ bị đánh dấu loại.
Cứ cho là sự khác biệt giữa người và máy có ý nghĩa gì đó, thì các phần mềm phát hiện AI sẽ phải chạy đua để đi trước các công cụ lẩn tránh, hệt như những gián điệp, hay nhà sản xuất vacxin, hay bọn lừa đảo cờ hay các nhà thiết kế vũ khí.

Càng giao tiếp nhiều với Tian và Semrai và các bạn của họ, tôi càng tò mò: liệu những người trẻ này thực sự đam mê việc viết lách? “Tất nhiên, rất thích”, Tian khẳng định, hào hứng hơn bình thường. “Tôi thấy như chơi xếp hình ấy, rất vui.” Tian thích việc lựa chọn con chữ và sắp xếp chúng để diễn đạt suôn sẻ ý tưởng. Cậu cũng thích quá trình phỏng vấn, cho phép cậu “nhìn qua cửa sổ vào cuộc đời của người khác, và soi gương cuộc đời mình.” Cậu cho rằng chính McPhee đã thúc đẩy tình yêu viết lách của cậu, chứ hồi đi học, đó là những bài tập nhàm chán. Hồi tháng Sáu, Tian kể với tôi là mới mua một bản sách cũ cuốn “Cuộc đời viết lách” của Annie Dillard.

Tương tự, Semrai cũng cho rằng các bài tập viết lách ở phổ thông là nhàm chán, đơn thuẩn là tổng hợp thông tin một cách cơ học chứ chẳng phải sáng tạo ra cái gì mới. “Tôi thích các đề văn mở, kích thích sáng tạo.” Nhưng cậu cũng biết cách sử dụng “kỹ năng tổng hợp cơ học” trong năm thứ hai để viết cuốn sách 800 trang có tên là “Gì cũng làm – Build for Anything”, với mục đích biến một người “Từ không biết gì đến gì cũng biết một tí” trong lĩnh vực làm trang web. Cậu tự công bố cuốn sách này trên Amazon và bán được mấy trăm bản. Theo Semrai thì cuốn sách này bây giờ vô dụng vì ChatGPT làm quá tốt việc đó.

Từ kinh nghiệm gần 20 năm gõ chữ kiếm tiền, tôi có thể nói viết lách là tởm lợm. Bạn có thể hỏi bất cứ người viết chuyên nghiệp nào để kiểm định đó là công việc rất tệ, và bạn có tích lũy nhiều kinh nghiệm đi nữa thì cũng chẳng hơn gì. Tôi có thể xác nhận là niềm hứng khởi cần thiết để dò tìm các sự kiện, phát hiện các ý nghĩa, tra cứu các từ mới, mất đi rất nhanh. Nhân với các tác động bên ngoài đến ngành công nghiệp như: tỷ lệ người đọc suy giảm, số trang ít đi, thời gian chú ý (của cả tôi và người đọc) ngắn dần.

Tôi vẫn giữ nghề bởi vì suy cho cùng, nó là tôi, dù tốt hay xấu. Tôi làm không phải vì ham thích mà vì cảm thấy nó có ý nghĩa, ít nhất là với tôi. Một số nhà văn thì lãng mạn hóa quá trình viết lách. McPhee kể có lần đã nằm ườn trên bàn picnic 2 tuần mới có thể bắt đầu được một bài báo. “Bài viết cuối cùng có 5000 câu, nhưng trong 2 tuần đó tôi không viết được một chữ nào.” Có lần, khi 22 tuổi, ông phải tự trói mình vào ghế viết.

Còn theo Thomas Mann “Nhà văn là người, mà viết cái gì cũng khó hơn người thường.” Annie Dillard thì so sánh viết lách với việc đánh nhau với cá sấu “Bạn tìm kiếm, đau tim, vỡ đầu, gẫy xương… và cuối cùng tìm được cái gì đó.” Đại khái đều ý là, nếu vắt cật lực thì sẽ được nước ngọt. Và ca ngợi hạnh phúc trinh trắng khi nhìn chăm chăm vào tờ giấy trắng, phù phép thuần hóa, bắt nó phải nhả ra những câu văn dòng thơ.

Chúng tôi tự nhủ mình, chịu đau đớn là cách những tác phẩm kinh điển được ra đời. Nhưng AI xuất hiện, kéo còi cảnh báo: không nhất thiết phải theo cách đó. Và với hàng tỷ người nằm ngoài câu lạc bộ tinh hoa của các nhà văn – khổ hạnh, bạn bắt đầu nghĩ: có lẽ không nên đi theo cách đó.

May Habib sống thời thơ ấu ở Li-băng trước khi chuyển đến Canada và học tiếng Anh. Theo cô “thật là không công bằng khi người biết đọc viết tiếng Anh có nhiều lợi thế như thế.” Năm 2020, cô thành lập Writer, một nền tảng không nhằm thay thế mà giúp đỡ con người, cụ thể là các thương hiệu, hợp tác hiệu quả hơn với AI.

Habib tin vào giá trị của việc nhìn chằm chằm vào tờ giấy trắng. Điều đó giúp bạn xem xét và vứt bớt các ý tưởng, và buộc bạn hệ thống lại suy nghĩ của mình. “Quá trình vật vã, đau đầu, chăm chăm nhìn ngòi bút mang lại nhiều lợi ích. Nhưng cần phải cân bằng với tốc độ đo bằng mili giây”.

Writer không viết hộ bạn mà giúp bạn viết nhanh hơn, ảnh hưởng hơn và nhất quán hơn. Nó có thể đề xuất sửa cách dùng từ và cấu trúc câu, hay đưa ra những gì đã viết về chủ đề tương tự và đề xuất các phương án khác. Mục đích cuối cùng là giúp người dùng tập trung vào thông điệp chính mà họ cần truyền đạt mà mất ít công sức cho những việc câu cú máy móc. Kết quả cuối cùng là đoạn văn rất “người” cứ như là ai đó viết nó ra từ đầu. “Nếu có công cụ đánh dấu đoạn văn này là AI, chứng tỏ công cụ đó vớ vẩn.” Habib kết luận.

Ethan Mollick, giáo sư ở trường Wharton của Đại học Pennsylvania thì cho rằng không cần thiết phải phân biệt trắng đen giữa văn bản người hay máy. Ông cho rằng chúng ta đang bước vào thời đại được gọi là “Centaur Writing” tức là viết kiểu Nhân Mã, nửa người nửa AI. Tất nhiên bảo ChatGPT viết bài luận lịch sử về đế chế Mông Cổ, sẽ dễ dàng nhận ra nó rất AI. Nhưng theo ông, nếu “bắt đầu viết ‘chi tiết trong khổ ba chưa chính xác, thêm tí thông này, hay sửa giọng điệu cho giống báo Tuổi trẻ,’” thì sẽ nhận được một tác phẩm lai và chất lượng tốt hơn hẳn.

Mollick dạy “tinh thần khởi nghiệp” ở Wharton, không những cho phép mà còn bắt buộc sinh viên dùng AI. “Trong chương trình của tôi, các anh phải làm ít nhất một việc phi thường.” Nếu chưa biết code thì phải viết một chương trình. Nếu chưa bao giờ thiết kế, thì phải nộp một tác phẩm thị giác. Tất nhiên, sinh viên vẫn phải giỏi chuyên môn của mình. “Mỗi bài tập các anh nộp, phải được phê phán bởi ít nhất bốn khởi nghiệp gia mà các anh ngưỡng mộ.” Mục tiêu là buộc sinh viên phải suy nghĩ sáng tạo với tư duy phản biện. Ông tuyên bố “tôi không quan tâm sinh viên dùng công cụ gì, miễn là phải sử dụng tư duy.”

Mollick cho rằng ChatGPT có thể chưa bằng những nhà văn tốt nhất, nhưng có thể nâng cao trình độ chung. “Nếu bạn đang ở 25% đáy, bạn có thể ngoi lên mức 60-70%.” Nó cũng giúp giải phóng một số những người kiểu “thinker – người suy nghĩ” khỏi công việc viết lách vất vả. “Chúng ta cho rằng năng lực viết phản ánh trí tuệ, nhưng điều đó không phải lúc nào cũng đúng. Thậm chí thường xuyên sai.”

Trong khi các trường chạy đua cấm ChatGPT, các lãnh đạo công nghệ ký tâm thư cảnh báo ngày tàn nhân loại do AI tạo ra, thì các sinh viên tỏ ra khá thoải mái với tương lai có máy trợ giúp. Một sinh viên đã dùng ChatGPT để viết phần “Cám ơn” của luận án của mình. Một số khác, bao gồm cả Tian, nhờ nó viết hộ một số đoạn code.

Lydia You, một sinh viên ngành khoa học máy tinh nhưng có kế hoạch làm nhà báo, đã nhờ ChatGPT viết một bài thơ về sự mất mát theo phong cách bài thơ nổi tiếng “One Art – Nghệ thuật cô đơn” của Elizabeth Bishop. Kết quả, theo You, “rất giống” với nguyên bản, cô còn cho rằng máy còn phân tích bài thơ hay hơn và giải thích tại sao nó lại gây xúc động như thế. You cho rằng, chúng ta đã từng hoảng loạn nhiều lần mỗi khi có cái mới ra đời, như Tiktok, Twitter và cả internet nữa. “Tôi, cũng như thế hệ tôi, cảm thấy rằng chúng tôi sẽ tự tìm ra cách để ứng xử với các công cụ mới.”

Sophie Amiton, sinh viên năm trên của ngành kỹ thuật cơ khí vũ trụ, chen vào “Ngoài ra, tôi nghĩ thế hệ mình rất lười,” anh nói tiếp trong khi You gật đầu tán thưởng. “Tôi biết rất nhiều người không muốn các công việc truyền thống, không muốn làm việc từ 9h đến 5h.” You hùa theo “Họ bị vỡ mộng, rất nhiều việc chẳng qua là bảng tính”.

Amiton nói tiếp. “Rồi Covid đến. Người ta bắt đầu đánh giá lại mục đích của làm việc. Nếu có thể dùng ChatGPT làm công việc của mình dễ dàng hơn, nâng cao chất lượng cuộc sống, thì sao lại không dùng.”

Liz, một sinh viên mới tốt nghiệp Princeton, gửi tôi một bài báo cô viết nhờ sự trợ giúp của ChatGPT về chính trị quốc tế. Thay vì yêu cầu nó trả lời trực tiếp cho câu hỏi của bài luận, cô yêu cầu ChatGPT viết theo dàn bài với những gạch đầu dòng chính của mình. Sau một vài lần chỉnh sửa, cô nộp bài và đạt điểm cao nhất. Tôi đưa bài của Liz vào GPTZero và nhận được kết luận “Văn bản này khả năng lớn hoàn toàn do người viết ra.”

Vào đầu tháng Năm, chỉ vài tuần trước khi Tian và các bạn khoác lên mình tấm áo choàng tốt nghiệp, GPTZero phát triển một plug-in (phần mềm lắp thêm) cho Chrome, có tên là Origin. Vẫn khá thô sơ, bạn phải tự chọn đoạn văn bản hay trang web và độ chính xác còn khá tương đối. Nhưng Tian tin rằng một ngày nào đó, công cụ này sẽ tự động duyệt tất cả các website mà người dùng sử dụng, đánh dấu những gì mà nó cho là của AI, kể cả text, ảnh hay video, và tất cả những gì “độc hại” hoặc đáng ngờ. Cậu cho rằng Origin là kính chắn gió trên cao tốc thông tin, phát hiện và lọc những vật liệu vô bổ hoặc có hại, giúp ta nhìn đường rõ hơn.

Tian không che dấu sự lạc quan về tương lai của công ty. Cậu cảm thấy rất may mắn là tốt nghiệp là có ngay công việc mà mình mong muốn. Nhiều bạn bè của cậu đã gia nhập Princeton với giấc mơ khởi nghiệp, nhưng sự thắt lưng buộc bụng trong ngành công nghệ đã buộc họ phải thay đổi kế hoạch.

Vì còn những ba năm nữa mới ra trường ở Stanford, nên Semrai vào hè với tâm trạng thoải mái hơn. Trong một chiều thứ Năm rực rỡ của tháng Sáu, Semrai, áo phông kẻ sọc xanh, giày Nike trắng, hào hứng chia sẻ với tôi tương lai, ít nhất là mấy tuần sắp tới, trên tầng thượng của Mũi 17, gần phố Wall. Mùa hè của cậu mới bắt đầu. Còn bây giờ cậu đang ở NewYork, lang thang với bạn bè, trong lúc cày một số dự án về AI. Đêm hôm trước cậu còn ngủ ở Soho, một văn phòng chia sẻ. Giờ thì cậu đang đứng trong khu VIP có mái che của một sự kiện do Techstars, một vườn ươm startup, tổ chức, trong khi hàng trăm người tham dự khác đẫm mồ hôi đi lại loanh quanh dưới nắng.

Cạnh đó, Thị trưởng NY Eric Adam mặc áo bay đứng trên sân khấu, mô tả sự vinh quang của nghề lập trình. Ông ta tự xưng “Tôi là dân công nghệ” và kêu gọi các khán giả đi tìm đồng đội, để dùng “mã nguồn” giải quyết các vấn đề xã hội như bệnh ung thư hay bạo lực súng đạn. Sau đó, ông ta thúc giục những người độc thân trong đám đông, nhanh chóng tìm được “shorty hay a boo” (tiếng lóng để chỉ giai xinh, gái đẹp) để cặp đôi.

Semrai đang dùng chiêu “xem cái gì có thể ăn” để xây dựng sản phẩm. Ngoài WorkNinja, cậu phát triển một nền tảng cho các chatbot được huấn luyện dựa trên dữ liệu của các ngôi sao thật ngoài đời, để fan hâm mộ có thể giao tiếp. Cậu còn chế thử một cái vòng đeo tay có thể ghi lại tất cả những gì chúng ta nói và làm, một loại “trí nhớ hoàn hảo” để có thể trợ giúp tức thì trong giao tiếp. (Một nhóm bạn học của cậu ở Stanford cũng mới chế ra một loại kính có tên là RizzGPT, giúp người đeo làm dáng, tán tỉnh).

Semrai chờ đợi mùa Hè sẽ bùng nổ các ứng dụng AI, khi những lập trình viên trẻ có thời gian gặp nhau cọ sát. (Eric Adam chắc sướng lắm). “Tôi nghĩ là sẽ có một ngân hà các startups mới, và 5 năm nữa, chúng ta có thể phân hóa rõ ràng giữa những người khởi đầu và toàn bộ hệ sinh thái.”

Đến mùa hè, Tian và 12 nhân viên đã gọi được 3,5 triệu đô-la từ một nhóm các nhà đầu tư mạo hiểm, bao gồm Jack Altman (em trai của CEO OpenAI Sam Altman) và Emad Mostaque của Stability AI. Nhưng trong các cuộc trao đổi, tôi thấy quan điểm của cậu về đóng gói GPTZero/Origin có thay đổi. Bây giờ việc phát hiện AI chỉ là là 1 phần của bộ công cụ chứng minh tính người. Cậu đã chuyển chú ý sang tìm nguồn gốc hoặc “chứng nhận nội dung”. Ý tưởng là gắn một nhãn (tag) mã hóa vào nội dung để chứng nhận nó do người tạo ra – một kiểu captcha cho các tài liệu số. Adobe Photoshop vừa gắn nhãn cho các bức ảnh khai thác công cụ AI Firefly của họ. Ai xem các bức ảnh, có thể kích chuột phải để xem ai đã tạo ra nó bằng cách nào và khi nào.

Tian nói, anh cũng muốn làm thế với văn bản, và đang bàn chuyện hợp tác với Sáng kiến Xác thực Nội dung (Content Authenticity Initiative) – một tổ hợp tập trung tạo chuẩn mực xác thực nội dung nhiều định dạng, cũng như với Microsoft. Có thể diễn giải sự quan tâm của cậu đến việc tìm nguồn gốc là ngầm thừa nhận, đơn thuần chỉ dựa vào kỹ thuật phát hiện AI là không đủ. (Bản thân OpenAI cũng ngừng cung cấp dịch vụ phân loại văn bản của mình vào tháng Bảy vì “độ chính xác thấp.”). Điều đó cũng phản ánh sự thay đổi quan trọng trong cách tiếp cận của chúng ta với nội dung số.

Toàn bộ ý tưởng phát hiện AI nằm ở chỗ, chúng ta cho rằng con người có thể để lại những dấu vết rõ ràng trong một đoạn văn bản, mà có thể phát hiện, cũng như kiểu máy phát hiện nói dối giả thiết rằng kẻ gian lận sẽ để lại những dấu vế khách quan. Còn việc truy vết – tìm nguồn thì dựa trên những nhãn kiểu “Made in America”, tức là nếu không có nhãn đó, chúng ta chẳng thể nào tìm thấy sự khác biệt. Nó chỉ khẳng định một điều: người viết không chắc đã hay hơn, sáng tạo hơn, độc đáo hơn, nhưng chỉ đơn giản là do người viết. Và điều đó có ý nghĩa với người đọc.

Vào tháng Sáu, nhóm của Tian bắt đầu có những bước đi thực tế. Cậu nói với tôi là đang xây dựng một nền tảng viết lách có tên là HumanPrint, giúp người dùng sửa sang các văn bản AI và chia sẻ “bằng chứng xác thực”, tất nhiên là không phải là viết một đoạn text. Nó sử dụng công nghệ của GPTZero để phát hiện những đoạn văn chưa đủ “người” và đề nghị người dùng viết lại. “Để thầy giáo có thể nói, ok, có thể hơn 50% của văn bản này là do các anh tự viết ra.”

Tian không cho rằng đó là hướng mới, mà chỉ là sự mở rộng tự nhiên của việc phát hiện AI. Cậu khẳng định “Những quy tắc vàng về ứng dụng AI có trách nhiệm vẫn còn nguyên và phải được tuân thủ.” Nhưng cũng là một sự thừa nhận: không có cách nào chặn đứng việc viết bằng AI, chỉ còn cách phải làm việc với chúng.

Khi Tian thử nghiệm bản GPTZero đầu tiên, cậu đã duyệt bài báo của McPhee đăng trên tờ NewYorker năm 2015 có tên là “Frame of Reference”. Trong bài báo McPhee diễn giải niềm vui và rủi ro khi tham chiếu văn hóa để viết lách. GPTZero đánh giá bài báo là “rất người theo tất cả các tiêu chí.” Tôi gọi McPhee và hỏi xem ông nghĩ thế nào khi bài báo của ông được đánh giá rất "người"?

“Tôi cũng chẳng biết nữa. Nhưng nếu tôi đoán thì vì là tôi viết về gì đi nữa: khoa học, nông nghiệp, hàng không, luôn qua con người. Luôn có một người mà tôi học được.” Thực tế là McPhee luôn viết từ con mắt của một chuyên gia. Người đọc không chỉ nhận được kiến thức về địa lý hay vật lý hạt hay cam mà còn thấy được cảm nhận của người nghiên cứu lĩnh vực đó, như McPhee tìm hiểu về họ vậy.

McPhee nay đã 92 tuổi, nói ông không quan tâm lắm đến việc AI thay người viết “Tôi bi quan nhưng không lo lắng. Tôi không nghĩ là sẽ có Mark Twain in AI.” Nhưng, tôi hỏi tiếp, nếu vài năm nữa, ai đó sẽ tạo ra con McPheeBot3000 được huấn luyện bằng các bài báo của McPhee thật, và yêu cầu nó viết một cuốn sách mới về lĩnh vực mới. Liệu nó có thể “bắt” được giọng văn, quan điểm và phong cách của McPhee?

Tian cho rằng máy chỉ có thể bắt chước, còn McPhee không bao giờ lặp lại chính mình. “Sự khác biệt của McPhee nằm ở chỗ, hôm nay ông đưa ra một thứ mà bản thân ông hôm qua còn chưa có.” Còn McPhee thì cho rằng “Nếu điều đó xảy ra thì lúc đó tôi đã không còn ở đây. Tôi hy vọng con gái tôi sẽ gọi luật sư.”

FB Nguyễn Thành Nam dịch, NCCông biên tập 3/10/2023