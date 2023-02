Edward Tian, 22 tuổi, hiện là sinh viên năm cuối chuyên ngành Khoa học máy tính, đồng thời theo đuổi chuyên ngành báo chí tại đại học Princeton (Mỹ), đã dành khoảng thời gian nghỉ hè để xây dựng một chương trình tự động hóa (bot) có khả năng phát hiện một văn bản được viết bằng ChatGPT.

ChatGPT đã dấy lên sự lo lắng của các giáo viên về việc học sinh nộp bài luận được viết bởi một chatbot trí tuệ nhân tạo. Phần mềm này lan truyền đã gia tăng sự quan ngại về việc nhiều người sẽ sử dụng phần mềm này sai với mục đích của nó trong lĩnh vực học thuật.

Tian cho rằng phần mềm của mình có thể "giải mã" một cách nhanh chóng và hiệu quả xem một người hay ChatGPT là tác giả của một bài luận. Động lực tạo ra ứng dụng này chính là để chống lại sự gia tăng đạo văn bằng trí tuệ nhân tạo (AI).

"Có quá nhiều quảng cáo về ChatGPT đang diễn ra xung quanh. Chúng ta xứng đáng được biết rằng liệu một văn bản được viết ra có thực sự do con người viết hay không", Tian đã viết như vậy trên dòng tweet giới thiệu ứng dụng của mình.

Edward Tian, 22 tuổi, hiện là sinh viên năm cuối chuyên ngành Khoa học máy tính, đồng thời theo đuổi chuyên ngành báo chí tại đại học Princeton (Mỹ) (Ảnh: NPR)

Kể từ khi phát hành vào cuối tháng 11 năm ngoái, ChatGPT đã được nhiều báo cáo về việc sinh viên sử dụng phần mềm này để chuyển các bài tập do AI viết thành bài tập của riêng họ. Tian cho biết, nhiều giáo viên đã liên hệ với anh ấy sau khi Tian phát hành phần mềm kiểm tra của mình trực tuyến, nói với anh ấy về những kết quả tích cực mà họ đã thấy khi thử nghiệm nó.

Hơn 30.000 người đã dùng thử phần mềm của Tian trong vòng một tuần kể từ khi ra mắt. Nó phổ biến đến mức ứng dụng bị sập. Streamlit, nền tảng miễn phí lưu trữ cho phần mềm của Tian, kể từ đó đã tham gia hỗ trợ anh có thêm bộ nhớ và tài nguyên để xử lý lưu lượng truy cập web.

Ứng dụng "chống" ChatGPT hoạt động như thế nào?

Phần mềm của Tian sử dụng hai chỉ báo "độ phức tạp" và "độ bùng nổ" để xác định xem một đoạn văn bản có phải do AI viết hay không. Nếu phần mềm này bối rối trước một văn bản, thì văn bản này có độ phức tạp cao và nhiều khả năng nó được viết bởi con người.

Tuy nhiên, nếu văn bản quen thuộc hơn với bot, bởi vì những dữ liệu đó đã được viết ra bởi quá trình tự động hóa, thì văn bản đó sẽ có độ phức tạp thấp và do đó có nhiều khả năng do AI tạo ra.

"Độ bùng nổ" là cách bot của Tian so sánh sự bùng nổ đến từ biến thể về cấu trúc và cảm xúc của câu. Ví dụ, con người có xu hướng viết với sự bùng nổ lớn hơn, với một số câu dài hơn hoặc phức tạp bên cạnh những câu ngắn hơn. Các câu AI có xu hướng thống nhất hơn.

Trong một video giới thiệu, Tian đã so sánh phân tích của ứng dụng về một câu chuyện trên tờ The New Yorker và một bài đăng trên LinkedIn do ChatGPT viết. Nó đã phân biệt thành công bài viết của con người với AI.

Tian thừa nhận rằng bot của anh ấy không phải là hoàn hảo, như một số người dùng đã báo cáo khi đưa nó vào thử nghiệm. Anh ấy nói rằng anh ấy vẫn đang làm việc để cải thiện độ chính xác của mô hình.

Nhưng bằng cách thiết kế một ứng dụng làm sáng tỏ những điểm khác biệt giữa văn bản được viết bởi con người và AI, công cụ này giúp hướng tới sứ mệnh cốt lõi của Tian, đó chính là mang lại sự minh bạch cho AI.

"Từ lâu, AI đã là một chiếc hộp đen mà chúng ta thực sự không biết điều gì đang diễn ra bên trong. Và với phần mềm của mình, tôi muốn bắt đầu đẩy lùi và chiến đấu chống lại điều đó", Tian cho hay.

Nhiệm vụ hạn chế việc đạo văn bằng AI

Anh chàng sinh viên năm cuối đại học này không đơn độc trong cuộc đua kiểm soát đạo văn, giả mạo bằng AI. OpenAI, nhà phát triển ChatGPT, đã đưa những dấu hiệu về cam kết ngăn chặn đạo văn AI và các ứng dụng bất chính khác.

Anh chàng sinh viên năm cuối đại học Tian không đơn độc trong cuộc đua kiểm soát đạo văn (Ảnh: ABC news)

Tháng trước, Scott Aaronson, một nhà nghiên cứu hiện đang tập trung vào an toàn AI tại OpenAI, tiết lộ rằng công ty đang nghiên cứu cách tạo "hình mờ" cho văn bản do GPT tạo để xác định nguồn gốc của nó.

Hugging Face, cộng đồng AI mã nguồn mở, đã đưa ra một công cụ để phát hiện xem văn bản có được tạo bởi GPT-2 hay không, một phiên bản trước đó của mô hình AI được sử dụng để tạo ra ChatGPT. Một giáo sư triết học ở Nam Carolina tình cờ biết về công cụ này và cho biết ông đã sử dụng nó để tìm ra một sinh viên nộp bài do AI viết.

Bộ Giáo dục thành phố New York cho biết rằng họ đã chặn quyền truy cập vào ChatGPT trên các mạng và thiết bị của các trường học tại đây do lo ngại về các tác động tiêu cực của nó đối với việc học tập của học sinh và lo ngại về tính an toàn, chính xác của nội dung.

Tian không phản đối việc sử dụng các công cụ AI như ChatGPT. "Phần mềm của tôi không phải là một công cụ để ngăn chặn việc sử dụng những công nghệ như AI. Nhưng với bất kỳ công nghệ mới nào, chúng ta cần có khả năng áp dụng nó một cách có trách nhiệm và có các biện pháp bảo vệ", Tian cho hay.