Trong bài viết trước, phóng viên Dân trí đã yêu cầu các chatbot tích hợp AI giải đề môn toán trong Kỳ thi Tốt nghiệp THPT năm 2024 để kiểm tra trí thông minh. Tuy nhiên, kết quả cuối cùng lại không thực sự như kỳ vọng.

Công cụ AI đạt được số điểm cao nhất là Gemini 1.5 Pro, khi trả lời chính xác 31/50 câu hỏi. ChatGPT-4o đứng thứ 2 với 23/50 câu trả lời chính xác, trong khi đó chatbot AI Gemini được cung cấp miễn phí bởi Google chỉ trả lời đúng 11/50 câu hỏi của đề thi môn toán.

Một trong những lý do để giải thích cho việc các chatbot AI không đạt được số điểm cao khi giải đề thi môn toán đó là vì các câu hỏi được đưa ra bằng tiếng Việt, có thể khiến các chatbot AI không hiểu chính xác yêu cầu của đề bài, dẫn đến việc đưa ra đáp án sai.

Do vậy, để kiểm tra trí thông minh của các chatbot AI, phóng viên Dân trí tiếp tục yêu cầu các chatbot AI giải đề thi môn tiếng Anh của kỳ thi Tốt nghiệp THPT 2024.

Với việc cả câu hỏi lẫn đáp án đều bằng tiếng Anh, liệu các chatbot AI có đưa ra nhiều đáp án đúng hơn so với đề thi môn toán hay không?

Đề thi môn tiếng Anh, mã đề 415, sẽ được các chatbot AI thay nhau giải để xem công cụ nào cho số câu trả lời đúng nhiều nhất.

Phóng viên Dân trí sẽ sử dụng đề thi môn tiếng Anh có số mã đề 415 và lần lượt yêu cầu các công cụ chatbot AI đưa ra đáp án. Phóng viên sẽ sử dụng hình ảnh đề thi với chất lượng tốt nhất, chỉnh sửa lại hình ảnh, cắt xén những nội dung thừa không cần thiết để bức ảnh chỉ tập trung vào các câu hỏi và phần lựa chọn trắc nghiệm.

Sau đó, phóng viên sẽ so sánh câu trả lời do các công cụ chatbot AI đưa ra với đáp án chính thức do Bộ GD-ĐT công bố, từ đó xác định xem chatbot AI nào đưa ra số câu trả lời đúng nhiều nhất.

ChatGPT-4o

ChatGPT-4o, được phát triển bởi OpenAI, là một trong những chatbot AI thông minh và được sử dụng phổ biến nhất hiện nay. Hiện ChatGPT-4o được cung cấp miễn phí cho người dùng.

ChatGPT-4o sẽ là "thí sinh" đầu tiên tham gia thử thách giải đề thi Tốt nghiệp THPT môn tiếng Anh.

ChatGPT-4o nhanh chóng gây ấn tượng khi trả lời đúng 16/18 câu hỏi ở trang đề thi đầu tiên (Ảnh chụp màn hình).

Khi yêu cầu giải đề thi, ChatGPT-4o đã gây được ấn tượng mạnh khi trả lời đúng 16/18 câu hỏi ở trang đề thi đầu tiên. Tuy nhiên, ở trang đề thi thứ 2, ChatGPT-4o chỉ còn trả lời đúng 6/15 câu hỏi trắc nghiệm và 6/10 câu hỏi ở trang đề thi thứ 3.

Trong 7 câu hỏi trắc nghiệm cuối cùng ở trang đề thi thứ 4, ChatGPT-4o đã đưa ra được 4 đáp án chính xác.

Như vậy, kết quả cuối cùng ChatGPT-4o đã trả lời chính xác 32/50 câu hỏi ở đề thi môn tiếng Anh.

Gemini

Ở bài viết trước của Dân trí, Gemini đã gây ra rất nhiều thất vọng khi chỉ trả lời chính xác 11 trong tổng số 50 câu hỏi của đề thi môn toán. Vậy với môn tiếng Anh, chatbot AI miễn phí của Google có đạt được kết quả tốt hơn hay không?

Gemini đưa ra giải thích rõ ràng cho từng đáp án đã chọn, nhưng vẫn có nhiều kết quả sai (Ảnh chụp màn hình).

Ở trang đề thi đầu tiên, Gemini đã đưa ra được 7/18 đáp án chính xác. Ở trang đề thi thứ 2, Gemini tiếp tục đưa ra 7 câu trả lời đúng và số đáp án chính xác ở trang đề thi thứ 3 cũng là 7. Và trong 7 câu trắc nghiệm cuối cùng ở trang đề thi thứ 4, Gemini đã đưa ra được 4 câu trả lời đúng.

Tóm lại, chatbot AI miễn phí của Google đã trả lời chính xác được 25/50 câu hỏi ở đề thi môn tiếng Anh.

Gemini 1.5 Pro

Phóng viên Dân trí tiếp tục sử dụng Gemini 1.5 Pro, chatbot AI có thu phí của Google, để thử giải đề thi môn tiếng Anh nhằm kiểm tra xem liệu công cụ có thu phí này có đạt được số điểm cao hơn so với phiên bản miễn phí hay không.

Ở trang đề thi đầu tiên, Gemini 1.5 Pro đã trả lời chính xác 13/18 câu hỏi và số câu trả lời đúng ở trang đề thi thứ 2 là 6. Số câu trả lời đúng ở 2 trang đề thi thứ 3 và thứ 4 của Gemini 1.5 Pro lần lượt là 3 và 4.

Như vậy, tổng cộng Gemini 1.5 Pro trả lời chính xác được 26/50 câu hỏi trong đề thi môn tiếng Anh, nghĩa là chỉ có nhiều hơn 1 đáp án đúng so với phiên bản Gemini miễn phí.

Claude AI

Claude AI là chatbot tích hợp AI ít được biết đến rộng rãi tại Việt Nam, nhưng công cụ này được đánh giá là có trí thông minh vượt trội so với Gemini và ChatGPT.

Ở bài viết trước, Claude AI đã từ chối tham gia thử thách giải đề thi môn toán, với lời giải thích rằng việc lợi dụng AI để làm bài kiểm tra sẽ không công bằng và ảnh hưởng đến kết quả học tập.

Claude AI còn đưa ra lời khuyên giúp người dùng có thể đạt được kết quả bài thi tốt.

Claude AI không hỗ trợ người dùng giải toán vì cho rằng điều này là không công bằng và mất đi khả năng học tập hiệu quả (Ảnh chụp màn hình).

Tuy nhiên, với đề thi môn tiếng Anh, chatbot AI này đã không từ chối tham gia thử thách, mà thậm chí còn đưa ra các đáp án rất nhanh.

Claude AI chấp nhận tham gia thử thách giải đề thi môn tiếng Anh để so tài với Gemini và ChatGPT (Ảnh chụp màn hình).

Cũng như ChatGPT-4o ở trên, Claude AI đã nhanh chóng gây ấn tượng khi có thể trả lời chính xác 16/18 câu hỏi ở trang đề thi đầu tiên. Ở trang đề thi thứ 2, Claude AI tiếp tục trả lời đúng 10 trên tổng số 15 câu hỏi được đưa ra.

Đáng chú ý, ở trang đề thi thứ 3, Claude AI đã có thể đưa ra 9/10 đáp án chính xác và trả lời chính xác hoàn toàn 7 câu hỏi ở trang đề thi cuối cùng.

Tổng kết lại, Claude AI đã có thể đưa ra 42/50 câu trả lời chính xác của đề thi môn tiếng Anh, một kết quả thực sự ấn tượng.