Các công cụ AI tạo sinh đang bùng nổ, cho phép người dùng từ văn bản mô tả có thể tạo ra bài viết, hình ảnh, đoạn nhạc và video sắc nét.

Cuộc đua giữa các “ông lớn” công nghệ ngày càng gay gắt. Cuối tháng 5, Google giới thiệu Veo 3 với khả năng tạo video đồng bộ khẩu hình và lồng tiếng tự động.

Không chịu kém cạnh, OpenAI tung ra Sora 2, bản nâng cấp của công cụ ra mắt tháng 2/2024.

Sora 2 nổi bật nhờ mô phỏng chính xác các định luật vật lý, giúp cảnh chuyển động và tương tác trở nên sống động. Đặc biệt, độ dài video tối đa 10 giây, nhỉnh hơn Veo 3 (8 giây).

Những đoạn video do Sora 2 tạo ra với nhiều phong cách khác nhau (Video: OpenAI).

Ngoài khả năng dựng hình ảnh, Sora 2 còn tích hợp tạo âm thanh nền, hội thoại nhân vật và hỗ trợ nhiều ngôn ngữ, trong đó có tiếng Việt.

Một điểm nhấn khác là tính năng Cameo: chỉ cần tải lên đoạn video ngắn ghi lại gương mặt và giọng nói, người dùng có thể được “hóa thân” trực tiếp vào video do AI tạo ra.

Từ đoạn video mẫu của người dùng, Sora 2 có thể ghép họ vào những đoạn video do AI tạo ra (Ảnh: OpenAI).

Sam Altman, CEO OpenAI, gọi Sora 2 là “công cụ xây dựng trí tưởng tượng mạnh mẽ nhất từng được tạo ra”, kỳ vọng giúp mọi người sáng tạo video giải trí, quảng cáo hay các ý tưởng nghệ thuật.

Tuy nhiên, tính năng chèn gương mặt cũng làm dấy lên lo ngại bị lạm dụng để tạo nội dung sai lệch hoặc phản cảm. OpenAI cho biết sẽ áp dụng kiểm duyệt chặt chẽ và gắn nhãn “Sora” để nhận diện video do AI tạo ra.

CEO Sam Altman được ghép vào những đoạn video do Sora 2 tạo ra (Video: OpenAI).

Hiện Sora 2 mới được thử nghiệm giới hạn trên iOS tại Mỹ và Canada, dự kiến mở rộng sang Android và các quốc gia khác sau giai đoạn thử nghiệm.