Kiếm hàng nghìn USD mỗi giờ nhờ đóng giả người nổi tiếng livestream bán đồ
(Dân trí) - Sử dụng deepfake để tạo ra bản sao của người thật và livestream bán hàng, các sàn thương mại điện tử tại Trung Quốc đang kiếm được lượng tiền "khủng".
Lướt qua các video phát trực tiếp lúc 4h sáng trên Taobao - nền tảng thương mại điện tử phổ biến nhất tại Trung Quốc, mọi người sẽ thấy ứng dụng này "bận rộn" một cách kỳ lạ.
Trong khi phần lớn mọi người đang ngủ say, vẫn có rất nhiều người siêng năng livestream (phát sóng trực tiếp) giới thiệu các sản phẩm trước ống kính, đưa ra khuyến mãi giảm giá giữa đêm. Tuy nhiên, nếu nhìn kỹ hơn, những người chuyên phát sóng trực tiếp này có vẻ cứng nhắc, với những chuyển động có phần không tự nhiên.
Thực tế, những nhân vật xuất hiện trong các phiên livestream này không phải là con người. Họ là bản sao được tạo ra bằng AI (trí tuệ nhân tạo) của những người chuyên phát trực tiếp ở ngoài đời.
Hiện nay, livestream là phương thức tiếp thị chủ yếu của các thương hiệu tại Trung Quốc. Những "ngôi sao" của mạng xã hội như Taobao, Douyin (phiên bản Trung Quốc của TikTok) và Kuaishou (mạng xã hội video nổi tiếng) thu về lượng doanh thu khổng lồ chỉ trong vài giờ. Họ có thể bán được hàng tỷ USD chỉ trong một đêm và có địa vị như các diễn viên nổi tiếng.
Nhưng đồng thời, việc đào tạo và giữ chân người livestream, cùng việc tìm hiểu các chi tiết kỹ thuật về phát sóng, đòi hỏi chi phí đáng kể đối với các thương hiệu nhỏ.
Năm 2022, loạt công ty khởi nghiệp và công ty công nghệ lớn tại Trung Quốc đã cung cấp dịch vụ tạo ra các bản sao deepfake (công nghệ trí tuệ nhân tạo, sử dụng kỹ thuật tổng hợp hình ảnh của một người nào đó để kết hợp và chồng hình ảnh gương mặt lên một video hoặc hình ảnh của người khác) cho các phiên livestream.
Chỉ cần vài phút của video mẫu, đi kèm với chi phí 1.000 USD (khoảng 24,4 triệu đồng), các nhãn hàng có thể tạo ra một người dẫn chương trình trực tiếp dựa trên khuôn mặt của người thật để làm việc 24/7.
Công nghệ deepfake tiến vào ngành thương mại điện tử
Loại phương tiện tổng hợp này gây chú ý trên mạng xã hội Reddit từ cuối năm 2010, khi một người dùng tên "deepfake" đổi mặt của nhân vật trong các video khiêu dâm.
Từ đây, công nghệ phát triển nhưng ý tưởng thì vẫn vậy: Với một số công cụ kỹ thuật, khuôn mặt được tạo ra và biến đổi sao cho giống một nhân vật cụ thể, thực hiện những hành động mà họ chưa bao giờ làm.
Deepfake chủ yếu được biết đến bởi bị lạm dụng trong các trường hợp sai trái như khiêu dâm, giả mạo danh tính và cung cấp các thông tin sai lệch về chính trị.
Để thương mại hóa deepfake và biến nó thành công nghệ vô hại hơn, nhiều công ty trí tuệ nhân tạo tại Trung Quốc đã tìm ra một cách sử dụng mới được coi là đang tiến triển khá tốt.
Được thành lập vào năm 2017, Silicon Intelligence là công ty khởi nghiệp có trụ sở tại Nam Kinh (Trung Quốc) chuyên xử lý ngôn ngữ tự nhiên, đặc biệt là các công nghệ chuyển văn bản thành giọng nói như công cụ cuộc gọi tự động. Silicon Intelligence bắt đầu nhận thấy tiềm năng của AI trở thành công cụ livestream lần đầu tiên vào năm 2020.
Khi đó, công ty này cần video mẫu dài 30 phút để tạo ra bản sao số hóa có thể nói và hành động giống con người. Trong những năm tiếp theo, thời lượng video dần được rút ngắn lại, từ 10 phút, 3 phút và hiện tại là một phút.
Khi công nghệ được phát triển và cải thiện, phí dịch vụ cũng trở nên rẻ hơn. Việc tạo ra một bản sao trí tuệ nhân tạo cơ bản hiện nay tốn khoảng 1.100 USD (26,7 triệu đồng). Nếu khách hàng yêu cầu một streamer (người phát sóng trực tiếp) ảo phức tạp và có khả năng hoạt động tốt hơn, mức giá có thể tăng lên đến hàng nghìn USD, bao gồm phí bảo trì một năm.
Sau khi bản sao khuôn mặt được tạo ra, khuôn miệng và cơ thể của người livestream ảo sẽ di chuyển theo âm thanh của kịch bản. Bây giờ, những gì con người phải làm là nhập các thông tin cơ bản như tên, giá của sản phẩm được bán, đọc lại kịch bản có sẵn và xem streamer ảo phát trực tiếp.
Tại phiên bản nâng cao hơn của deepfake, những nhân vật AI có thể nhận biết các bình luận và tìm câu trả lời phù hợp ngay trong khi phát trực tiếp, giúp khán giả có được trải nghiệm đầy tương tác từ người bán.
Sự thay thế cho streamer người thật với giá cả "phải chăng"
Theo Huang Wei - giám đốc kinh doanh của công ty trí tuệ nhân tạo Xiaoice, những streamer ảo được đào tạo dựa trên các kịch bản và cử chỉ thường thấy trong các phiên livestream của con người.
"Khi giới thiệu sản phẩm mới, các streamer ảo sẽ chỉ xuống mục giỏ hàng, nơi người xem có thể tìm thấy tất cả sản phẩm đang được bán. Chúng tôi muốn đảm bảo rằng, ngôn ngữ nói và ngôn ngữ cơ thể phù hợp, đồng bộ với nhau", Huang Wei chia sẻ với MIT Technology Review.
Một trong những khách hàng của Xiaoice là Liu Jianhong - phát thanh viên thể thao người Trung Quốc - đã tạo phiên bản AI của chính mình để đọc kết quả trận đấu và các tin tức liên quan của FIFA World Cup 2022 trên Douyin.
Huang Wei cho biết, những người livestream ảo không thể vượt qua các streamer "kỳ cựu", nhưng họ đủ tốt để thay thế những gương mặt tầm trung trong nghề livestream bán hàng kiếm rất nhiều tiền tại Trung Quốc.
Theo công ty phân tích iiMedia Research, trong năm nay, các streamer bán hàng gặp khó khăn trong việc tìm kiếm việc làm, đi cùng là mức lương trung bình cho nghề này tại Trung Quốc đã giảm 20% so với năm ngoái.
Các công ty nhận thấy tiềm năng trong việc sử dụng AI để duy trì các buổi phát trực tiếp vào những thời điểm ít người xem. Điều này sẽ giúp giảm chi phí thuê người thật phát trực tiếp. Do đó, trí tuệ nhân tạo nay được sử dụng rất nhiều tại các sàn thương mại điện tử trong khung giờ nửa đêm.
Bằng việc sử dụng dịch vụ mà Xiaoice cung cấp, khách hàng có thể mang về doanh thu hơn 10.000 nhân dân tệ (khoảng 33,4 triệu đồng) chỉ trong một tiếng.
Tuy nhiên, việc sử dụng deepfake vẫn còn những hạn chế. Một trong số đó là streamer ảo gặp một số giới hạn trong việc di chuyển như nằm, ngồi trên ghế sofa hoặc trên giường. Đây là khuyết điểm lớn nhất cho các thương hiệu nội thất khi sử dụng AI để livestream.
Đối với Silicon Intelligence, bước tiến tiếp theo của họ là tăng cường "trí tuệ cảm xúc" cho các streamer ảo. Công ty đang nghiên cứu để những người livestream ảo có thể tương tác và học hỏi lẫn nhau.
"Nếu có bình luận lăng mạ, các bản sao AI sẽ buồn. Còn nếu các sản phẩm bán chạy, họ sẽ trở nên vui vẻ", Sima Huapeng - giám đốc điều hành của Silicon Intelligence - cho hay.