Google ra mắt công cụ tạo video từ ảnh và giọng nói

Đăng ngày: 20/03/2024

Tác giả:

Google giới thiệu công cụ tạo video vlogger cho phép tạo video từ ảnh tĩnh và thu âm. Sử dụng công nghệ tiên tiến, VLOGGER AI biến ảnh đại diện thành video sống động với cử chỉ tự nhiên. Người dùng chỉ cần tải lên ảnh chân dung và file âm thanh, công cụ tự tạo video chân thực. Tuy nhiên, công nghệ cũng đối mặt với thách thức về tính chân thực và đạo đức.

Google vừa công bố công cụ AI mới mang tên VLOGGER, cho phép người dùng chuyển đổi ảnh đại diện tĩnh thành video chỉ bằng một bức ảnh chân dung và file thu âm giọng nói. Sử dụng kiến trúc khuếch tán tinh vi, công nghệ tiên tiến trong tạo hình ảnh và video, VLOGGER AI có khả năng “oxygenate” ảnh đại diện để tạo ra các cử chỉ chi tiết như nghiêng đầu, chuyển động mắt và biểu cảm tự nhiên trên khuôn mặt.

Để hoạt động một cách hiệu quả, Google đã huấn luyện VLOGGER AI trên một tập dữ liệu lớn gồm 800.000 video về người nói chuyện, giúp công cụ dự đoán chuyển động tự nhiên khi giao tiếp chỉ từ hình ảnh tĩnh và âm thanh. Người dùng chỉ cần tải lên một bức ảnh selfie rõ mặt và một file âm thanh, sau đó công cụ sẽ tự động tạo ra video với sự đồng bộ hoá chuyển động môi và ngôn ngữ cơ thể tự nhiên, mang lại trải nghiệm chân thực cho người xem.

Tuy nhiên, VLOGGER AI cũng đối diện với thách thức về tính chân thực khi xử lý các chuyển động phức tạp và bối cảnh đa dạng, cũng như vấn đề về đạo đức khi sử dụng công nghệ này, bao gồm nguy cơ tạo ra các video deepfake. Hiện tại, công cụ này đang trong giai đoạn nghiên cứu và thử nghiệm, chưa được công bố rộng rãi.

Mặc dù có những thách thức, VLOGGER AI hứa hẹn mở ra cánh cửa cho những nhà sáng tạo tiềm năng, giúp họ chia sẻ ý tưởng và câu chuyện của mình với thế giới mà không cần phải e ngại xuất hiện trước ống kính. Điều này có thể tạo ra những trải nghiệm mới mẻ và sáng tạo trong lĩnh vực tạo video và truyền thông.

Đọc thêm:
Cộng đồng nhà sáng tạo nội dung dẫn dắt bởi thương hiệu
Vingroup bán Vincom Retail với giá bao nhiêu