OpenAI không tạo đột phá và đang “đuổi theo” các startup tạo video A.I

Tháng Tư 4, 2024by VinhKhang0
tuvanthuanthanh_openai_dang_duoi_theo_cac_startup_tao_video_ai-e1712895716613.jpg

Nói đến tính năng tạo video bằng A.I, OpenAI đang không tạo ra đột phá mới mà còn có dấu hiệu tụt lại trên đường đua này.

Đoạn video lan truyền trên mạng về những “khổng tượng” đang lao nhanh trong lớp tuyết trắng xóa vào một ngày khô hanh trông như một thước phim chỉn chu được cắt ra từ chương trình truyền hình tài liệu National Geographic, ngoại trừ việc loài voi ma mút lông xù này đã tuyệt chủng hàng ngàn năm trước khi máy quay video được phát minh.

Đây là đoạn clip dài 10 giây được OpenAI phát hành vào tháng 2 để giới thiệu Sora, phần mềm trí tuệ nhân tạo (A.I) có thể biến các ý tưởng trên văn bản thành video có độ dài lên đến 1 phút, với hình ảnh cực kỳ chân thực. Tiếng vang về tính, nâng cấp bối cảnh công nghệ chỉ sau một đêm và đẩy A.I vào nhận thức của công chúng.

Tuy nhiên, lần này, OpenAI không tạo ra đột phá mới mà đang cố gắng bắt kịp các công ty khởi nghiệp đã cung cấp công cụ tương tự. Bản demo không đi kèm với việc giới thiệu sản phẩm hoặc thời điểm ra mắt chính thức. Theo Bloomberg, Công ty vẫn chưa đặt ra mốc thời gian cho Sora, mặc dù một Giám đốc Điều hành gần đây cho biết, dịch vụ này sẽ được phát hành vào cuối năm nay.

Một năm rưỡi trước, Meta và Google đã công bố các dự án nghiên cứu chuyển văn bản thành video trong đó có các đoạn clip đơn giản, dài vài giây, độ phân giải thấp về một cây kem ốc quế đang tan chảy, một chú chó siêu anh hùng đang bay và các chủ đề khác. Runway AI, Công ty đã huy động được 237 triệu USD cho đến nay, đã khởi đầu cơn sốt về các công cụ tạo video A.I vào tháng 3 năm ngoái với việc phát hành Gen-2. Dịch vụ này có thể tạo ra các đoạn clip dài 3 giây (trông hơi giật) dựa trên các chú thích như “cảnh quay bằng máy bay không người lái về phong cảnh sa mạc”. Giờ đây, nó có thể tạo ra các video chất lượng cao hơn đáng kể với thời lượng khoảng 20 giây, đồng sáng lập và Giám đốc Điều hành Cristóbal Valenzuela cho biết.

Các công ty khởi nghiệp A.I khác, bao gồm Haiper, Pika và Stability A.I, cũng đang xây dựng các công cụ tạo clip ngắn phức tạp hơn với hình ảnh chuyển động và hiệu ứng âm thanh (chẳng hạn như âm thanh thịt xông khói xèo xèo khi nấu trong chảo). Các công ty khởi nghiệp đã ra mắt phần mềm tạo video mà bất kỳ ai cũng có thể sử dụng, với giá rẻ hoặc miễn phí. Những công cụ này đã phát triển nhanh hơn cả nhà phát triển mong đợi đủ nhanh để trở thành mối lo ngại về tính kinh tế của việc làm video hoặc sự lan truyền của thông tin sai lệch tinh vi.

Bản demo Sora cho thấy sự hứa hẹn của công nghệ, bà Demi Guo, đồng sáng lập kiêm CEO của Pika, Công ty đã huy động được 55 triệu USD và tung ra phần mềm tạo video A.I vào cuối năm ngoái, cho biết. Bà Guo nói: “Nó cho thấy tiêu chuẩn về video A.I chất lượng cao đã được nâng lên và cột mốc thương mại hóa diện rộng sản phẩm ngày càng đến gần”.

Ông Valenzuela cho biết, Gen-2 đã được hàng triệu người sử dụng, bao gồm cả các chuyên gia tại các xưởng sản xuất phi và hoạt hình, họ dựa vào công cụ này để hữu hình hóa ý tưởng và viết kịch bản phân cảnh. Ông cho biết, các nhà biên tập phim đang tạo video bằng Runway và kết hợp chúng với các cảnh quay bổ sung, chèn thêm hiệu ứng hình ảnh, đồng thời cho biết thêm rằng ca sĩ Madonna cũng sử dụng video A.I cho một số hình ảnh được chiếu trên sân khấu trong các buổi hòa nhạc. Với sự ra đời của Sora, ông Valenzuela cho biết, các công cụ tạo video A.I, mặc dù vẫn còn non trẻ nhưng giờ đây đã được công nhận rộng rãi.

Ông Paul Trillo, một đạo diễn chuyên làm quảng cáo cho Ford F-150, và phim nghệ thuật, cho biết ông đã tích hợp công cụ tạo hình ảnh và video A.I vào quá trình sáng tạo của mình được một thời gian. Là người dùng đầu tiên của phần mềm Runway, ông nhận thấy có thể khám phá nhiều khái niệm và hiệu ứng đặc biệt. Nhưng ông không nghĩ A.I sẽ thay thế các nhà làm phim, bởi vì nó không thể tái tạo sắc thái hay tính tự phát trong quá trình sáng tạo của con người.

Bà Giada Pistilli, tại công ty khởi nghiệp A.I Hugging Face, cho biết công nghệ này có tiềm năng thêm hiệu ứng vào phim ảnh dễ dàng và rẻ hơn, đặc biệt hữu ích cho các nhà làm phim kinh phí thấp. Tuy nhiên thì sự phát triển của công cụ này cũng dễ dẫn đến truyền bá thông tin sai lệch hoặc nội dung khiêu dâm do A.I tạo ra.

Hiện tại, công nghệ này có những hạn chế rõ ràng. Các hệ thống của Pika và Haiper, cũng như Stable Video của Runway’s Gen-2 và Stability A.I cũng thường xuyên không tạo được video từ các văn bản đơn giản. Sora chưa được cung cấp công khai để thử nghiệm, nhưng ngay cả một số clip được chọn lọc kỹ lưỡng của OpenAI cũng cho thấy, phần mềm gặp khó khăn trong việc tạo ra các vật thể tuân theo các định luật vật lý một cách trung thực vẫn còn khó khăn đối với phần mềm tạo video.

Tạo video bằng A.I đòi hỏi nhiều tính toán hơn so với việc chạy chatbot hoặc trình tạo hình ảnh tĩnh, khiến việc phát triển tính năng này vừa tốn kém hơn vừa chậm hơn. Những thách thức kỹ thuật này có thể ảnh hưởng đến mô hình kinh doanh sản xuất video khi chi phí cao sẽ do khách hàng chịu. Ông Valenzuela cho biết, người dùng phải trả khoảng 1 USD để tạo ra 20 giây video bằng Runway. Giá có thể sẽ giảm; thông thường, các công nghệ này trở nên ít tốn kém hơn theo thời gian khi phần cứng và phần mềm được cải thiện. Ông Valenzuela cho biết, các xưởng phim hoạt hình và hiệu ứng hình ảnh chuyên nghiệp có thể tính phí từ 8.000-25.000 USD hoặc hơn cho 1 phút phim hoạt hình hoặc phim sáng tạo. Ông dự đoán rằng, vào cuối năm nay sẽ có ai đó làm một bộ phim dài ít nhất 60 phút, trong đó mọi cảnh đều sử dụng trình tạo video A.I.

Bà Guo nói rằng, trong vòng một năm, Pika có thể có phần mềm có thể tạo ra các clip chất lượng cao dài khoảng 1 phút và trong vòng 2 năm, nó có thể được sử dụng để làm phim truyện.

Hải Miên

Nguồn: nhipcaudautu

VinhKhang


Leave a Reply

Your email address will not be published. Required fields are marked *


Call Now Button