VideoGen 3.0 biến nền tảng của chúng tôi thành một trình chỉnh sửa video đầy đủ tính năng được hỗ trợ bởi trí tuệ nhân tạo. Phiên bản này giới thiệu quy trình tạo video ba giai đoạn được thiết kế lại (Tổng quan, Đề cương, Trình chỉnh sửa), một khung vẽ tương tác hoàn toàn mới, và một trình chỉnh sửa timeline nâng cấp. Chúng tôi đã xây dựng lại pipeline kết xuất để đảm bảo độ chính xác hoàn hảo giữa bản xem trước và xuất ra, thêm hàng đợi tác vụ nền cho các thao tác kéo dài ổn định, đồng thời mở rộng thư viện stock với hơn 12 triệu tài sản mới. Tất cả các cập nhật này tạo nên một trải nghiệm chỉnh sửa trực quan, trực tiếp và mạnh mẽ hơn.
Chúng tôi đã giới thiệu một quy trình tạo video được thiết kế lại gồm ba giai đoạn — Tổng quan, Đề cương và Trình chỉnh sửa — giúp cấu trúc dự án và cộng tác với AI hợp lý và dễ đoán hơn.
Tại trang Tổng quan, bạn có thể tải lên hình ảnh, video và tệp âm thanh mà bạn muốn tác tử AI sử dụng khi tạo video. Những tài sản này đóng vai trò là ngữ cảnh cho AI — chúng có thể xuất hiện trực tiếp dưới dạng hình ảnh, giúp AI hiểu chủ đề, hoặc được tham khảo khi xây dựng kịch bản và dàn ý.
Bạn cũng có thể chỉ định các nguồn tài nguyên media của mình, như Stock miễn phí, Wikimedia, iStock, AI Images, hoặc Nhạc. Tác tử AI sẽ lấy các nguồn này khi tạo video, kết hợp các tài sản bạn tải lên với hình ảnh và âm thanh bên ngoài để tạo ra nội dung phù hợp nhất cho từng cảnh.
Bạn còn có thể kiểm soát chi tiết hơn, như xác định tỉ lệ khung hình, khoảng thời lượng, và ngôn ngữ.
Sau khi gửi tóm tắt, tác tử AI sẽ tạo một dàn ý có cấu trúc chia video thành nhiều phần.
Mỗi phần được gán một loại dựa trên cách xử lý âm thanh:
Bạn có thể xem lại và chỉnh sửa các phần này trước khi vào trình chỉnh sửa.
Trong mỗi phần, bạn có thể đặt media nổi bật, ưu tiên hơn so với B-roll do AI chọn. Media nổi bật đảm bảo những hình ảnh nhất định (như clip thương hiệu, video demo, hoặc cảnh bạn tải lên) luôn hiển thị trong bản xuất cuối cùng.
Quy trình ba giai đoạn mới này tạo sự tách biệt rõ ràng giữa việc lên kế hoạch, cấu trúc và chỉnh sửa — đồng thời tạo điều kiện để AI hiểu rõ ngữ cảnh hơn, giúp tạo ra hình ảnh và thuyết minh chính xác.
Chúng tôi đã giới thiệu hệ thống bố cục mới giúp người dùng kiểm soát nhiều hơn cách văn bản và hình ảnh xếp đặt trong mỗi phần.
Bố cục xác định cấu trúc trực quan của cảnh — tiêu đề, phụ đề và media sẽ xuất hiện trên màn hình thế nào — giúp bạn dễ dàng chọn phong cách trình bày phù hợp với loại nội dung.
Các bố cục sau hiện đã có trong trình chỉnh sửa:
Chúng tôi đã thêm một khung vẽ tương tác hoàn toàn mới cho phép thao tác trực tiếp các phần tử trên video:
Các điều khiển này được cung cấp bởi bộ kết xuất thống nhất, nghĩa là bạn sẽ thấy chính xác, theo thời gian thực mọi thay đổi với bố cục cuối cùng khi làm việc.
Mang đến trải nghiệm chỉnh sửa trực quan hơn — bạn có thể tinh chỉnh vị trí, tỉ lệ và hiệu ứng động ngay trên khung vẽ, thay vì phải nhập số liệu thủ công.
Chúng tôi đã thiết kế lại trình chỉnh sửa timeline giúp bạn kiểm soát chính xác hơn về thời lượng và cấu trúc video:
Timeline đồng bộ thời gian thực với bản xem trước trên khung vẽ, nên mọi thay đổi đều được phản ánh ngay lập tức. Bạn có thể kéo timeline để xem trước từng khoảnh khắc, dễ dàng tinh chỉnh chuyển cảnh và thời gian trên toàn bộ video của mình.
Chúng tôi đã đại tu pipeline kết xuất video để cả bản xem trước và xuất bản cuối cùng đều hoạt động chung trên cùng một bộ kết xuất. Trước đây, xem trước và xuất video áp dụng các giải pháp kết xuất hơi khác nhau dẫn đến đôi lúc không nhất quán giữa lúc chỉnh sửa và kết quả cuối.
Bằng cách hợp nhất về một pipeline duy nhất:
Những gì bạn thấy là những gì bạn nhận được – bản xuất bây giờ sẽ hoàn toàn khớp với bản xem trước.
Lỗi kết xuất dễ theo dõi và sửa hơn vì chỉ còn một đường dẫn duy nhất.
Chúng tôi có thể nhanh chóng bổ sung các tính năng chỉnh sửa nâng cao, vì mọi cải tiến đều tác động đồng thời tới cả xem trước và xuất video.
Nền tảng này giúp việc chỉnh sửa video tin cậy hơn hôm nay và dễ phát triển hơn trong tương lai.
Chúng tôi triển khai hàng đợi tác vụ nền mới để các tác vụ dài chạy ổn định hơn, ngay cả khi bạn đóng tab trước khi quá trình hoàn thành. Những hành động sau đây luôn thực thi dưới dạng tác vụ nền:
Với độ trễ cực thấp, tự động thử lại và nhiều phương án thay thế, hệ thống mới này được xây dựng từ đầu nhằm mang lại trải nghiệm tạo video liền mạch nhất cho người dùng.
Chúng tôi đã mở rộng thư viện media stock tích hợp với hơn 12 triệu tài sản mới, bao gồm tích hợp với Pexels Images và Wikimedia Commons. Bản cập nhật này mang lại hình ảnh phong phú hơn khắp các chủ đề, cho phép AI truy cập cả video stock chất lượng cao và tài liệu giáo dục như sơ đồ, nhân vật công chúng.
Chúng tôi đã đại tu trải nghiệm người dùng (UX) liên quan đến việc thanh toán gói đăng ký thất bại trên toàn bộ ứng dụng. Giờ đây, khi bạn cố gắng sử dụng bất kỳ tính năng trả phí nào trong khi gói đăng ký của bạn không hoạt động, một cửa sổ thông báo sẽ xuất hiện với hướng dẫn rõ ràng về cách kích hoạt lại gói đăng ký. Tại đây, bạn có thể xem hóa đơn chưa thanh toán, quản lý gói của mình hoặc liên hệ với đội ngũ hỗ trợ khách hàng (với thông tin tài khoản của bạn tự động được thêm vào cuộc trò chuyện). Ngoài ra, trên bảng điều khiển chính cũng xuất hiện cảnh báo rõ ràng rằng gói đăng ký của bạn đang không hoạt động và có nút bấm để mở cửa sổ này.
Bạn hiện có thể chia sẻ một bản sao dự án của mình với đồng đội. Nhấn "Chia sẻ" ở góc trên bên phải của trình chỉnh sửa dự án, nhấn "Chia sẻ bản sao", sau đó nhập danh sách email (cách nhau bởi dấu phẩy) của những người bạn muốn chia sẻ. Mỗi người nhận sẽ nhận được một bản sao đầy đủ của dự án trong hộp thư đến và có thể chỉnh sửa, tạo và xuất video từ tài khoản của mình. Người nhận chưa thuộc nhóm của bạn sẽ được thêm vào nhóm khi chấp nhận lời mời.
Chúng tôi đã giới thiệu công cụ mới "Tạo clip video" hoàn toàn synthesize một video dài 8 giây dựa trên prompt, sử dụng model Veo 3 hiện đại của Google. Có thể mất vài phút để tạo clip và kết quả tốt nhất với các prompt rõ ràng về chủ đề, hành động, và bối cảnh. Hiện tại công cụ này chỉ dành riêng cho khách hàng Business.
Chúng tôi đã chuyển đổi tất cả không gian làm việc cá nhân thành nhóm 1 thành viên, giúp bạn dễ dàng hơn bao giờ hết khi làm video cùng đồng đội. Để mời đồng đội, chỉ cần nhấn "Mời đồng đội" ở góc trên bên phải bảng điều khiển và nhập email của họ. Để xem danh sách tất cả thành viên nhóm và chỉnh sửa quyền của họ, hãy truy cập Trang Nhóm.
Công cụ truyền thông là một tập hợp các quy trình để tạo và sinh tài sản ngay trong trình chỉnh sửa dự án. Bạn có thể truy cập các công cụ này ở bảng bên phải bằng cách nhấn vào tài sản trong dòng thời gian. Đối với tài sản trống, danh sách công cụ khả dụng sẽ xuất hiện ngay trên thanh bên. Đối với tài sản đã có nội dung (không phải bản ghi lời thoại), hãy nhấn "Thay thế" để thay thế tài sản bằng kết quả của một công cụ truyền thông.
Các công cụ hiện đang có:
Nhiều công cụ AI sáng tạo khác sẽ sớm ra mắt!
Tất cả video hiện đều được tạo với một bản nhạc nền phù hợp với nội dung video của bạn. Để vận hành hệ thống này, chúng tôi xây dựng một tác nhân âm nhạc AI có khả năng phân tích nội dung video và tự động chọn bản nhạc hoàn hảo từ thư viện nhạc của chúng tôi. Thư viện nhạc cũng đã được mở rộng với nhiều bản nhạc mới để đáp ứng đa dạng thể loại, tâm trạng và tiết tấu khác nhau.
Chúng tôi đã xây dựng lại dòng thời gian và khung xem trước để chỉ tải những phần cần thiết cho phần hiển thị của video, giúp phát lại các video dài trong trình chỉnh sửa dự án nhanh và mượt hơn. Trước đây, các video dài trên 10 phút có thể bị lag đáng kể.
Khi bạn thêm các tài sản phương tiện của riêng mình vào mẫu tạo video, VideoGen sẽ đặt từng tài sản này tại điểm thích hợp nhất so với kịch bản lồng tiếng. Chúng tôi đã đại tu hệ thống này với một agent AI mới, hiểu nội dung từng tài sản và chỉnh sửa thông minh toàn bộ đường b-roll. Agent này cũng sẽ lựa chọn các kiểu hoạt họa khác nhau tùy vào loại tài sản (ví dụ: ảnh chụp màn hình, biểu tượng, đồ họa thông tin).
Bạn hiện có thể tạo một avatar AI trên video của mình để trình bày kịch bản lồng tiếng với chuyển động môi đồng bộ. Hãy lựa chọn trong thư viện với hơn 100 người trình diễn sống động như thật để làm video của bạn trở nên hấp dẫn và cá nhân hóa hơn. Avatar hiện chỉ khả dụng cho các thuê bao gói Business và Enterprise.
Để thêm một avatar AI vào phần giọng nói AI đã có, nhấn vào tên người nói, nhấn nút avatar ở đầu popover, chọn người dẫn avatar yêu thích của bạn, sau đó nhấn tạo. Avatar của bạn sẽ sẵn sàng xem trước và xuất ra chỉ trong vài phút!
Chúng tôi đã mở rộng dòng thời gian thành nhiều lớp để mang lại sự linh hoạt và tùy biến hơn trong video của bạn. Lớp dưới cùng hiển thị các tài sản nền, nơi bạn có thể cắt, tách, thay thế và sắp xếp lại. Lớp giữa hiển thị tài sản kịch bản, tương ứng với giọng nói AI và/hoặc avatar của bạn. Cuối cùng, lớp trên cùng hiển thị tiêu đề màn hình, bạn có thể tùy chỉnh trong tab "Chủ đề" ở bảng bên trái. Trong dòng thời gian, bạn cũng có thể nhấn vào một tài sản để chọn và xem các tính năng chỉnh sửa nâng cao hơn ở bảng bên phải.