Pinterest

VideoGen 3.0: Trình chỉnh sửa video dựa trên tác tử AI

VideoGen 3.0 biến nền tảng của chúng tôi thành một trình chỉnh sửa video đầy đủ tính năng được hỗ trợ bởi trí tuệ nhân tạo. Phiên bản này giới thiệu quy trình tạo video ba giai đoạn được thiết kế lại (Tổng quan, Đề cương, Trình chỉnh sửa), một khung vẽ tương tác hoàn toàn mới, và một trình chỉnh sửa timeline nâng cấp. Chúng tôi đã xây dựng lại pipeline kết xuất để đảm bảo độ chính xác hoàn hảo giữa bản xem trước và xuất ra, thêm hàng đợi tác vụ nền cho các thao tác kéo dài ổn định, đồng thời mở rộng thư viện stock với hơn 12 triệu tài sản mới. Tất cả các cập nhật này tạo nên một trải nghiệm chỉnh sửa trực quan, trực tiếp và mạnh mẽ hơn.

Quy trình tạo video mới: Tổng quan → Đề cương → Trình chỉnh sửa

Chúng tôi đã giới thiệu một quy trình tạo video được thiết kế lại gồm ba giai đoạn — Tổng quan, Đề cương và Trình chỉnh sửa — giúp cấu trúc dự án và cộng tác với AI hợp lý và dễ đoán hơn.

Trang Tổng quan

Tại trang Tổng quan, bạn có thể tải lên hình ảnh, video và tệp âm thanh mà bạn muốn tác tử AI sử dụng khi tạo video. Những tài sản này đóng vai trò là ngữ cảnh cho AI — chúng có thể xuất hiện trực tiếp dưới dạng hình ảnh, giúp AI hiểu chủ đề, hoặc được tham khảo khi xây dựng kịch bản và dàn ý.

Bạn cũng có thể chỉ định các nguồn tài nguyên media của mình, như Stock miễn phí, Wikimedia, iStock, AI Images, hoặc Nhạc. Tác tử AI sẽ lấy các nguồn này khi tạo video, kết hợp các tài sản bạn tải lên với hình ảnh và âm thanh bên ngoài để tạo ra nội dung phù hợp nhất cho từng cảnh.

Bạn còn có thể kiểm soát chi tiết hơn, như xác định tỉ lệ khung hình, khoảng thời lượng, và ngôn ngữ.

Trang Đề cương

Sau khi gửi tóm tắt, tác tử AI sẽ tạo một dàn ý có cấu trúc chia video thành nhiều phần.

Mỗi phần được gán một loại dựa trên cách xử lý âm thanh:

  • Lồng tiếng AI: Sinh lồng tiếng bằng AI để thuyết minh đoạn văn bản.
  • Âm thanh đã chuyển lời: Phát file âm thanh hoặc video gốc bạn tải lên, đã chuyển lời để dễ chỉnh sửa.
  • Không lồng tiếng: Phát media gốc, không có lời thuyết minh — thường dùng cho các đoạn độc lập hoặc cảnh điện ảnh.

Bạn có thể xem lại và chỉnh sửa các phần này trước khi vào trình chỉnh sửa.

Media nổi bật

Trong mỗi phần, bạn có thể đặt media nổi bật, ưu tiên hơn so với B-roll do AI chọn. Media nổi bật đảm bảo những hình ảnh nhất định (như clip thương hiệu, video demo, hoặc cảnh bạn tải lên) luôn hiển thị trong bản xuất cuối cùng.

Quy trình ba giai đoạn mới này tạo sự tách biệt rõ ràng giữa việc lên kế hoạch, cấu trúc và chỉnh sửa — đồng thời tạo điều kiện để AI hiểu rõ ngữ cảnh hơn, giúp tạo ra hình ảnh và thuyết minh chính xác.

Hệ thống bố cục mới

Chúng tôi đã giới thiệu hệ thống bố cục mới giúp người dùng kiểm soát nhiều hơn cách văn bản và hình ảnh xếp đặt trong mỗi phần.
Bố cục xác định cấu trúc trực quan của cảnh — tiêu đề, phụ đề và media sẽ xuất hiện trên màn hình thế nào — giúp bạn dễ dàng chọn phong cách trình bày phù hợp với loại nội dung.

Các bố cục sau hiện đã có trong trình chỉnh sửa:

  • Tự động: Cho phép AI tự động chọn bố cục phù hợp nhất dựa trên nội dung và media của bạn.
  • Hình ảnh toàn màn hình: Hiển thị media ở toàn bộ khung hình.
  • Tiêu đề đơn giản: Bố cục đơn giản với tiêu đề và phụ đề trên nền trung tính.
  • Tiêu đề nổi bật: Đặt văn bản trên nền hình ảnh cho những khoảnh khắc mở đầu hoặc chuyển cảnh ấn tượng.
  • Chia đôi (Bên trái văn bản / Bên phải văn bản): Chia màn hình giữa hình ảnh và văn bản, lý tưởng cho video giải thích hoặc so sánh song song.
  • Lower Thirds: Chèn văn bản ở dưới cùng khung hình.
  • Văn bản đơn giản: Tập trung vào nội dung văn bản với nền trung tính.

Khung vẽ tương tác với khả năng kéo và biến đổi

Chúng tôi đã thêm một khung vẽ tương tác hoàn toàn mới cho phép thao tác trực tiếp các phần tử trên video:

  • Kéo: Nhấn giữ và kéo để di chuyển phần tử đến vị trí chính xác mong muốn.
  • Thay đổi kích thước / biến đổi: Điều chỉnh kích thước và tỷ lệ tương tác qua các điểm kéo.
  • Bắt dính: Phần tử tự động dính vào các đường hướng dẫn hoặc phần tử khác để bố cục thẳng hàng.
  • Hiệu ứng động: Thêm hiệu ứng xuất hiện và biến mất cho bất kỳ phần tử nào ngay trên khung vẽ.

Các điều khiển này được cung cấp bởi bộ kết xuất thống nhất, nghĩa là bạn sẽ thấy chính xác, theo thời gian thực mọi thay đổi với bố cục cuối cùng khi làm việc.

Mang đến trải nghiệm chỉnh sửa trực quan hơn — bạn có thể tinh chỉnh vị trí, tỉ lệ và hiệu ứng động ngay trên khung vẽ, thay vì phải nhập số liệu thủ công.

Trình chỉnh sửa timeline nâng cao

Chúng tôi đã thiết kế lại trình chỉnh sửa timeline giúp bạn kiểm soát chính xác hơn về thời lượng và cấu trúc video:

  • Quản lý lớp: Làm việc với nhiều lớp media, văn bản và hình khối, tất cả được sắp xếp rõ ràng trên giao diện timeline.
  • Chia đoạn: Chia nhỏ clip tại bất kỳ điểm nào để chỉnh sửa độc lập.
  • Cắt: Điều chỉnh điểm bắt đầu và kết thúc của clip để kiểm soát chính xác nội dung xuất hiện trong video.
  • Sắp xếp lại: Kéo thả clip để thay đổi thứ tự và trình tự video.

Timeline đồng bộ thời gian thực với bản xem trước trên khung vẽ, nên mọi thay đổi đều được phản ánh ngay lập tức. Bạn có thể kéo timeline để xem trước từng khoảnh khắc, dễ dàng tinh chỉnh chuyển cảnh và thời gian trên toàn bộ video của mình.

Pipeline xem trước và xuất video tái thiết kế

Chúng tôi đã đại tu pipeline kết xuất video để cả bản xem trước và xuất bản cuối cùng đều hoạt động chung trên cùng một bộ kết xuất. Trước đây, xem trước và xuất video áp dụng các giải pháp kết xuất hơi khác nhau dẫn đến đôi lúc không nhất quán giữa lúc chỉnh sửa và kết quả cuối.

Bằng cách hợp nhất về một pipeline duy nhất:

Những gì bạn thấy là những gì bạn nhận được – bản xuất bây giờ sẽ hoàn toàn khớp với bản xem trước.

Lỗi kết xuất dễ theo dõi và sửa hơn vì chỉ còn một đường dẫn duy nhất.

Chúng tôi có thể nhanh chóng bổ sung các tính năng chỉnh sửa nâng cao, vì mọi cải tiến đều tác động đồng thời tới cả xem trước và xuất video.

Nền tảng này giúp việc chỉnh sửa video tin cậy hơn hôm nay và dễ phát triển hơn trong tương lai.

Hàng đợi tác vụ nền

Chúng tôi triển khai hàng đợi tác vụ nền mới để các tác vụ dài chạy ổn định hơn, ngay cả khi bạn đóng tab trước khi quá trình hoàn thành. Những hành động sau đây luôn thực thi dưới dạng tác vụ nền:

  • Tạo dàn ý
  • Tạo video
  • Tạo hình ảnh
  • Tạo đoạn video
  • Chuyển văn bản thành lời nói
  • Tạo hiệu ứng âm thanh
  • Quét trang web

Với độ trễ cực thấp, tự động thử lại và nhiều phương án thay thế, hệ thống mới này được xây dựng từ đầu nhằm mang lại trải nghiệm tạo video liền mạch nhất cho người dùng.

Thư viện stock mở rộng với hơn 12 triệu tài sản mới

Chúng tôi đã mở rộng thư viện media stock tích hợp với hơn 12 triệu tài sản mới, bao gồm tích hợp với Pexels Images và Wikimedia Commons. Bản cập nhật này mang lại hình ảnh phong phú hơn khắp các chủ đề, cho phép AI truy cập cả video stock chất lượng cao và tài liệu giáo dục như sơ đồ, nhân vật công chúng.

Các cải tiến và sửa lỗi khác

  • Tác tử AI của chúng tôi giờ tự động chọn giọng nói AI và avatar (nếu cần) dựa trên nội dung kịch bản và ngôn ngữ của bạn.
  • Đã giới thiệu chế độ "Deep Research" cho phép AI suy luận nhiều bước để tạo dàn ý chuyên sâu hơn.
  • Thêm công cụ tạo "hiệu ứng âm thanh" chuyển bất kỳ prompt nào thành file âm thanh ngắn.
  • Cài đặt lọc nội dung giờ áp dụng cả khi tìm kiếm stock library, ngăn chặn chèn các tài sản không phù hợp.
  • Thêm tùy chọn ở trang "Nhóm" để thành viên tự rời khỏi nhóm. Trước đây chỉ quản trị viên mới được xóa thành viên.
  • Sửa lỗi quét website thất bại với các trang không có thẻ meta description.
  • Cải thiện độ tin cậy của hệ thống scraping web để tải ảnh từ site yêu cầu.
  • Đảm bảo cập nhật dữ liệu đăng ký có thứ tự nghiêm ngặt trên backend, ngăn lỗi đồng bộ dữ liệu không thường xuyên.
  • Quét website giờ luôn lấy ảnh Open Graph của trang làm mục đầu tiên trong danh sách ảnh lấy về.
  • Người dùng giờ có thể bấm nút tại "Cài đặt thanh toán" để tự đồng bộ lại dữ liệu đăng ký.
  • Tăng giới hạn xuất video cho tài khoản trả phí.
  • Sửa lỗi thông báo lỗi giới hạn lưu trữ không hiển thị đúng.

Xử lý tốt hơn các gói đăng ký không hoạt động

Chúng tôi đã đại tu trải nghiệm người dùng (UX) liên quan đến việc thanh toán gói đăng ký thất bại trên toàn bộ ứng dụng. Giờ đây, khi bạn cố gắng sử dụng bất kỳ tính năng trả phí nào trong khi gói đăng ký của bạn không hoạt động, một cửa sổ thông báo sẽ xuất hiện với hướng dẫn rõ ràng về cách kích hoạt lại gói đăng ký. Tại đây, bạn có thể xem hóa đơn chưa thanh toán, quản lý gói của mình hoặc liên hệ với đội ngũ hỗ trợ khách hàng (với thông tin tài khoản của bạn tự động được thêm vào cuộc trò chuyện). Ngoài ra, trên bảng điều khiển chính cũng xuất hiện cảnh báo rõ ràng rằng gói đăng ký của bạn đang không hoạt động và có nút bấm để mở cửa sổ này.

Các cải tiến và sửa lỗi khác

  • Đã khắc phục sự cố tương thích khiến một số dự án cũ không thể tạo ra kết quả.
  • Thêm các nút "Tải lên" và "Thay đổi" vào bảng điều khiển bên phải cho nhóm tài sản
  • Như một giải pháp tạm thời nhằm ngăn việc vô tình tạo lại màn hình tiêu đề thành cảnh quay sẵn có, phím tắt "R" đã bị vô hiệu hóa ở lớp trên cùng.
  • Đã chỉnh sửa giao diện người dùng và bổ sung các ví dụ về kết quả chất lượng cao cho các công cụ AI sinh nội dung.

Chia sẻ dự án

Bạn hiện có thể chia sẻ một bản sao dự án của mình với đồng đội. Nhấn "Chia sẻ" ở góc trên bên phải của trình chỉnh sửa dự án, nhấn "Chia sẻ bản sao", sau đó nhập danh sách email (cách nhau bởi dấu phẩy) của những người bạn muốn chia sẻ. Mỗi người nhận sẽ nhận được một bản sao đầy đủ của dự án trong hộp thư đến và có thể chỉnh sửa, tạo và xuất video từ tài khoản của mình. Người nhận chưa thuộc nhóm của bạn sẽ được thêm vào nhóm khi chấp nhận lời mời.

Công cụ "Tạo clip video"

Chúng tôi đã giới thiệu công cụ mới "Tạo clip video" hoàn toàn synthesize một video dài 8 giây dựa trên prompt, sử dụng model Veo 3 hiện đại của Google. Có thể mất vài phút để tạo clip và kết quả tốt nhất với các prompt rõ ràng về chủ đề, hành động, và bối cảnh. Hiện tại công cụ này chỉ dành riêng cho khách hàng Business.

Các cải tiến và sửa lỗi khác

  • Thay đổi cách tính phí đội nhóm: sẽ trừ tiền ngay lập tức theo tỷ lệ sau khi thêm thành viên mới.
  • Mở rộng thư viện giọng nói với nhiều giọng vùng miền và phương ngữ đa dạng hơn.
  • Thêm popover "Tạo link xem công khai", cho phép người dùng xuất video và công khai liên kết chỉ với một cú nhấp chuột.
  • Nếu đường dẫn xem công khai được bật trong khi xuất video vẫn đang chờ xử lý, hình xem trước Open Graph sẽ được cập nhật để khớp với video sau khi xuất xong.
  • Hoàn thành việc chuyển đổi tất cả workspace cá nhân sang nhóm, giải quyết nhiều vấn đề tương thích lặt vặt.
  • Tăng tốc độ tải ở trang đích với phương pháp tải dần tài sản.
  • Kích hoạt bộ lọc nội dung mặc định cho tất cả người dùng mới để ngăn tạo ảnh không phù hợp.
  • Gỡ bỏ watermark "AI" trên các video avatar tạo bằng AI.
  • Thêm nút avatar bên cạnh nút giọng nói trong trình chỉnh sửa kịch bản, giúp nổi bật tính năng tạo avatar của chúng tôi.
  • Việc nhấp ra ngoài modal sẽ không làm đóng popover phía dưới modal nữa.

Không gian làm việc cá nhân giờ đây là nhóm

Mời đồng đội

Chúng tôi đã chuyển đổi tất cả không gian làm việc cá nhân thành nhóm 1 thành viên, giúp bạn dễ dàng hơn bao giờ hết khi làm video cùng đồng đội. Để mời đồng đội, chỉ cần nhấn "Mời đồng đội" ở góc trên bên phải bảng điều khiển và nhập email của họ. Để xem danh sách tất cả thành viên nhóm và chỉnh sửa quyền của họ, hãy truy cập Trang Nhóm.

Các cải tiến và sửa lỗi khác

  • Nâng cấp thư viện nhạc với nhiều bản nhạc hơn đáng kể cho nhiều thể loại khác nhau.
  • Thêm kiểm tra để đảm bảo việc thêm hoặc xóa thành viên luôn được cập nhật ngay lập tức vào số lượng thuê bao.
  • Đã sửa lỗi khiến trang xuất video bị buffering vô hạn.
  • Sửa nhiều lỗi xử lý thuê bao nhỏ khiến việc cập nhật thông tin thuê bao bị chậm trễ.

Công cụ truyền thông

Công cụ truyền thông

Công cụ truyền thông là một tập hợp các quy trình để tạo và sinh tài sản ngay trong trình chỉnh sửa dự án. Bạn có thể truy cập các công cụ này ở bảng bên phải bằng cách nhấn vào tài sản trong dòng thời gian. Đối với tài sản trống, danh sách công cụ khả dụng sẽ xuất hiện ngay trên thanh bên. Đối với tài sản đã có nội dung (không phải bản ghi lời thoại), hãy nhấn "Thay thế" để thay thế tài sản bằng kết quả của một công cụ truyền thông.

Các công cụ hiện đang có:

  • Video stock miễn phí
  • Video Getty iStock
  • Tải lên phương tiện
  • Màu nền
  • Màn hình tiêu đề
  • Tạo hình ảnh

Nhiều công cụ AI sáng tạo khác sẽ sớm ra mắt!

Chọn nhạc nền tự động

Tất cả video hiện đều được tạo với một bản nhạc nền phù hợp với nội dung video của bạn. Để vận hành hệ thống này, chúng tôi xây dựng một tác nhân âm nhạc AI có khả năng phân tích nội dung video và tự động chọn bản nhạc hoàn hảo từ thư viện nhạc của chúng tôi. Thư viện nhạc cũng đã được mở rộng với nhiều bản nhạc mới để đáp ứng đa dạng thể loại, tâm trạng và tiết tấu khác nhau.

Các cải tiến và sửa lỗi khác

  • Tối ưu hóa thêm cho phần xem trước video trong trình chỉnh sửa dự án, làm giảm độ trễ với những video dài.
  • Cải thiện trải nghiệm khi tạo màn hình tiêu đề trong dòng thời gian, tránh việc vô tình thêm lớp phủ vào dự án.
  • Vá lỗi khiến văn bản tiếng Anh hiển thị chớp nhoáng trước khi tải bản dịch cho người dùng không sử dụng tiếng Anh.
  • Thêm cửa sổ thông báo giới hạn sử dụng để chỉ rõ bạn phải chờ bao lâu để giới hạn AI được thiết lập lại.
  • Sửa nhiều lỗi nhỏ về giao diện và thay đổi bố cục trên thiết bị di động.

Dòng thời gian và xem trước được tối ưu hóa

Chúng tôi đã xây dựng lại dòng thời gian và khung xem trước để chỉ tải những phần cần thiết cho phần hiển thị của video, giúp phát lại các video dài trong trình chỉnh sửa dự án nhanh và mượt hơn. Trước đây, các video dài trên 10 phút có thể bị lag đáng kể.

Tác nhân AI thông minh hơn cho chỉnh sửa phương tiện

Thêm phương tiện

Khi bạn thêm các tài sản phương tiện của riêng mình vào mẫu tạo video, VideoGen sẽ đặt từng tài sản này tại điểm thích hợp nhất so với kịch bản lồng tiếng. Chúng tôi đã đại tu hệ thống này với một agent AI mới, hiểu nội dung từng tài sản và chỉnh sửa thông minh toàn bộ đường b-roll. Agent này cũng sẽ lựa chọn các kiểu hoạt họa khác nhau tùy vào loại tài sản (ví dụ: ảnh chụp màn hình, biểu tượng, đồ họa thông tin).

Các cải tiến và sửa lỗi khác

  • Đã sửa lỗi khiến một số người dùng có nhiều thuê bao hết hạn không nhìn thấy thuê bao gần nhất.
  • Đã thay đổi kiểu chú thích mặc định để làm nổi bật từ đang phát hiện tại, khiến phụ đề thu hút hơn.
  • Cập nhật logic cắt video để tất cả trimmer tài sản đều hiển thị đúng trong phạm vi của lớp.
  • Đã loại bỏ độ trễ khi chỉnh sửa thời gian bắt đầu và kết thúc của tài sản nền.
  • Sửa lỗi làm cho một số video xuất với tài sản Getty iStock bị lỗi.
  • Tăng độ đa dạng màu sắc cho chuỗi hình ảnh sinh AI liên tiếp trong video được tạo.

Avatar

Trình chỉnh sửa Avatar

Bạn hiện có thể tạo một avatar AI trên video của mình để trình bày kịch bản lồng tiếng với chuyển động môi đồng bộ. Hãy lựa chọn trong thư viện với hơn 100 người trình diễn sống động như thật để làm video của bạn trở nên hấp dẫn và cá nhân hóa hơn. Avatar hiện chỉ khả dụng cho các thuê bao gói Business và Enterprise.

Để thêm một avatar AI vào phần giọng nói AI đã có, nhấn vào tên người nói, nhấn nút avatar ở đầu popover, chọn người dẫn avatar yêu thích của bạn, sau đó nhấn tạo. Avatar của bạn sẽ sẵn sàng xem trước và xuất ra chỉ trong vài phút!

Dòng thời gian nhiều lớp

Chúng tôi đã mở rộng dòng thời gian thành nhiều lớp để mang lại sự linh hoạt và tùy biến hơn trong video của bạn. Lớp dưới cùng hiển thị các tài sản nền, nơi bạn có thể cắt, tách, thay thế và sắp xếp lại. Lớp giữa hiển thị tài sản kịch bản, tương ứng với giọng nói AI và/hoặc avatar của bạn. Cuối cùng, lớp trên cùng hiển thị tiêu đề màn hình, bạn có thể tùy chỉnh trong tab "Chủ đề" ở bảng bên trái. Trong dòng thời gian, bạn cũng có thể nhấn vào một tài sản để chọn và xem các tính năng chỉnh sửa nâng cao hơn ở bảng bên phải.

Các cải tiến và sửa lỗi khác

  • Thực hiện nhiều sửa lỗi cho nhóm, cho phép chuyển đổi mượt mà giữa thuê bao cá nhân và nhóm.
  • Đã sửa lỗi khiến các phần mới tạo trong trình chỉnh sửa dự án đôi khi lặp lại tài sản nền đã có trong video.
  • Đã cải tiến xuất bản text overlay nhanh hơn đáng kể, đặc biệt với các video dài.