Giám đốc điều hành VideoGen, Anton Koenig, tham gia podcast Marketing B2B Technology để chia sẻ những hiểu biết về việc tạo video bằng AI, bàn về cách kết hợp nội dung do AI tạo ra với chỉnh sửa chuyên nghiệp giúp các nhà tiếp thị sản xuất video chất lượng cao trên quy mô lớn.

Giám đốc điều hành VideoGen, Anton Koenig, đã xuất hiện với tư cách khách mời trên podcast Marketing B2B Technology, do Mike Maynard của Napier dẫn dắt. Trong tập này mang tên "Khai thác AI cho biên tập video: Góc nhìn từ CEO VideoGen Anton Koenig", Anton chia sẻ câu chuyện hình thành VideoGen, cách AI đang biến đổi sản xuất video cho các nhà tiếp thị, và đưa ra lời khuyên thiết thực cho những ai muốn đưa video vào chiến lược nội dung của mình.
Napier là một công ty PR và tiếp thị công nghệ B2B có trụ sở tại Vương quốc Anh. Podcast Marketing B2B Technology của họ có các cuộc đối thoại với các lãnh đạo ngành, bao gồm công nghệ tiếp thị, công cụ AI và kiến thức thực tiễn cho các nhà tiếp thị B2B. Podcast có mặt trên Apple Podcasts, Spotify và trang web Napier.
Cuộc trò chuyện bắt đầu với việc Anton kể lại hành trình ra đời của VideoGen. Anh và đồng sáng lập David Grossman lần đầu gặp nhau ở một học viện tennis khi còn học cấp hai, nơi họ là bạn đánh đôi cũng như đối thủ cạnh tranh. Họ khác biệt với bạn bè bởi cùng đam mê lập trình, biên tập video, thiết kế đồ họa và sáng tạo số.
Suốt những năm đi học, họ cùng hợp tác phát triển nhiều ứng dụng web — Anton xây dựng một mạng xã hội nhỏ, còn David tạo công cụ biên tập nhạc trực tuyến. Họ cùng ra mắt nhiều app nhỏ, luôn hướng về khát khao tạo ra thứ gì đó có thể giúp bản thân họ khi mới bắt đầu học làm nội dung trực tuyến.
Tua nhanh về cuối năm 2022: cả hai sắp tốt nghiệp đại học và đã hoàn thành thực tập ở các công ty công nghệ lớn. Thay vì theo con đường truyền thống là trở thành kỹ sư phần mềm cho một tập đoàn lớn, họ quyết định xây dựng một startup tập trung vào lĩnh vực họ hiểu sâu sắc nhất — biên tập video.
Thời điểm đó thực sự thuận lợi. OpenAI vừa ra mắt GPT-3, Anton và David là những người đầu tiên có quyền truy cập nền tảng riêng này. Họ nhìn thấy cơ hội sử dụng mô hình AI để giúp việc chỉnh sửa video trở nên dễ tiếp cận hơn với các nhà tiếp thị, giáo viên, và những người cần giao tiếp thông qua video — những người cảm thấy phần mềm biên tập truyền thống quá phức tạp và mất thời gian.
Sau sáu tháng tập trung phát triển, họ ra mắt phiên bản đầu tiên của VideoGen vào năm 2023. Kể từ đó, nền tảng đã phát triển lên hơn 4 triệu người dùng tại hơn 190 quốc gia, nhận được đầu tư từ Y Combinator và Rebel Fund.
Một trong những chủ đề quan trọng nhất của tập podcast là sự trưởng thành của VideoGen từ khi ra mắt năm 2023. Phiên bản đầu tiên rất đơn giản: người dùng nhập yêu cầu (prompt), AI sẽ tìm video kho sẵn, sinh lời thoại và ghép lại thành video. Tuy nhiên, tùy chọn chỉnh sửa sau khi tạo video rất hạn chế.
Điều này phù hợp cho người mới, nhưng Anton giải thích rằng hiện tại, nền tảng phục vụ cả bán chuyên và chuyên nghiệp cần nhiều quyền kiểm soát hơn. Quy trình hiện tại cho phép AI tạo bản nháp đầu — giúp người dùng hoàn thành khoảng 75% công việc — sau đó họ tự tinh chỉnh mọi chi tiết trong trình biên tập đầy đủ tính năng.
Anton mô tả quy trình tiêu biểu của người dùng: nhập prompt, nhận kịch bản do AI sinh ra, chỉnh sửa và tinh chỉnh kịch bản trong giao diện storyboard, rồi nộp. AI sẽ tự động chọn cảnh quay kho hoặc dựng clip AI, tạo lời thoại (bằng giọng AI/ảnh đại diện), thêm nhạc, phụ đề. Người dùng có thể tùy chỉnh màu thương hiệu, điều chỉnh từng dòng nội dung.
Sự tiến hóa này xuất phát từ việc VideoGen sử dụng chính sản phẩm cho nhu cầu của mình. Anton nhận ra rất nhanh là những trường hợp chuyên nghiệp cần bổ sung màu thương hiệu, CTA cụ thể, và thử nghiệm A/B nhiều phiên bản nội dung — những chức năng vốn chưa có ở bản gốc.
Khi được hỏi điều gì làm VideoGen khác biệt so với các công cụ AI video phổ thông tích hợp trong ChatGPT hay Bing, Anton nhấn mạnh vai trò của tính năng biên tập. Các công cụ dành cho đại chúng có thể tạo clip ngắn nhanh chóng, nhưng lại thiếu các chức năng chỉnh sửa chi tiết mà nhà tiếp thị chuyên nghiệp cần.
Với các marketer B2B cần video chính xác, đúng thương hiệu, tối ưu hóa chiến dịch, khả năng điều chỉnh chi tiết là yếu tố không thể thiếu. Đây là điều VideoGen cung cấp mà công cụ AI thuần không có.
Cuộc trò chuyện cho thấy phân khúc lớn nhất của VideoGen là các nhà tiếp thị — bao gồm cả chuyên gia tiếp thị lẫn những người kiêm nhiệm công việc này. Nền tảng được nhiều marketer B2B/B2C sử dụng, người sáng tạo xây dựng cộng đồng để bán hàng, cũng như các nhóm đào tạo, truyền thông, giáo dục doanh nghiệp.
Anton lưu ý rằng nhóm khách hàng giáo dục doanh nghiệp thường làm video dài — 5-10 phút để giải thích các chủ đề phức tạp. VideoGen cũng phục vụ các công ty truyền thông lớn, dù vậy chính Anton thừa nhận số lượng tình huống sử dụng vượt ngoài mong đợi ban đầu.
Khi được hỏi về nơi marketer thấy giá trị lớn nhất từ VideoGen, Anton chỉ ra ngay quảng cáo mạng xã hội trả phí. Yêu cầu sản xuất 10-100 tài sản sáng tạo mỗi tuần, với phần lớn là video, là điều không thể chỉ bằng nhân lực.
VideoGen cho phép các nhóm tạo mẫu nội dung chính, rồi dùng AI tạo nhiều biến thể để thử nghiệm nhanh chóng. Dù tiếp thị tự nhiên (organic) đôi khi có thành công bất ngờ với kênh tăng lên 10.000, 50.000, thậm chí 100.000 người đăng ký, Anton vẫn cho rằng quảng cáo trả phí là trường hợp sử dụng mạnh nhất.
Một phần quan trọng của phỏng vấn nói về những lỗi Anton quan sát thấy khi marketer dùng công cụ AI video. Ngược với suy nghĩ thông thường, lỗi lớn nhất không phải là vấn đề kỹ thuật — mà là quá tin tưởng AI.
Anton giải thích: giá trị của AI là tự động hóa công việc, nhưng kết quả tốt nhất chỉ đến khi xem đầu ra của AI là bản nháp — không phải sản phẩm cuối. AI xóa bỏ nỗi ám ảnh "trang trắng" và tự động hóa các việc vặt như tìm video, tạo kịch bản. Tuy nhiên, video chuyên nghiệp vẫn cần con người chỉnh sửa lại tinh tế.
Những marketer thành công nhất sẽ chỉnh sửa lại nội dung do AI sinh ra: đổi câu mở đầu để hấp dẫn hơn, làm cô đọng nội dung, và bảo đảm sản phẩm cuối cùng đúng giọng thương hiệu. Anton cho đây là sự khác biệt giữa "bình thường" và "rất chuyên nghiệp và cuốn hút".
Anton đưa góc nhìn cân bằng về tranh luận chất – lượng. Anh cho biết người dùng VideoGen có thể tạo video trung bình chỉ trong 15 giây, điều này đôi khi khiến họ làm quá nhanh. Trong khi đó, marketer không dùng AI sẽ mất hàng giờ, thậm chí hàng ngày chỉ cho một video — quá chậm so với nhu cầu hiện đại.
Giải pháp tối ưu, theo Anton, là dành khoảng 30 phút chỉnh sửa mỗi video trước khi chuyển sang sản phẩm tiếp theo. Nhờ đó, nhóm có thể làm trọn gói 10 video chất lượng cho một chiến dịch, thay vì chỉ một video trau chuốt quá mức hoặc 50 video chưa hoàn thiện.
Khi được hỏi nên dùng stock, clip AI hay tự quay, Anton nói rằng tùy trường hợp. Người dùng thường không trộn stock với clip AI trong cùng một video — hoặc chỉ dùng stock và file upload cá nhân, hoặc toàn bộ là nội dung AI sinh ra.
Với chính hoạt động tiếp thị của VideoGen, họ đạt thành công khi kết hợp: dùng hook AI ở đầu để thu hút, rồi chèn video sẵn như quay màn hình, đồ họa chuyển động. Cách này tận dụng sự sáng tạo của AI cho khoảnh khắc thu hút, đồng thời giữ quyền kiểm soát nội dung lõi về sản phẩm.
Về tương lai, Anton giữ quan điểm thực tế. Thay vì dự đoán viển vông, anh tập trung vào chiến lược ổn định: mỗi ngày giải quyết nỗi đau thực tế cho khách hàng. Nếu đội ngũ liên tục mang lại giá trị, xu thế chung sẽ tự động xảy ra.
Dù vậy, Anton nhận ra một xu hướng rõ rệt: nhu cầu video sẽ tiếp tục tăng. Lý do không chỉ do AI — mà là vì công nghệ phát trực tuyến và lưu trữ đã tiến bộ vượt bậc suốt một thập kỷ qua. Chi phí phát video giảm, thiết bị hỗ trợ video nhiều hơn, chi phí sản xuất tiếp tục đi xuống. AI chỉ là lực đẩy tăng tốc chứ không phải động lực chính.
Khi ngày càng nhiều người xem và tạo video, mức độ cạnh tranh tăng và tiêu chuẩn chất lượng cũng nâng lên. Anton dự đoán điều này sẽ dẫn tới nhiều xu hướng, meme, khoảnh khắc viral mới trên các ngách khác nhau.
Khi được hỏi lời khuyên tiếp thị hay nhất từng nhận được, Anton nhấn mạnh tiếp thị tập trung giá trị: cung cấp giá trị trước để xây dựng lòng tin — từ đó chuyển đổi thành khách hàng. Điều này áp dụng cho cả nội dung lẫn sản phẩm — tặng video miễn phí hoặc tín dụng AI giúp người dùng trải nghiệm giá trị trước khi cam kết.
Với những người mới vào ngành, Anton đề xuất hai điều: học cách làm video (kỹ năng quan trọng nhưng nhiều marketer còn thiếu) và hiểu rõ SEO. Nguyên tắc cách công cụ tìm kiếm lẫn nền tảng AI lập chỉ mục và khám phá nội dung vẫn giữ nguyên dù công nghệ phát triển thế nào.
Phần phỏng vấn đầy đủ còn nhiều chủ đề như chiến lược marketing của VideoGen, quá trình đổi mới từ công cụ cho cá nhân sang công cụ cho người bán chuyên, và các thảo luận kỹ thuật chi tiết hơn.
Đọc toàn bộ bản ghi và nghe tập podcast →
"Sai lầm mà chúng tôi thấy không phải là tự viết nội dung, mà là quá tin tưởng vào AI viết hộ họ."
"Lực đẩy chính cho nhu cầu video tăng là do chi phí phát video giảm đi và ngày càng nhiều thiết bị hỗ trợ định dạng này."
"Làm video giờ là kỹ năng rất quan trọng nhưng không nhiều marketer biết làm."
VideoGen Team
VideoGen