Pinterest

VideoGen 3.0: Agentyczny Edytor Wideo

VideoGen 3.0 przekształca naszą platformę w w pełni funkcjonalny edytor wideo wspierany przez sztuczną inteligencję. Ta wersja wprowadza przeprojektowany, trzystopniowy proces tworzenia (Przegląd, Konspekt, Edytor), zupełnie nowe interaktywne płótno oraz ulepszony edytor osi czasu. Przebudowaliśmy naszą linię renderowania dla doskonałej zgodności podglądu z eksportem, dodaliśmy kolejkę zadań w tle dla niezawodnych, długotrwałych operacji oraz rozszerzyliśmy bibliotekę stocków o ponad 12 milionów nowych zasobów. Łącznie te aktualizacje tworzą bardziej wizualne, intuicyjne i potężne środowisko edycji.

Nowy proces tworzenia wideo: Przegląd → Konspekt → Edytor

Wprowadziliśmy przeprojektowany proces tworzenia wideo, oparty o trzy etapy — Przegląd, Konspekt i Edytor — aby konfiguracja projektu i współpraca z AI były bardziej uporządkowane i przewidywalne.

Strona przeglądu

Na stronie przeglądu możesz przesłać obrazy, filmy oraz pliki audio, których agent AI użyje podczas generowania Twojego wideo. Te zasoby stanowią kontekst dla AI — mogą pojawiać się bezpośrednio jako wizualizacje, pomagać zrozumieć temat lub być referencją podczas tworzenia scenariusza i konspektu.

Możesz także określić źródła multimediów, takie jak Darmowe Stocki, Wikimedia, iStock, AI Images czy Muzyka. Agent AI podczas generacji pobierze zasoby zarówno z Twoich plików, jak i zewnętrznych źródeł obrazu i dźwięku, by dostarczyć najbardziej odpowiednie multimedia dla każdej sceny.

Masz również bardziej szczegółową kontrolę nad współczynnikiem proporcji, zakresem długości i językiem.

Strona konspektu

Po przesłaniu briefu agent AI tworzy strukturalny konspekt dzielący Twoje wideo na sekcje.

Każda sekcja otrzymuje typ, w zależności od sposobu obsługi audio:

  • AI Voiceover: Generuje lektora AI czytającego tekst sekcji.
  • Audio Transkrybowane: Odtwarza oryginalny przesłany plik audio lub wideo, poddany transkrypcji do edycji.
  • Bez lektora: Odtwarza multimedia bez narracji — często stosowane w samodzielnych klipach lub sekwencjach filmowych.

Możesz przejrzeć i edytować te sekcje przed przejściem do edytora.

Materiał wyróżniony

W każdej sekcji możesz ustawić materiał wyróżniony, który ma pierwszeństwo przed materiałem wybranym przez AI. Materiał wyróżniony gwarantuje, że konkretne wizualizacje (takie jak klipy markowe, filmy demo czy przesłane nagrania) zawsze pojawią się w końcowym renderze tej sekcji.

Nowy trzystopniowy workflow tworzy wyraźniejszy podział między planowaniem, strukturą a edycją — jednocześnie dając AI silniejszy kontekst do generowania trafnych wizualizacji i narracji.

Nowy system układów

Wprowadziliśmy nowy system układów dający większą kontrolę nad rozmieszczeniem tekstu i obrazu w każdej sekcji. Układ decyduje o wizualnej strukturze sceny — jak tytuł, podtytuł i multimedia pojawiają się na ekranie — ułatwiając dopasowanie stylu prezentacji do rodzaju treści.

W edytorze dostępne są następujące układy:

  • Auto: Pozwala AI automatycznie dobrać najbardziej odpowiedni układ do treści i multimediów.
  • Media na pełnym ekranie: Wyświetla materiał wizualny na całym kadrze.
  • Prosty tytuł: Czysty układ z tytułem i podtytułem na neutralnym tle.
  • Hero tytuł: Umieszcza tekst na tle materiału, idealny do efektownych otwarć i przejść.
  • Podział (Tekst Lewa / Tekst Prawa): Dzieli ekran między multimedia i tekst, idealny do filmów typu explainer i porównań.
  • Dolne napisy: Nakłada tekst na dolną część kadru.
  • Prosty tekst: Skupia się na treściach tekstowych z neutralnym tłem.

Interaktywne płótno z kontrolą przesuwania i transformacji

Dodaliśmy zupełnie nowe interaktywne płótno, pozwalające na bezpośrednią manipulację elementami wideo:

  • Przesuwanie: Kliknij i przeciągnij, aby precyzyjnie umieścić elementy.
  • Zmiana rozmiaru / transformacja: Reguluj rozmiar i skalę elementów za pomocą uchwytów.
  • Przyciąganie: Elementy automatycznie przyciągają się do linii pomocniczych i innych obiektów dla czystych, wyrównanych układów.
  • Animacje: Dodaj animacje wejścia i wyjścia dowolnemu elementowi bezpośrednio z płótna.

Te kontrolki napędzane są naszym zunifikowanym silnikiem renderującym, więc zmiany w kompozycji widzisz w czasie rzeczywistym.

To zapewnia znacznie bardziej wizualne i intuicyjne doświadczenie edycji — teraz możesz precyzyjnie ustawiać położenie, skalę i animacje bez ręcznego wpisywania liczb.

Ulepszony edytor osi czasu

Przeprojektowaliśmy edytor osi czasu, abyś miał większą kontrolę nad czasem trwania i strukturą wideo:

  • Zarządzanie warstwami: Pracuj z wieloma warstwami multimediów, tekstów i kształtów, wszystko uporządkowane na przejrzystej osi czasu.
  • Podział: Podziel klipy w dowolnym miejscu, by tworzyć niezależne segmenty do edycji.
  • Przycinanie: Dostosuj punkt początkowy i końcowy każdego klipu, by kontrolować, co dokładnie pokaże się na filmie.
  • Zmień kolejność: Przeciągnij klipy, by zmienić ich kolejność i strukturę filmu.

Oś czasu synchronizuje się w czasie rzeczywistym z podglądem płótna, więc każda zmiana natychmiast pojawia się w kompozycji. Możesz przewijać oś czasu, podglądając wybrane momenty — dzięki temu łatwo dopracować przejścia i czas w całym filmie.

Przebudowany system podglądu i eksportu

Przebudowaliśmy linię renderowania tak, by zarówno podgląd, jak i finalny eksport korzystały z tego samego silnika. Wcześniej podgląd i eksport używały nieco innych fragmentów kodu renderowania, co czasem powodowało niezgodności między edycją a finalnym wynikiem.

Dzięki połączeniu ich w jeden system:

  • To, co widzisz, to co dostajesz — eksport będzie teraz idealnie zgodny z podglądem.
  • Błędy renderowania są łatwiejsze do wykrycia i naprawy, bo jest tylko jedna ścieżka renderingu.
  • Możemy szybciej wprowadzać zaawansowane funkcje edycji — wszelkie usprawnienia dotyczą zarówno podglądu, jak i eksportu automatycznie.

To fundament dla bardziej niezawodnej edycji już dzisiaj i szybkiego rozwoju w przyszłości.

Kolejka zadań w tle

Wdrożyliśmy nową kolejkę zadań w tle, by długie operacje wykonywały się niezawodnie — nawet jeśli zamkniesz kartę przed końcem procesu. Poniższe czynności zawsze są wykonywane jako zadania w tle:

  • Generowanie konspektu
  • Generowanie wideo
  • Generowanie obrazu
  • Generowanie klipu wideo
  • Generowanie tekstu na mowę
  • Generowanie efektów dźwiękowych
  • Skanowanie strony internetowej

Przy minimalnych opóźnieniach, automatycznych ponownych próbach i wielu mechanizmach awaryjnych nowy system został zbudowany od podstaw, by uczynić proces generowania wideo maksymalnie płynnym.

Rozszerzona biblioteka stocków o >12 mln nowych zasobów

Rozszerzyliśmy wbudowaną bibliotekę multimediów stockowych o ponad 12 milionów nowych zasobów, w tym integracje z Pexels Images oraz Wikimedia Commons. Aktualizacja zapewnia szerszy zasięg wizualny, dając agentowi AI dostęp zarówno do wysokiej jakości klipów stockowych, jak i materiałów edukacyjnych (diagramy, postaci publiczne).

Inne usprawnienia i poprawki

  • Nasz agent AI automatycznie wybierze lektora i awatara AI (jeśli to konieczne) zgodnie z treścią scenariusza i językiem.
  • Wprowadziliśmy nowy tryb "Deep Research", pozwalający AI na wieloetapowe rozumowanie do budowania głębszych konspektów.
  • Dodano narzędzie "Generuj efekt dźwiękowy", które każde polecenie zamienia w krótki plik dźwiękowy z efektem.
  • Ustawienie filtra treści dotyczy teraz także wyszukiwarki stocków — zapobiega niepożądanym, nieodpowiednim zasobom.
  • Dodano opcję na stronie "Zespół" pozwalającą członkowi opuścić własny zespół; wcześniej mogli być usuwani tylko przez administratora.
  • Naprawiono problem powodujący błąd skanowania stron bez meta description tagu.
  • Poprawiono niezawodność systemu pobierania zdjęć z żądanej strony internetowej.
  • Wymuszono ścisłą kolejność aktualizacji subskrypcji w backendzie, by zapobiec okazjonalnym błędom synchronizacji.
  • Skanowanie stron zawsze obejmuje zdjęcie Open Graph strony jako pierwszy obrazek z listy pobranych.
  • Teraz użytkownicy mogą nacisnąć przycisk w "Ustawieniach rozliczeń", by ręcznie zsynchronizować dane subskrypcji.
  • Podniesiono limit eksportów wideo dla płatnych subskrybentów.
  • Rozwiązano problem błędów limitu miejsca na dysku, które nie były poprawnie wyświetlane użytkownikowi.

Lepsza obsługa nieaktywnych subskrypcji

Całkowicie przebudowaliśmy nasz interfejs użytkownika związany z obsługą nieopłaconych subskrypcji w całej aplikacji. Teraz, gdy spróbujesz użyć dowolnej płatnej funkcji, a Twoja subskrypcja jest nieaktywna, pojawi się okno modalne z jasnymi instrukcjami, jak ponownie aktywować subskrypcję. Z tego miejsca możesz zobaczyć nieopłaconą fakturę, zarządzać swoją subskrypcją lub skontaktować się z naszym zespołem obsługi klienta (wszystkie istotne szczegóły Twojego konta są automatycznie dołączane do konwersacji). Na głównym pulpicie znajduje się również wyraźne ostrzeżenie o nieaktywnej subskrypcji wraz z przyciskiem otwierającym to okno modalne.

Inne ulepszenia i poprawki

  • Rozwiązano problem zgodności powodujący, że niektóre stare projekty nie mogły się generować.
  • Dodano przyciski „Prześlij” i „Zmień” w panelu bocznym po prawej stronie dla grup zasobów
  • Jako tymczasowe rozwiązanie zapobiegające przypadkowym regeneracjom ekranów tytułowych do materiałów stockowych, skrót klawiaturowy „R” został wyłączony na najwyższej warstwie.
  • Udoskonalono interfejs użytkownika i dodano przykłady wysokiej jakości wyników generowanych przez narzędzia AI.

Udostępnianie projektu

Możesz teraz udostępnić kopię swojego projektu członkom zespołu. Kliknij „Udostępnij” w prawym górnym rogu edytora projektu, wybierz „Udostępnij kopię”, a następnie wpisz listę adresów e-mail oddzielonych przecinkami, z którymi chcesz podzielić się projektem. Każdy odbiorca otrzyma pełną kopię projektu w swojej skrzynce odbiorczej i będzie mógł go edytować, generować oraz eksportować z własnego konta. Odbiorcy, którzy nie są jeszcze członkami zespołu, zostaną do niego dodani po przyjęciu zaproszenia.

Narzędzie "Generuj klip wideo"

Wprowadziliśmy nowe narzędzie „Generuj klip wideo”, które w pełni syntetyzuje 8-sekundowe wideo na podstawie promptu, korzystając z najnowszego modelu Veo 3 firmy Google. Generowanie może potrwać kilka minut, a najlepsze wyniki osiąga się dla dobrze skonstruowanych promptów z określonym tematem, akcją i miejscem. Narzędzie to jest obecnie dostępne wyłącznie dla subskrybentów Business.

Inne ulepszenia i poprawki

  • Zmieniono sposób rozliczania zespołów — opłata proporcjonalna jest pobierana natychmiast po dodaniu nowego członka.
  • Rozszerzono bibliotekę głosów o większą różnorodność akcentów regionalnych i dialektów.
  • Dodano okno „Utwórz publiczny link do wyświetlenia”, umożliwiające eksport oraz upublicznienie linku jednym kliknięciem.
  • Jeśli link do widoku zostanie upubliczniony podczas oczekiwania na eksport, obraz podglądu Open Graph jest teraz aktualizowany, by odpowiadał wyeksportowanemu wideo po zakończeniu eksportu.
  • Zakończono migrację przestrzeni osobistych do zespołów, rozwiązując liczne problemy ze zgodnością.
  • Poprawiono szybkość ładowania strony głównej dzięki progresywnemu ładowaniu zasobów.
  • Włączono domyślnie filtr treści dla wszystkich nowych użytkowników, aby zapobiegać generowaniu nieodpowiednich obrazów.
  • Usunięto znak wodny „AI” z generowanych filmów z awatarem.
  • Dodano przycisk awatara obok przycisku głosu w edytorze skryptu, aby zwiększyć widoczność funkcji generowania awatarów.
  • Kliknięcie poza modalem nie zamyka już pod spodem wysuniętych okienek.

Przestrzenie robocze osobiste to teraz zespoły

Zaproś członków zespołu

Przekształciliśmy wszystkie przestrzenie robocze na zespoły jednoosobowe, dzięki czemu jeszcze łatwiej tworzyć filmy wraz z członkami zespołu. Aby zaprosić współpracowników, po prostu kliknij „Zaproś członków zespołu” w prawym górnym rogu panelu głównego i wpisz ich adresy e-mail. Aby zobaczyć listę członków zespołu i zmodyfikować ich uprawnienia, odwiedź stronę Zespołów.

Inne ulepszenia i poprawki

  • Rozszerzono bibliotekę muzyczną o znacznie więcej utworów w różnych gatunkach.
  • Dodano więcej kontroli, aby upewnić się, że dodania i usunięcia członków zespołu są zawsze natychmiast odzwierciedlane w liczbie subskrypcji.
  • Rozwiązano problem powodujący nieskończone buforowanie na stronie podglądu eksportu wideo.
  • Usunięto kilka drobnych błędów w przetwarzaniu subskrypcji, przez które opóźniała się aktualizacja danych subskrypcji.

Narzędzia multimedialne

Narzędzia multimedialne

Narzędzia multimedialne to zestaw procesów do tworzenia i generowania zasobów w edytorze projektu. Możesz uzyskać do nich dostęp w prawym panelu bocznym, klikając zasób na osi czasu. Dla pustego zasobu lista dostępnych narzędzi pojawi się bezpośrednio w pasku bocznym. Dla zasobu z zawartością inną niż transkrypcja, kliknij "Zamień", aby zastąpić go wynikiem działania narzędzia multimedialnego.

Obecnie dostępne są następujące narzędzia:

  • Darmowe filmy stockowe
  • Filmy Getty iStock
  • Prześlij multimedia
  • Kolor tła
  • Ekran tytułowy
  • Generowanie obrazu

Wkrótce pojawi się więcej generatywnych narzędzi AI!

Automatyczny dobór muzyki

Wszystkie filmy są teraz generowane z podkładem muzycznym, który uzupełnia treść materiału. Aby to umożliwić, stworzyliśmy agenta muzycznego AI, który inteligentnie analizuje zarys Twojego wideo i automatycznie wybiera idealny utwór z naszej biblioteki muzycznej. Rozszerzyliśmy również tę bibliotekę o wiele więcej utworów obejmujących szeroką gamę gatunków, nastrojów i temp.

Inne ulepszenia i poprawki

  • Wdrążono dodatkowe optymalizacje podglądu wideo w edytorze projektu, jeszcze bardziej minimalizując opóźnienia przy długich filmach.
  • Ulepszono UX przy tworzeniu ekranu tytułowego na osi czasu, zapobiegając przypadkowemu dodawaniu nakładek do projektów.
  • Usunięto problem powodujący krótkie wyświetlanie tekstu angielskiego przed załadowaniem tłumaczeń dla użytkowników nieanglojęzycznych.
  • Dodano modal z limitem użycia, który jasno wskazuje, jak długo trzeba poczekać na reset limitu AI.
  • Naprawiono kilka drobnych problemów ze stylizacją i przesunięciem układu na urządzeniach mobilnych.

Zoptymalizowana oś czasu i podgląd

Przebudowaliśmy naszą oś czasu i podgląd, aby ładowały tylko to, co potrzebne do widocznej części Twojego filmu, co pozwala na płynniejsze odtwarzanie długich materiałów w edytorze projektu. Wcześniej filmy powyżej 10 minut mogły powodować spowolnienia.

Inteligentniejszy agent AI do edycji multimediów

Dodaj multimedia

Gdy dodajesz własne zasoby multimedialne w formularzu generowania filmu, VideoGen umieszcza każdy z tych zasobów tam, gdzie najlepiej pasuje do danego fragmentu lektorskiego. Nasz system został przebudowany z użyciem nowego agenta AI, który rozumie treść każdego zasobu i inteligentnie montuje całą ścieżkę b-roll. Agent dobiera również różne style animacji w zależności od kategoryzacji zasobu (np. zrzut ekranu, ikona, infografika).

Inne ulepszenia i poprawki

  • Naprawiono problem, przez który niektórzy użytkownicy z wieloma wygasłymi subskrypcjami nie widzieli swojej najnowszej subskrypcji.
  • Domyślny styl napisów teraz podświetla aktualnie wypowiadane słowo, czyniąc napisy bardziej angażującymi.
  • Zaktualizowano logikę przycinania, by poprawnie renderować wszystkie przycinarki zasobów w granicach warstwy.
  • Usunięto opóźnienia przy przycinaniu początku i końca zasobów tła.
  • Rozwiązano problem, który powodował niepowodzenie eksportu niektórych filmów z zasobami Getty iStock.
  • Zwiększono chromatyczną różnorodność sekwencyjnych obrazów generatywnych we wygenerowanym filmie.

Awatary

Edytor awatarów

Możesz teraz generować awatara AI na swoim wideo, aby prezentować swój skrypt lektorski z dopasowanym ruchem ust. Wybierz spośród naszej biblioteki ponad 100 realistycznych prezenterów, by uczynić swoje filmy bardziej angażującymi i osobistymi. Awatary są obecnie dostępne wyłącznie dla subskrybentów planów Business i Enterprise.

Aby dodać awatara AI do istniejącej sekcji z głosem AI, kliknij nazwę lektora, następnie przycisk awatara na górze okienka, wybierz swojego ulubionego prezentera awatara, a potem kliknij "generuj". Twój awatar będzie gotowy do podglądu i eksportu w ciągu kilku minut!

Oś czasu z wieloma warstwami

Rozszerzyliśmy oś czasu, aby zawierała wiele warstw, co pozwala na większą elastyczność i personalizację Twoich filmów. Dolna warstwa pokazuje zasoby tła, które możesz przycinać, dzielić, zamieniać i przestawiać. Środkowa warstwa to zasób skryptu, odpowiadający Twojemu głosowi AI i/lub awatarowi. Ostatecznie najwyższa warstwa to nakładka ekranu tytułowego, którą można dostosować w zakładce "Motyw" po lewej stronie. Na osi czasu możesz także kliknąć zasób, aby go zaznaczyć i zobaczyć bardziej zaawansowane możliwości edytowania po prawej stronie.

Inne ulepszenia i poprawki

  • Wdrożono różne poprawki dla zespołów, umożliwiając płynne przechodzenie między subskrypcjami osobistymi i zespołowymi.
  • Naprawiono błąd powodujący, że nowo wygenerowane sekcje w edytorze projektu czasami powtarzały już istniejące w filmie zasoby tła.
  • Zoptymalizowano eksport nakładek tekstowych, znacznie przyspieszając ten proces, zwłaszcza w przypadku długich filmów.