A Sg.hu hírei szerint a Midjourney bemutatta első videógeneráló modelljét, a V1-et.


A Midjourney, a legismertebb mesterséges intelligencián alapuló képgeneráló startup, végre bejelentette a sokak által várt új videógeneráló modelljének, a V1-nek a debütálását.

A V1 egy kép-videó modell, amelyben a felhasználók feltölthetnek egy képet - vagy felhasználhatnak egy másik Midjourney-modell által generált képet -, és a V1 ennek alapján négy darab öt másodperces videót készít. A Midjourney képgeneráló modelljeihez hasonlóan a V1 is csak a Discordon keresztül utasítható, és a bevezetéskor csak a weben lesz elérhető.

A V1 bevezetésével a Midjourney belép a versenybe, amelyet más cégek mesterséges intelligenciával működő videógeneráló modelljei, mint például az OpenAI Sora, a Runway Gen 4, az Adobe Firefly és a Google Veo 3, uralnak. Míg sok vállalat a kereskedelmi célú, vezérelhető MI videómodellek fejlesztésére összpontosít, a Midjourney mindig is kiemelkedett a kreatív szakembereknek szóló, egyedi MI képmodellek terén. A cég célja, hogy az MI videomodellje ne csupán előzeteseket készítsen hollywoodi filmekhez vagy reklámokhoz. David Holz, a Midjourney vezérigazgatója a blogjában megemlíti, hogy a videomodelljük a vállalat következő lépése a végső cél felé, amely "valós idejű, nyílt világú szimulációk létrehozására képes" mesterséges intelligencia modellek fejlesztése. Az MI-videomodell után a Midjourney tervezi, hogy 3D-s rendereléseket előállító modellek és valós idejű MI megoldások kidolgozásába is belefog.

A Midjourney V1 modelljének bevezetése alig egy héttel azután történt, hogy a startupot beperelte Hollywood két legjelentősebb filmstúdiója, a Disney és az Universal. A perben azt állítják, hogy a Midjourney MI-képmodellei által létrehozott képek a stúdió szerzői joggal védett karaktereit ábrázolják, például Homer Simpsont és Darth Vadert. A hollywoodi stúdiók nehezen tudnak szembenézni az MI kép- és videógeneráló modellek, például a Midjourney által fejlesztettek növekvő népszerűségével. Egyre nagyobb a félelem, hogy ezek az MI eszközök helyettesíthetik vagy leértékelhetik a kreatív szakemberek munkáját a saját területükön, és több médiavállalat is azt állítja, hogy ezeket a termékeket a szerzői jogokkal védett műveiken képezték ki. Bár a Midjourney megpróbálta magát más MI kép- és videó-startupoktól eltérőként bemutatni - inkább a kreativitásra, mint az azonnali kereskedelmi alkalmazásokra összpontosítva -, a startup nem tudja elkerülni ezeket a vádakat.

A Midjourney új videógenerálási szolgáltatása jelentős költséggel jár: a hagyományos képgenerálás árához képest nyolcszoros díjat számítanak fel, ami azt jelenti, hogy az előfizetők havi kerete sokkal gyorsabban kimerül, ha videókat készítenek, mint ha csupán képeket generálnának. A V1 verzió bevezetése során a legköltséghatékonyabb megoldás a Midjourney havi 10 dolláros Basic csomagjára való előfizetés. A prémium szolgáltatások iránt érdeklődők számára a havi 60 dolláros Pro csomag és a havi 120 dolláros Mega csomag korlátlan videógenerálási lehetőséget kínál, a vállalat "Relax" módjában, amely lassabb, de folyamatos hozzáférést biztosít. A következő hónapban a Midjourney bejelentette, hogy újraértékeli a videóminták áraival kapcsolatos stratégiáját.

A V1 néhány egyéni beállítással is rendelkezik, amelyek lehetővé teszik a felhasználók számára a videomodell kimeneteinek vezérlését. A felhasználók kiválaszthatnak egy automatikus animációs beállítást, amely véletlenszerűen mozgatja a képet, vagy kiválaszthatnak egy manuális beállítást, amely lehetővé teszi a felhasználók számára, hogy szövegben leírják a videóhoz hozzáadni kívánt konkrét animációt. A felhasználók a beállításokban a "low motion" (alacsony mozgás) vagy a "high motion" (magas mozgás) opciót kiválasztva is beállíthatják a kamera és a téma mozgásának mértékét.

Bár a V1 által készített videók csupán öt másodpercnyi időtartammal rendelkeznek, a felhasználók lehetőséget kapnak arra, hogy ezt négy másodperccel, legfeljebb négyszer meghosszabbítsák. Ennek eredményeként a V1-es videók akár 21 másodpercig is terjedhetnek. A Midjourney mesterséges intelligencia képmodelljeihez hasonlóan a V1 videóinak kezdeti bemutatói inkább egy másvilági élményt nyújtanak, mintsem hiperreálisak lennének. A V1-re érkezett első visszajelzések kedvezőek, ám egyelőre kérdéses, hogy mennyire tudja felvenni a versenyt más, már hónapok vagy akár évek óta a piacon lévő vezető mesterséges intelligencia videómodellekkel.

Related posts