O Google обяви този вторник (14) най-новия си модел за генериране на видео, Veo, който е част от инструмента VideoFX. Новата функция ще позволи създаването на видеоклипове въз основа на текстови подкани и пристига като конкурент на Сора da OpenAI.
Инструментът беше обявен в предаване на живо по време на Google I / O 2024. Освен че позволява създаването на съдържание, платформата ще позволява взаимодействие с други технологии на компанията, като инструмента за създаване на музика с помощта на AI.
Какво е Veo
По време на разкриването на най-новия изкуствен интелект, разработен от Google за създаване на видео, беше подчертан ключов момент: Veo надхвърля типичната продължителност от една минута, предлагайки резултати в 1080p резолюция и възможност за изследване на различни кинематографични стилове и визуализации.
Според компанията, този AI има напреднали познания както в естествения език, така и в визуалната семантика, което позволява по-точно изобразяване дори с по-дълги и по-подробни команди.
Google твърди, че Veo е в състояние да генерира последователно и сплотено съдържание, в което хора, животни и предмети се движат реалистично във видеоклиповете. Освен това инструментът е способен да разбира специфични термини от кинематографичната вселена, като „timelapse“ и „въздушен запис на пейзаж“, като по този начин осигурява по-голям творчески контрол върху желаните резултати.
Представянето на новия AI беше насочено към група режисьори и творци, които имаха възможност да изпробват модела и да предоставят обратна връзка на компанията, допринасяйки за евентуални бъдещи подобрения.
Google също обяви, че някои функции на Veo ще бъдат постепенно интегрирани в YouTube Shorts и други продукти на компанията, но без да посочва дата за това.
VideoFX
VideoFX е портал, достъпен през самия браузър за използване на Veo, генеративен модел, създаден от компанията, за да се конкурира със Sora, от OpenAI. В момента новостта се предлага в експериментална фаза само в Съединените щати.
Само с подкана за текст, изображение или видео, новите функции ви позволяват да създавате и редактирате видеоклипове с продължителност над 60 секунди в различни визуални стилове, което позволява на потребителя да изследва най-различни идеи.
Според Google инструментът предлага и някои опции за редактиране, като режим Storyboard за работа върху генерираните сцени, в допълнение към включването на музика и звукови ефекти.
Жителите на Съединените щати могат да получат достъп до инструмента чрез a списък на чакащите. В момента няма прогноза за пускане в Бразилия и други страни.
ImageFX
Google също обяви Изображение 3, достъпно в ImageFX от Google Labs. С него е възможно да се създават напълно нови изображения въз основа на текстова подкана, нещо много подобно на това, което виждаме в MidJourney например.
С 3-то поколение Google обещава, че потребителите ще имат изображения, които са еднакво верни на реалността, благодарение на подобренията в качеството и прецизността на генерирането на изображения.
Според гиганта от Mountain View Imagem 3 дори ще може да поставя думи и фрази в изображения, нещо, което все още създава някои проблеми на платформи с подобни предложения.
MusicFX
Google също обяви още един генеративен AI инструмент за създаване на музика, MusicFX с AI Sandbox. Новата функция, която пристига в партньорство с YouTube, ще се конкурира директно с компании като Moises.ai, която използва AI за разделяне на песни от една и съща песен.
"Тези инструменти са предназначени да отворят нова площадка за творчество, позволявайки на хората да създават нови инструментални секции от нулата, да трансформират звука по нови начини и много повече.“, заяви Google по време на презентацията.
LearnLM
И накрая, Google разкри новото си семейство от генеративни AI модели, настроени за обучение. LearnLM е предназначен да насочва учениците по „разговорен“ начин в различни предмети.
"LearnLM се основава на образователни изследвания, което прави учебния опит по-личен и ангажиращ”, обясни Джеймс Маника, старши вицепрезидент по изследвания, технологии и общество в Google Research, на Google I/O във вторник.
Понастоящем LearnLM се захранва от функции в продуктите на Google, включително YouTube, приложенията Gemini на Google, Google Търсене и Google Classroom.
В приложенията на Gemini, например, през следващите месеци ще бъде възможно да се създават персонализирани чатботове, които могат да действат като експерти по различни теми. Чатботовете ще предоставят насоки за обучение и практически дейности, като викторини и игри, зачитайки индивидуалните предпочитания на всеки ученик.
Вижте също:
Google показва Astra, съперник на GPT-4, който вижда реалния свят през камерата на мобилния телефон.
източник: Google.
Открийте повече за Showmetech
Регистрирайте се, за да получавате най-новите ни новини по имейл.