Подкана за редактиране на изображение в chatgpt за стилизиране на снимка като рисунка на ghibli в студио

Разберете как ChatGPT създава изображения в стила на Studio Ghibli

Аватар на Фелипе Фаустино
След голяма актуализация на ChatGPT, функционалността вече позволява генерирането на по-разширени изображения. Вижте как работи

Сред бомбаста тенденция на снимките в аниме стил, може би сте се чудили: как ChatGPT прави изображения в стила на Студио Гибли? Преди не можеше? Е... оказва се, че новата възможност за генериране на изображения на OpenAI Това е наистина ново и има всичко общо с голяма промяна в начина, по който работи моделът на изкуствения интелект на компанията. Разберете в този текст как ChatGPT успя да възпроизведе изкуството на Студио Гибли и основните разлики в сравнение с други модели.

Как ChatGPT създава изображения в стил Ghibli?

За да разберете как ChatGPT започнаха да могат да генерират изображения като тези, създадени в тенденция do Студио Гибли, е необходимо да се знаят основните промени, предизвикани от OpenAI в модела GPT-4o, прочетете по-долу.

Какво се промени в модела GPT-4o?

Човек с компютър, използващ chatgpt за генериране на изображения
Изображение: Репродукция/OpenAI

Генерирането на изображения в GPT-4o се основава на архитектурата Трансформатор, който анализира модели и свързва текстови описания с визуални елементи. За разлика от „дифузионните модели“, които започват с произволно изображение и постепенно го прецизират, GPT-4o възприема авторегресивен метод, изграждайки изображението в последователни стъпки, което подобрява визуалната кохерентност и прецизност към желания стил.

Тъй като точността и изобразяването на текста в изображенията се подобряват и способността за разбиране и следване на подробни подкани се подобрява, ChatGPT увеличи капацитета си да управлява броя на отделните обекти в една сцена (до 20, в сравнение с преди между 5 и 8 обекта) и може да поддържа правилните връзки между тях.

В сравнение с предишни модели като DALL-E3, който използва тръбопроводи (набор от стъпки или процеси), отделни за различни видове медии, GPT-4o възприема унифициран подход, позволяващ по-бързи отговори и изображения, които са по-съвместими с текстовите команди, елиминирайки необходимостта от множество междинни процеси. Това означава, че моделът може по-добре да интерпретира нюансите на подканите, предоставени от потребителите, като гарантира, че визуалният изход е по-съобразен с първоначалното намерение.

Цялата тази мощ идва с противоречив проблем: с по-голямото търсене на графична обработка поради експлозията на модата в интернет, OpenAI необходимо за ограничаване на използваемостта на инструмента за няколко дни, особено за безплатни потребители на ChatGPT, тъй като техните Графичните процесори се „топят“, според главния изпълнителен директор на компанията, Сам Алтман. Въпреки неудобството, генерирането на разширени изображения вече е пуснато от компанията за потребителите на безплатния план, както беше обявено от изпълнителния директор.

Как актуализацията позволява изображения в стил Ghibli?

Двама мъже и куче, отляво, отдясно една и съща снимка, трансформирана в стил аниме
Изображение: Личен архив/Бруно Мартинес

Но какво означава всичко това за способността на AI да улавя естетиката на Студио Гибли? Оказва се, че с новата актуализация, GPT-4o То започва да разбира по-добре стиловите модели от масивни примери за изображения и се научава да възпроизвежда тези характеристики въз основа на команди, предоставени от потребителя.

въпреки че OpenAI не посочва изрично дали техният набор от данни за обучение включва конкретни произведения на изкуството Студио ГиблиКато Във Виагем де Чихиро ou Момчето и жеравът – пресичане на празнина, която разграничава възпроизвеждането на студийни стилове от тези на живи художници – умението на модела да възпроизвежда студийната естетика силно подсказва, че той е бил изложен на голям брой примери от филми и свързани стилове.

Чрез тази изложба, GPT-4o научете основните визуални характеристики, които определят стила на Студио Гибли, включително: усещането за ръчно рисувана анимация, често напомняща за традиционната хартиена анимация; фонове, които предизвикват усещане за чудо и спокойствие; изразителни герои, обикновено с големи, емоционални очи; мека, естествена цветова палитра, доминирана от пастелни, меки тонове; детайлни среди, които често смесват фантастични елементи с реализъм

В допълнение, GPT-4o Той може също да обработва изображения като вход, позволявайки на потребителите да трансформират съществуващи визуални елементи или да ги използват като основа за генериране на ново съдържание. По този начин, освен че не се налага да казват всички подробности за артистичния стил, който искат да възпроизведат, потребителите също не трябва да описват себе си или снимката, която искат да пресъздадат, просто вмъкват снимка в чата и искат от AI да я възпроизведе със стила на анимация – както можете да видите в нашата статия за Как да направите снимки в стил Ghibli с ChatGPT, със съвети и подсказки.

Могат ли други AI да възпроизведат стила на Studio Ghibli?

Създайте нови изображения, като използвате chatbots не е скорошна новост, но капацитетът, постигнат чрез актуализиране на ChatGPT при анализирането и възпроизвеждането на детайлите, предложени от подканата, те заместват AI OpenAI пред основните си конкуренти, като напр Близнациг. Google, ГрокЗащото XAi e втори пилотЗащото Microsoft, по отношение на генерирането на изображение.

Вижте разликата между едно и също изображение, трансформирано в рисунка с линия, вдъхновена от Студио Гибли следвайки същата подкана:

Crie uma imagem, inspirada nessa foto, com base no estilo do Studio Ghibli
Снимка на мъж в естествена среда, облечен в тъмносиня риза - разберете как chatgpt прави изображения в стила на студио ghibli
Разликата между крайното качество е ясна, особено при генериране на букви и символи – Изображение: Личен архив/Фелипе Фаустино

В допълнение към по-доброто улавяне на детайлите на оригиналното изображение, един от най-големите постижения в генеративните изображения GPT-4o Това си личи по възможността за възпроизвеждане на логото и буквите върху ризата, което е много трудно при други модели.

Докато Грок успява по някакъв начин да пресъздаде характеристиките на стила на Студио Гибли, въпреки че страда от детайлността на изображението, Близнаци върви напълно срещу зърното, което води до общо изкуство. Струва си да припомним, че Google вече инвестира в актуализация на генериращите изображения на Близнаци, позволяващи създаване на сложни изображения и редактиране на снимки – инструменти, които може да се тества чрез AI Studio. В втори пилотЗащото Microsoft, не успя да отговори на подканата.

Тествахте ли вече инструмента за влизане в Тенденция на Studio Ghibli? Разкажете ни в коментарите.

Вижте също

Текстът е преработен от Александър Маркес на 01г.

Източници: Таймс ъф Индия, Хиндустан времена, Икономически времена


Открийте повече за Showmetech

Регистрирайте се, за да получавате най-новите ни новини по имейл.

Свързани публикации
Президентът на Samsung разкрива какво търсят потребителите в премиум телевизорите.

Президентът на Samsung разкрива какво търсят потребителите в премиум телевизорите.

Главният изпълнителен директор на Samsung за Латинска Америка обяснява как надеждността, изкуственият интелект и потребителското изживяване са се превърнали в основните диференциращи фактори на пазара на телевизори.
Аватар на Александър Маркес
Прочетете още
Google за Бразилия 2026: Вижте основните новини от събитието. По време на събитието компанията говори за Gemini в Chrome, Ask Google Maps, AI асистент за предприемачи, водене на бележки със SEBRAE, практически тестове ENEM, споразумения с CBF и дори за здраве. Вижте основните съобщения.

Google за Бразилия 2026: вижте основните новини от събитието

По време на събитието компанията обсъди Gemini в Chrome, Ask Google Maps, асистент с изкуствен интелект за предприемачи, водене на бележки със SEBRAE, практически тестове на ENEM, споразумения с CBF (Бразилската футболна конфедерация) и дори здравеопазване. Вижте основните съобщения.
аватар на Виктор Пачеко
Прочетете още
Официално миниатюрно изображение за тийзъра на „Социалната равносметка“, включващо три портрета един до друг с подчертано заглавие на филма.

„Социалната мрежа 2“ получава тийзър и премиерата му в кината е на 9 октомври.

„Социалната разплата“, нов филм, свързан със „Социалната мрежа“, получава официален тийзър от Sony и премиерата му е ексклузивна в кината на 9 октомври.
аватар на Бруно Мартинес
Прочетете още