Це третя стаття в серії. Ви можете знайти першу [тут] і другу [тут].
У цій статті я розповім, як почав створювати ілюстрації за допомогою штучного інтелекту.
Перша спроба створити іллюстрацію з ШІ
Перш за все, не варто боятися терміну “штучний інтелект”. Для використання більшості інструментів ШІ не потрібна спеціальна освіта. Хоча деякі програми вимагають навичок програмування, багато платформ ШІ можуть давати хороші результати без будь-яких знань кодування. Коли я вирішив створювати ілюстрації за допомогою штучного інтелекту, у мене вже був досвід роботи зі штучним інтелектом для створення відео та текстів, тож я мав базове уявлення про те, як він працює. Однак, як і в більшості творчих починань, у створенні зображень були свої труднощі. Крім того, технологія ШІ розвивається так швидко, що те, що працює сьогодні, може застаріти вже завтра.
Початківцям я рекомендую починати з таких інструментів, як Midjourney, який пропонує великий творчий потенціал і зручний, зрозумілий інтерфейс. Саме так я і почав. Пізніше я перейшов на інші платформи, але Midjourney був надійною відправною точкою.
Я був вражений тим, як легко оживають мої вигадані світи. Натхненний цим, я вирішив проілюструвати свою першу англомовну книгу “Українські історії життя та боротьби: Том І” за допомогою штучного інтелекту.
Книга містить п’ять історій, кожна з яких відбувається в різний час і в різних місцях, тому мені потрібен був широкий діапазон стилів і середовищ. Для початку я склав список ілюстрацій і написав прості описи до них. Наприклад:

Робота над першою історією йшла відносно гладко. Мені вдалося отримати 6 чи 7 з 9 запланованих ілюстрацій, трохи розширивши свої описи. Однак мушу зазначити, що на кожне гарне зображення мені довелося відкинути близько 360 поганих. І тут я зіткнувся з першою серйозною проблемою.

Виникають проблеми
Мені потрібно було відтворити обличчя головного героя, хлопчика, на різних ілюстраціях, але я не міг змусити ШІ постійно генерувати одне й те саме обличчя, незалежно від того, наскільки детальними були мої описи. Спочатку я не надто переймався – я планував використати свої навички роботи в Photoshop, щоб виправити обличчя. Але необхідні виправлення були настільки масштабними, що руйнували текстуру зображення, і переробляти їх було складно і неефективно.
Коли мої описи ставали довшими та детальнішими, я зіткнувся з іншою проблемою, яку спочатку вважав радше кумедною, ніж тривожною: ШІ часто неправильно розумів мої слова. Наприклад, коли я описував хутряну шапку, він генерував образ ведмедя. Коли я запросив зимову сцену Львова, то отримав левів на снігу. ШІ також часто неправильно інтерпретував числа. Якщо я просив двох хлопчиків, він видавав трьох. Якщо я просив одну людину, то отримував п’ять. Я спробував інші додатки зі штучним інтелектом, але проблеми були в основному ті ж самі.
Проблему з обличчям хлопчика врешті-решт було вирішено, шляхом генерування більшої кількості зображень і знаходження одного, яке було досить схожим. Однак це не було справжнім рішенням – лише одноразовим виходом із ситуації.

Переді мною постало складне рішення: або змінити стратегію створення зображень, або продовжувати в цьому руслі, сподіваючись знайти рішення по ходу. Я вирішив рухатися далі. Однією з корисних функцій деяких інструментів штучного інтелекту є можливість використовувати вже існуюче зображення як вхідні дані разом з описом. Це дозволяло мені створювати зображення з правильною композицією, а потім допрацьовувати деталі пізніше.
Коли я почав працювати над другою історією, я зіткнувся з іншою серйозною проблемою, яка супроводжувала мене впродовж усього проекту: нездатність АІ генерувати певні предмети навіть за допомогою еталонних зображень. У моєму випадку це були російські військові однострої. Дія першої історії відбувається в грудні 1917 року, і як протагоністи, так і антагоністи носять імперську російську форму без знаків розрізнення. Вони з’являються на більшості ілюстрацій. Але АІ просто не міг точно згенерувати цю форму. Іншою проблемою були військові кораблі – АІ міг генерувати кораблі, але вони часто були фантастичними або повністю абстрактними.

Закінчення першої книги
Мій план полягав у тому, щоб створити всі ілюстрації, які я задумав, а потім подивитися, чи потрібно щось переробити або замінити. Проблема з обличчями була вирішена за допомогою Photoshop шляхом коригування ілюстрацій, а потім використання відредагованих зображень як вхідних ШІ для покращення текстури. Деякі ілюстрації були завершені за допомогою функції заміни облич ШІ, але результати виявилися суперечливими.
Проблема з російською уніформою настільки розчарувала, що майже довела мене до психологічного зриву. Мені довелося переписати список ілюстрацій для цієї історії і перепробувати багато референсних зображень, але без особливого успіху. Зрештою, я вирішив проблему, розмістивши персонажів далеко на задньому плані і сильно покладаючись на фотошоп.

Для ілюстрацій, які штучний інтелект не зміг створити, я використовував фотоколажі та стилізував їх під зображення, згенеровані штучним інтелектом.
Зрештою, за два місяці я створив 52 ілюстрації. Для цього я згенерував загалом 18 600 зображень. Процес був непростим, але я досягнув своєї мети. Робота зі штучним інтелектом часто схожа на взаємодію з працівником, який не до кінця вас розуміє, тому будьте готові перефразувати свої описи або знайти нові способи висловити свої ідеї.
Стратегія для другої книги
Щоб заощадити час і енергію під час роботи над “Українськими історіями життя і боротьби: Том ІІ“, я застосував нову стратегію, аби уникнути проблем, з якими я зіткнувся під час роботи над першою книгою. Складаючи список ілюстрацій, я вирішив не показувати жодного персонажа крупним планом більше одного разу в оповіданні. Структура книги залишилася незмінною – п’ять оповідань, – і я також уникав включення зображень об’єктів або сцен, з якими, як я знав, ШІ не впорається.
Ця стратегія заощадила мені багато часу і значно полегшила процес. Однак виникли нові проблеми, хоча вони були менш серйозними. Одна з них була пов’язана з поведінкою персонажів. Оскільки я уникав крупних планів і детальних пейзажів, мені довелося бути більш точним у своїх описах. Незважаючи на те, що я чітко вказував ШІ не включати певні дії (наприклад, поцілунки), він іноді ігнорував мої вказівки.

Інша проблема була з реквізитом. Навіть коли АІ міг згенерувати необхідні об’єкти, він часто “забував” їх включити. Хоча ці проблеми були не такими складними, як ті, з якими я зіткнувся під час роботи над першим томом, мені все одно довелося згенерувати 14 700 зображень, щоб створити 48 ілюстрацій для другого тому.
Висновок
Створення ілюстрацій за допомогою штучного інтелекту – захопливий, але часто непередбачуваний процес. Інструменти штучного інтелекту пропонують неймовірний творчий потенціал, але вони також мають обмеження, які можуть сповільнити або ускладнити робочий процес. Від непослідовної реплікації облич до неправильного тлумачення ШІ описів і нездатності генерувати специфічні предмети, такі як військова форма, – є проблеми, які вимагають терпіння і вирішення.
Однак, скоригувавши свою стратегію – наприклад, спростивши зовнішність персонажів, уникаючи великих планів і працюючи над відомими слабкостями ШІ, – ви зможете заощадити час і уникнути багатьох розчарувань. Крім того, поєднання зображень, створених штучним інтелектом, з ручними інструментами редагування, такими як Photoshop, може забезпечити рішення для більш складних завдань.
Зрештою, ШІ є потужним помічником у творчому процесі, але він далекий від досконалості. Він вимагає ретельного керівництва, а іноді навіть спроб і помилок, щоб отримати бажані результати. Незважаючи на перешкоди, мені вдалося успішно проілюструвати дві книги за допомогою ШІ, створивши десятки зображень за відносно короткий час. Для авторів та ілюстраторів, які готові прийняти його примхи, ШІ може стати цінним інструментом для візуального втілення історій.
[…] Створення ілюстрацій для вашої книги за допомогою ШІ […]