
Leonardo и качели Эффи Брист
Продолжаю свой рассказ о моей работе с ИИ. Я уже писала о Леонардо (Leonardo.ai), который продолжает мне нравиться. Правда, я намучилась с картинкой к статье о романе Фонтане «Эффи Брист». Там нужно было изобразить девушку, качающуюся на качелях. Это важный символ, показывающий характер героини и ее молодость. Выходя по настоянию родителей замуж за человека, который старше ее практически в два раза и стремится прежде всего к успеху в карьере, обращая мало внимания на желания и потребности жены, она становится несчастной. Леонардо с упорством маньяка делал картинки, не подходящие к моей задаче: то слишком короткое платье девушки, хотя я указывала на то, что речь идет о сюжете XIX века, то девочки разного возраста, явно не подходящие на роль невесты. Только потом я поняла, что в Гугле в моем промпте девушка переводилась как girl, что значит и девочка, и девушка, а требовалось английское young woman или надо было указывать возраст, например, 17 лет. К тому же на одной из картинок девушки на качелях можно обнаружить, что нога у нее находится между досками сидения.
Nano Banana: от трёх ног до идеального прыжка
Вообще-то я всегда знала, что нейросеть Леонардо работает на основе на основе Stable Diffusion. Однако недавно я обнаружила, что ряд картинок делается теперь в нейросети Nano Banana. Поначалу картинки были просто дикие. Мне нужна была картинка с парнем, прыгающим в воду. На одной он был изображен с тремя ногами, на другой с четырьмя руками. Ещё на одной картинке мы видим, что он пытается упасть со странно растопыренными руками прямо на доску, с которой прыгал. С тех пор эта нейросеть совершенствовалась и сегодня она меня тоже вполне устраивает.
Преимуществом Леонардо для меня является возможность бесплатной работы. Правда, сначала нужно зарегистрироваться. После этого становятся доступны основные функции нейросети, хотя, конечно, существуют ограничения. Как пользователь Вы получаете небольшой личный счет в 150 токенов. Счет пополняется ежедневно.
Kandinsky и цветочки
Моя погоня за бесплатной генерацией картинок привела меня в нейросеть Кандинский (Kandinsky), которая была создана Сбербанком. Я начала пользоваться 3.0. Утверждалось, что в нее было загружено много специфической информации, связанной с российской культурой. Поначалу проблем было много. Кое-что эта нейросеть не генерировала вообще, отделываясь от меня изображением цветочков и объявляя, что нарисовать это не может. Была там и функция видео, довольно сложная и неуклюжая. Я попробовала и решила, что заморачиваться не буду. Позже мне все же удалось добиться более или менее сносного результата, по крайней мере в функции text-to-image.
GigaChat учится рисовать
ГигаЧатом я начала пользоваться позже, тексты мне были не особенно нужны. Зато когда в этой нейросети появилась функция создания картинок и они стали нормально скачиваться на ноутбук, я оживилась. Правда, здесь тоже не обходилось без потерь. Впрочем, о ГигаЧате стоит написать позже более подробно.
ruDALL-E: русская DALL-E в деле
А пока я хочу коснуться проекта того же Сбербанка rudalle.ru. Насколько я поняла, эта нейросеть сопрягается с Кандинский 3.1. Почему rudalle? Честно говоря, я долго об этом не подозревала, даже когда начала пользоваться этой нейросетью. В сущности, это ruDALL-E, то есть русская версия знаменитой DALL-E, которой я пользовалась в GPT OpenAI, пользовалась до тех пор, пока не пришлось сменить компьютер. Добраться до GPT OpenAI удавалось после этого лишь с большим трудом, и я решила не заморачиваться, а использовать то, что было под рукой.
Короткий промпт, русский язык и стили великих художников
Это тоже нейронная сеть, которая работает по принципу text-to-image, то есть, генерируя изображения на основе текстового описания. На мой взгляд, достоинством этой нейросети является, во-первых, то, что не нужно писать длинный промпт. Можно изложить по-русски идею, которая дальше интерпретируется ИИ. Впрочем, как я поняла, это же делает и Леонардо, правда, в отличие от rudalle, запрос дается там по-английски. В целом нейросеть «думает» дольше, чем Леонардо, но картинки получаются неплохие. На их основе можно проводить дальнейшее редактирование. Вторым достоинством этой нейросети является наличие шаблонов, которые помогают создать изображение в стиле Айвазовского, Пикассо, карандашных рисунков и т.д. Я не очень часто прибегала к этой нейросети. Ею также можно пользоваться бесплатно. В последнее время эта нейросеть очень изменилась, поэтому имеет смысл потренироваться с ней. Я делаю это всегда с большим удовольствием. Представляю Вам результат своих трудов: по одному и тому же промпту я сделала 6 картинок в разных стилях, три из них, которые мне особенно понравились предлагаю посмотреть Вам. Получилась веселая старушка моего возраста.
Картинки Леонардо к «Эффи Брист»:



Три ноги и четыре руки у прыгающего парня в Нано Банана от Леонардо:



Шаблоны rudalle в разных стилях:



