«А что ты делаешь в этой своей нейросети?» — спросил вчера коллега.
Делаю разное. Зачастую перебор различных ключевых слов — токенов, в сочетании друг с другом, с различными параметрами генераций и условиями, ищу интересные сочетания дающие свет/цвет/какой-то стиль.
Для коммерции же можно в графических нейросетях:
- генерировать логотипы (с доработкой руками);
- генерировать портреты покинувших нас людей (если хоть какой-то исходник есть более-менее качеством), тоже с доработкой;
- увеличивать изображения пытаясь не убить качество (upscale-технологии).
Я на днях с помощью Qwen2.5-Max написал вспомогательное решение для работы с Stable Diffusion. Все везде пишут об успешном успехе с помощью таких инструментов, но лично я потратил часов 5, чтобы довести модуль до какого-то рабочего состояния. Так что это никакая не волшебная палочка. Это инструмент, требующий изучения.
Очередная порция пробников: прокачка персонажа + стиль.








