Адрес для входа в РФ: exler.world

Генерация изображений со скоростью ввода текста

07.12.2023 09:15  10534   Комментарии (133)

Я сейчас изучаю возможности Foocus V2 (собственно, для этого я и покупал новую видеокарту)  - это нейросеть, создающая изображения по текстовому описанию (и, возможно, по другим изображениям), базирующаяся на Stable Diffusion XL. Система крайне интересная, однако генерация каждой картинки по не особенно сложному запросу занимает на моем компьютере примерно 25 секунд. Что, с одной стороны, очень недолго, но, с другой, там явно есть возможности для совершенствования процесса.

Так вот, буквально вчера компания Stability.ai, разработчик Stable Diffusion XL, представила новую модель Stable Diffusion XL Turbo, которая может генерировать и изменять изображение прямо в процессе набора текстового запроса.

Вот как это выглядит.

А вот здесь в онлайне вы можете попробовать самостоятельно сгенерировать изображение (на английском) наблюдая за тем, как картинка появляется в реальном времени (внимание: бесплатно дается только пара попыток).

Вот, например, моя попытка.

Ну вот что мне нарисовала Foocus V2 в реалистичной манере по тому же запросу (без уточнений) за 30 шагов.

Тот же запрос у Leonardo.ai.

Примеры изображений, созданных с помощью Stable Diffusion XL Turbo.

Главная инновация SDXL Turbo заключается в способности создавать изображения за один шаг, что значительно меньше, чем 20-50 шагов, которые требовались его предшественнику. Компания Stability приписывает этот скачок в эффективности технике, которую она называет Adversarial Diffusion Distillation (ADD).

Компания Stability подробно описала внутреннюю работу модели в опубликованном во вторник исследовательском документе, посвященном технике ADD.

Изображения SDXL Turbo не столь детализированы, как изображения SDXL, полученные при большем количестве шагов, поэтому его нельзя считать заменой предыдущей модели. Но за счет экономии скорости результаты получаются впечатляющими.

Скорость генерации SDXL Turbo - это то, что называется "реальным временем". Stability AI утверждает, что на Nvidia A100 (мощном GPU с поддержкой искусственного интеллекта) модель может генерировать изображение размером 512×512 за 207 мс, включая кодирование, один шаг шумоподавления и декодирование. Подобная скорость может привести к созданию генеративных видеофильтров ИИ в реальном времени.

Генерация высокоточных изображений за один шаг. Все образцы сгенерированы с помощью диффузионной дистилляции (ADD)

Комментарии 133

вижу в будущем, как папа рассказывает сказку на ночь ребенку, а на тв по его словам сразу генерится видео-сказка в реал режиме ))
08.12.23 15:29
0 0

В плане генерации картинок Midjourney пожалуй будет лучше всех.
DALLE-3 лучше следует подсказке но общее качество пока хромает.
Свежий пример для сравнения privet.fun

У себя на форуме (phpBB движок, с расширением github.com сделал возможность для пользователей генерировать Midjourney / DALLE / Stability.ai был еще Leonardo AI но потом убрал его тк он не пользовался популярностью.

Вот примеры:
- Midjourney privet.fun
- DALLE-2 privet.fun DALLE-3 пока решил не ставить, дорого выходит
- Stability.ai privet.fun

Для Leonardo AI сделал отдельного бота если кому интересно t.me
Он кстати генерит (генерил?) NSFW privet.fun

Что касается именно генерации картинок то тут совершенно не обязательно покупать видоекарту, более того не вижу в этом большого смысла основываясь на своем опыте.
Сам начинал с локальных инсталляции SD но позже перешел к использованию API.

Акаунт для Midjourney стоит $30/m с безлимитным числом генерации в режиме relax, да это будет медленно но можно подцепить через API коих сейцас много (сам использую $10/m useapi.net) и генерить по паре-тройке сотен картинок в день без напряга.

DALLE-3, Leonardo AI и Stability.ai все имеют официальный API
DALLE-3 openai.com
Leonardo AI leonadoai.com
Stability.ai platform.stability.ai

DALLE-3 достаточтно дорого может выйти, Stability.ai самый доступный в плане стоимости, Leonardo AI где-то по середине.
Для Leonardo AI можно создать пару десятков бесплатный акаунтов с 150 кредитами в день каждый и крутить их, хватит за глаза (собственно это и сделано на t.me
07.12.23 18:36
0 0

Спасибо, ценно.
08.12.23 11:59
0 0

И снова новости происходят быстрее чем о них рассказывают.
07.12.23 18:14
0 0

Хм... Денех хочет...
07.12.23 16:55
0 3

Вот, например, моя попытка.
Странно.
в запросе Риоха, а на картинке Хванчкара с коротким горлышком...
07.12.23 16:42
0 1

Есть такое, ИИ по-прежнему в большом долгу.
07.12.23 16:55
0 1

(внимание: бесплатно дается только пара попыток).
вполне хватит, чтобы уложиться в запрос "дизайн купюры сто баксов, как настоящие, чтобы не отличить!"
07.12.23 16:05
0 3

Читал статейку, где один фантаст хвалился тем, что проиллюстрировал книгу целиком изображениями, сгенерированными нейросеткой. Поскольку никто не знает, сколько у фэнтезийных персонажей должно быть на самом деле пальцев на руках, получилось неплохо.
Что интересно, для составлений промтов писатель воспользовался помощью более знакомого с нейросетями друга.
Вангую появление новой профессии: художник-составитель запросов для нейросетей 😄
07.12.23 14:52
0 0

Вангую появление новой профессии: художник-составитель запросов для нейросетей 😄
Насколько я понимаю, такая профессия уже существует. Тем более что там вопрос не только в составлении запроса как такового, но и в использовании при этом соответствующих моделей, стилей и так далее.
07.12.23 15:25
0 1

Я думаю будет несколько иначе. Сначала появится структурированный язык запросов. SAIQL. А потом уже учебники по этому языку.
07.12.23 22:45
0 0

Я думаю будет несколько иначе. Сначала появится структурированный язык запросов. SAIQL. А потом уже учебники по этому языку.
Насколько я понимаю, там нет структурированного языка запросов, тем более что речь идет о разных нейросетях. Там запросы идут в свободной форме, и чем больше деталей, тем лучше.
07.12.23 22:52
0 0

Именно. Пока нет, поэтому в запросах бесполезный мусор. Когда немного причешут будет получаться лучше.
07.12.23 22:54
0 1

Некоторая структура есть. Чем дальше слово тем больший вес на остальные слова
Т.е. если цвет стоит посередине то скорее всего он будет на тех предметах что стоят перед ним, а если в конце то уже на всех.
Вес слова можно увеличить (скобками:1.5).
В ранних нейросетях (до осени этого года) длинный текст понимается хуже. В Далли3 уже можно применять литературные обороты.
Ну и главный принцип - нейросеть рисует то что ты ей скажешь, а не то что тебе хочется. 😄
Кстати, в Фокусе в кнопках "стиль" так же зашит текст промта в том числе негативный поэтому часто использование родных стилей фокуса перекрыват значение других и не даёт им полноценно работать.
08.12.23 04:11
0 0

Для ComfiUI сделал схему позволяющую экспериментировать с подбором промта, стилей, моделей, лор и остального.
Для фокуса что то подобное пока в процессе.
Схему для Комфи можно скачать здесь:
openart.ai
Выложил
08.12.23 05:35
0 0

Забавно все это, но для профессионального применения по прежнему пока не годится.
07.12.23 13:13
1 0

для профессионального применения по прежнему пока не годится.
для рекламных проспектиков мелких стартапов сгодится.
07.12.23 13:30
0 2

Почему?
07.12.23 13:37
0 0

Почему?
Ну смотрите. Мне нужна иллюстрация: "асфальтоукладчик укладывает асфальт на закате на дороге в лесу в котором растут елки". Вот что выдал мне Клипдроп (первая картинка) и Леонардо (вторая). В первом случае есть елка, закат и асфальт, но асфальтоукладчика вообще нет и лес, прямо скажем, весьма условно обозначен. Акцент иллюстрации почему-то сделан на какой-то выдолб на асфальте, который непонятно зачем. Во втором случае, ура, есть техника, но это вообще ни разу не асфальтоукладчик, у нее серьезные проблемы с задней осью и колесами, (а может с передними, я не могу понять куда этот агрегат едет и вообще что это за агрегат, первый раз вижу такой дикий гибрид погрузчика и катка) и с водителем тоже, он, почему-то в лес смотрит, а не на дорогу. В лесу не наблюдается елок, только сосны. Акцент сделан на какой-то трубе, валяющейся на дороге, причем никакой трубы я совсем не просил. Итого - забавно, но мне все равно потребуется фотограф или фотобанк, потому что если я такое поставлю в публикацию - мне оторвут руки.

З.Ы. Кстати, у Алекса в иллюстрации от Foocus V2 у машины очевидно какие-то проблемы с рулем, он явно не там, где должен быть, и торпеда тоже какая-то очень странная. И котика с подушкой явно насадили на селектор передач.
07.12.23 14:11
0 0

Это наноасфальт. С подогревом.
07.12.23 14:18
0 0

для рекламных проспектиков мелких стартапов сгодится.
Это да, для календариков, иллюстратива художественных книжек, какого-нибудь прикольного мерча, для не очень придирчивого клиента.
07.12.23 14:20
0 2

для рекламных проспектиков мелких стартапов сгодится.
Не, не пойдет.
07.12.23 14:27
0 1

А в фотобанке есть готовое фото " асфальтоукладчик укладывает асфальт на закате на дороге в лесу в котором растут елки"?
07.12.23 14:41
0 0

А в фотобанке есть готовое фото " асфальтоукладчик укладывает асфальт на закате на дороге в лесу в котором растут елки"?
Без понятия. Скорее всего придется очень долго и уныло искать. Возможно придется собирать картинку руками из нескольких. Возможно придется поступится закатом и елками. Возможно придется просить заказчика самого предоставить такую фотку. Возможно нихрена не выйдет и придется отправить фотографа, хотя это стоит чуть дешевле Боинга.
07.12.23 14:57
0 0

А в фотобанке есть готовое фото " асфальтоукладчик укладывает асфальт на закате на дороге в лесу в котором растут елки"?
Скорее всего, придётся приподнять задницу и пойти фотографировать реальный асфальтоукладчик в естественной среде обитания, на закате.
07.12.23 15:01
0 0

Скорее всего, придётся приподнять задницу и пойти фотографировать реальный асфальтоукладчик в естественной среде обитания, на закате.
Как вариант, но у меня нет ни хорошей техники, ни особых профессиональных навыков фотографирования.
07.12.23 15:12
0 0

drive.google.com
Ёлки есть, асфальт есть, закат есть и даже асфальтоукладчик есть. Ну почти. 😄
Времени особо нет, просто слегка наметил направление куда двигаться.
07.12.23 15:26
0 0

Как вариант, но у меня нет ни хорошей техники, ни особых профессиональных навыков фотографирования.
Придётся просить специалиста. Хотя сейчас обычный смартфон вполне выразительно передает асфальтоукладчики.
07.12.23 15:49
0 1

Как вариант, но у меня нет ни хорошей техники, ни особых профессиональных навыков фотографирования.
На Аламо/shutter stock должно ж быть что-нибудь такое задешево (внизу уже ответил). Мне для лекций про гены как-то была нужна "девчонка с синеньким ожерелье и в красненьком платьице" (так как уже такие цвета в паверпойнте были в схеме) и за 9 долларов получил то, что надо. Без водяных знаков.
07.12.23 15:52
0 1

и даже асфальтоукладчик есть.
Очень сильно "почти". 😄 Вот асфальтоукладчик. На самом деле у меня есть нужная картинка, это я все в качестве примера. Мне очень нравится идея сказать кому-то или чему-то что мне нужно и тут же получить это без беготни с фотиком или многочасовым поиском в стоках. Или многочасовым прилаживанием в фотошопе хвоста ужа к морде ежа. Но то, что имеется сейчас не может мне помочь в моей работе. Пока.
07.12.23 16:12
0 0

Хотя сейчас обычный смартфон вполне выразительно передает асфальтоукладчики.
Вообще-то в идеале мне нужен ресайклер. Определенной фирмы. На закате. Но есть только асфальтоукладчик. Думал - а вдруг. Но Леонардо такое нарисовал - у меня чуть глаза не выпали. 😄
07.12.23 16:20
0 0

для рекламных проспектиков сгодится.
Тут выдали вопрос ещё в том, можно ли это использовать в этих целях. Я не углублялся в тему, но слышал, что, например, сгенерированный код нельзя. Надо читать EULA.
07.12.23 16:32
0 0

Короче - отсутствует волшебная кнопка "Шыдевр бесплатно" 😄
Вообще смешно наблюдать как скептики и критики выдвигают две противоположные претензии: "ИИ отнимает кусок хлеба у тружеников потому что теперь каждый школьник одним кликом сделает шедевр" и "ИИ ваще ничего не умеет и нужно сидеть и трудится подбирая промт, модели, тренить Лоры и я ещё должен за это этим людям платить деньги".
Я потратил на эту сцену минут пятнадцать без использования референсов просто взяв в Гугле первый попавший укладчик. Что бы выполнить твой заказ нужно в разы больше работы. И можно будет подобрать и даже "рейскалер" определенной фирмы и модели.
Просто когда хочешь профессионального результата нужен и подход профессиональный а не "я тут два раза кнопки ткнул фигня ваш Моцарт ".

А далее будет ещё более профессиональный подход, будут банки моделей, будет рынок заказов на обучение лор на заказ. Будет ещё много всякого нового и разного.
Это новый мир к которому уже сейчас надо привыкать и уже сейчас надо разобраться как это работает (даже если вы планируете выступать со стороны заказчика).
07.12.23 16:41
0 1

Мне нужна иллюстрация: "асфальтоукладчик укладывает асфальт на закате на дороге в лесу в котором растут елки".
А какой именно запрос был и на каком языке?
Тот же Bing (вроде на базе Dall-E) гораздо лучше справился. Запрос "asphalt paver on the road in russian forest during sunset".
07.12.23 16:43
0 5

А в фотобанке
Вот в свободном доступе.
Асфальтоукладчик везут на вертолёте.
Асфальт есть, но глубоко.

На объекте работают асфальтобетонный завод французской фирмы ERMONT, асфальтоукладчик и катки немецкой фирмы BOMAG. Транспортировка асфальта осуществляется на современных самосвалах VOLVO c подогревом кузова.
Справа в процессе укладки, слева - после укладки.
Ёлки немного подросли в процессе.
07.12.23 16:57
1 0

И что из этих стоков вытянуть можно кроме головной боли? 😄
07.12.23 17:21
0 0

"asphalt paver on the road in russian forest during sunset".
Хорошо больно уложили. Не похоже на Россию, в России в лужу укладывают.
07.12.23 17:26
2 1

Возможно нихрена не выйдет и придется отправить фотографа, хотя это стоит чуть дешевле Боинга.
Зато руки не оторвут.
Да, это так работает.
aag
07.12.23 18:59
0 0

Вот в свободном доступе
Нет заката.
aag
07.12.23 19:00
0 0

А какой именно запрос был и на каком языке?
Пока здесь переписывались, нейросетка подслушала и уже все нарисовала
aag
07.12.23 19:01
0 0

Нет заката.
Ну вот такой закат.
По ТК работали, до 17:00.
07.12.23 19:13
0 0

Хорошо больно уложили. Не похоже на Россию, в России в лужу укладывают.
Это Сибирская республика.
Трасса Лена.
Межгосударственная.
07.12.23 20:01
1 1

Короче - отсутствует волшебная кнопка "Шыдевр бесплатно"
Не надо "шыдевр". Я его сам сделаю. Нужны исходники или инструмент для изготовления этих исходников. И вот инструмент пока, как правильно сказал Алекс, "в большом долгу".
07.12.23 21:20
0 0

И вот инструмент пока, как правильно сказал Алекс, "в большом долгу".
Сколько лет вы учились пользоваться этим инструментом?
Сколько лет самостоятельной практики имеете?
Кто ваш учитель?

Это как ругаться на набор акварельных красок в кривых руках.
Но ведь в ровных - и кусок угля выдаст шедевр.
07.12.23 21:29
0 0

Ну как "лучше"... Вы где-нибудь видели такой лес из абсолютно одинаковых клонированных деревьев? На второй фотке есть закат, но почему-то нет солнца. Ну и если совсем вдаваться в подробности... Катков (асфальтоУКатчиков, а не асфальтоУКЛАДчиков) такой конфигурации не существует в природе. Такая укладка асфальта вызовет истерический припадок смеха у любого дорожника.
07.12.23 21:33
0 0

Сколько лет вы учились пользоваться этим инструментом?
Профессиональному водителю достаточно 15 минут за рулём любого автомобиля, что бы сказать, можно его использовать в качестве такси или надо дорабатывать.
07.12.23 21:43
0 0

Зато руки не оторвут.
Да, это так работает.
Да что вы такое говорите! 😂 И почему ни одна холера не хочет платить фотографам и художникам! Ведь есть же интернет, где всё бесплатно!
07.12.23 21:48
0 0

Профессиональному водителю достаточно 15 минут за рулём любого автомобиля, что бы сказать, можно его использовать в качестве такси или надо дорабатывать.
Да, но тут профессиональные водители пытаются пилотировать автожир в условиях лёгкого шквала.
07.12.23 21:58
0 0

Да что вы такое говорите! 😂 И почему ни одна холера не хочет платить фотографам и художникам! Ведь есть же интернет, где всё бесплатно!
Так в моих словах не было никакого сарказма.
Это действительно, так и работает - хочешь результат, на бесплатный интернет не надейся.
aag
07.12.23 23:46
0 0

Так он и есть. Христ когда ему понадобилось что бы нейросеть рисовала снегурочек в классическом стиле заказал профессиональную фотосессию и на её базе создал модель корректно рисующую снегурочек а не эльфийских фей.
В твоём заказе порядок профессионального исполнения должен быть таким - в нейросетях создаёшь референсы кадра и согласовывает его с заказчиком, после этого так как заказчику требуется конкретная модель - создаёшь её (через фото сессию или 3D), и уже после генеришь финальные варианты согласовав которые шлифуешь их в ФШ.
Варианта "я сижу на попе и просто жмакаю кнопки" нет и самое главное - не будет. Если хочешь конечно крутой результат а не "и так сойдёт "
08.12.23 04:21
0 1

Нет заката.
А для этого есть фотошоп.
08.12.23 04:38
0 0

В твоём заказе порядок профессионального исполнения должен быть таким
Да, собственно, оно почти так и делается, только никакая нейросеть там нахрен не нужна. Зачем она мне, если у меня и так есть нужный мне исходник с которым я могу работать, полученный от фотографа или художника?
08.12.23 07:49
0 0

Не, не пойдет.
Пойдет и еще как.

Это же прошло, и без всяких ИИ
08.12.23 08:11
0 1

Ёлки есть
Ни одной ёлки не увидел, извините.
08.12.23 08:14
0 0

Картинки = котинки.
07.12.23 13:03
0 0

По поводу "скоростной генерации" - нужно понимать что на сегодняшний день эта технология проходит обкатку и особых результатов ждать не стоит. Хотя на её базе уже строят несколько новых вещей типа рисования скетча который нейросеть в режиме реалтайм генерит в полноценную картинку. Но опять таки - всё в стадии тестирования.
Если хочется именно результатов то стоит остановиться на модифицированных моделях SDXL (некоторые так вообще остались на простой SD).
Основной источник этих моделей (чекпоинт) сайт civitai.com
Там же можно и уточняющие модели LORA скачать.
07.12.23 11:57
0 2

По фокусу хорошее видео
07.12.23 11:50
1 2

Спасибо, посмотрю.
07.12.23 11:57
0 0

Посты с коринками привлекают больше внимания чем без? Есть ли смысл вообще спамить ими.
07.12.23 11:39
3 2

Да, пост с картинкой всегда более привлекательный и кликабельный.
07.12.23 11:49
0 1

Посты с коринками привлекают больше внимания чем без?
С иллюстрацией всегда смотрится лучше, чем без иллюстрации. Что вроде бы совершенно очевидно.

Есть ли смысл вообще спамить ими.
То есть ты называешь спамом иллюстрации в посте, посвященном генерации картинок? Я не буду спрашивать, что у тебя с головой.
07.12.23 11:56
0 4

Я не говорил что иллюстрация в посте про иллюстрации это спам. Я имел в виду в целом. Как это делает ixbt, где надо и не надо.
07.12.23 12:03
0 0

Я не говорил что иллюстрация в посте про иллюстрации это спам. Я имел в виду в целом. Как это делает ixbt, где надо и не надо.
Я ставлю те иллюстрации, которые считаю нужным, там, где считаю нужным. Твоего разрешения или одобрения мне при этом не требуется совершенно. Если ты считаешь одну иллюстративную картинку к заметке спамом - отпишись и не читай, и не морочь мне голову.
07.12.23 12:09
0 2

Это был вопрос про статистику просмотров.

Если в любом комментарии кому-то мерещится ущемление его самооценки, по-моему это вопрос не про мою голову уже 😄
07.12.23 12:32
0 1

А зачем ты поставил смайлик в конце? Просто интересно.
07.12.23 13:22
0 1

А зачем ты поставил смайлик в конце?
Чтобы не расстреляли.
07.12.23 14:01
0 3

Если в любом комментарии кому-то мерещится ущемление его самооценки
А давай ты мне свои бредни не будешь приписывать, ладно? А то вопрос про твою голову становится все более открытым.
07.12.23 15:24
0 0

Мечты, мечты...
07.12.23 10:51
0 0

Картинку грузит, но не показывает почему-то
07.12.23 11:05
0 0

07.12.23 11:53
0 0

У меня показывает. Что за формат? А то расплодились всякие...
07.12.23 11:53
0 1

SDXL Turbo'м сгенерил и скачал.

Имя файла длинное и с точкой оказалось. На Андроиде фиг увидишь.

Руками перебил, и...
07.12.23 12:25
0 0

Хотя в превьюшке на сайте показывалось ок.
07.12.23 12:26
0 0

Имя файла длинное и с точкой оказалось.
Да, с этим бывают засады.
07.12.23 12:32
0 0

Глаза в разные стороны, множественные манжеты - это разве нормально?

Глаза в разные стороны, множественные манжеты - это разве нормально?
Довести напильником.

Довести напильником.
Табакеркой


подрихтовать.
07.12.23 18:23
0 0

Глаза в разные стороны
Результат тяжёлого инсульта.

Так скоро и фильмы ИИ будет генерировать на основании собственных сценариев.
07.12.23 10:38
0 1

Так скоро и фильмы ИИ будет генерировать на основании собственных сценариев.
Это будет ещё одна причина не ходить в кино.
07.12.23 15:06
0 1

Слово не воробей, вылетит - сгенерирует.
07.12.23 10:35
0 8

Однажды... в Брянске...
07.12.23 10:04
0 2

Нужно срочно принять закон...
07.12.23 10:29
0 0

Указ.

Есть такая история про Лукашенко, когда он только стал президентом.
Пришёл к нему министр финансов, обсуждают проблемы с инфляцией. Лука слушает, кивает головой, а потом говорит:
- А что если я издам указ?
- В смысле?
- Ну, чтобы инфляции не было?
Немая сцена.

Так может издать указ об отмене скулшутинга? А то вот Невада и Брянск в один день. Непорядок.
07.12.23 11:54
0 2

Есть такая история про Лукашенко, когда он только стал президентом.
Пришёл к нему министр финансов, обсуждают проблемы с инфляцией. Лука слушает, кивает головой, а потом говорит:
- А что если я издам указ?
- В смысле?
- Ну, чтобы инфляции не было?
Немая сцена.
Так это анекдот? Там когда Лука назначил на должность преседателя Нацбанка Прокоповича, тот в целях сдерживания курса рубля просто остановил безнал расчеты. Совсем. И это не анекдот.
07.12.23 14:38
0 1

Указ
Депутаты Госдумы по требованию Володина проработают определение «травля» и на уровне закона запретят ее в школах.
07.12.23 18:44
0 0

leonardo.ai производит гораздо более сильное впечатление. там тоже появилась эта фишка.
07.12.23 09:50
0 0

Поизучаю, спасибо.
07.12.23 09:59
0 0

Хорош, но 150 кредитов в день маловато.
Всё-таки Фокус на компе можно кочевряжить бесконечно, пока не надоест.
Но нужна видяха, да.
07.12.23 11:48
0 0

Есть бот в Телеграме, t.me там нет (почти) ограничений
07.12.23 18:13
0 0

Просил Бинг нарисовать коробку Лего в стиле TIA Portal - ну так вышло.
Причём всё по отдельности он знает, но вместе ерунда.
07.12.23 09:48
0 0

Нейросети всё также понятия не имеют, что такое бадминтон
07.12.23 09:34
1 0

И что такое геометрия
07.12.23 09:38
0 0

Нейросети всё также понятия не имеют, что такое бадминтон
Имеют понятие. Я думаю, если конкретизировать, то в точности нарисуют. Но даже вот на такое "Two young girls playing badminton on a green lawn" выдают.

Вот уже и сетку нарисовала.

но это же мячик для пинг-понга!:)
07.12.23 09:46
0 0

Гыыы!

ИИ же. Запросы надо уточнять - тогда и нарисует то что нужно.

Имеют понятие. Я думаю, если конкретизировать, то в точности нарисуют. Но даже вот на такое "Two young girls playing badminton on a green lawn" выдают.
Вот на чем можно изучать эффект зловещей долины, так это на творчестве нейросетей. 😄
07.12.23 09:58
0 1

Тоись в каждом запросе каждый раз нужно уточнять, что у человека на руке пять пальцев? Интеллект!..

На мой взгляд насмешки над нейросетями по поводу того, что они что-то не знают или не так рисуют и т.д. похожи на насмешки над ребенком, что он верит в то, что ветер дует от того что деревья качаются. Сети обучаются, прогресс обучения поражает воображение. Что будет дальше - неизвестно. Сейчас нейросети - это дети. Когда они станут подростками со всеми комплексами переходного периода - тут мы вздрогнем. Запомните этот твит.
07.12.23 10:23
5 18

у нейросетей нет страха смерти, гормонов, желаний, поэтому пофиг.

будут лучше помогать по запросу, такой себе продвинутый поиск в гугле - и ок
07.12.23 10:35
0 3

у нейросетей нет страха смерти, гормонов, желаний, поэтому пофиг.
***
8 ноября 2023
В Южной Корее робот насмерть задавил человека, не сумев отличить его от коробки с овощами.
Сотрудник робототехнической компании в возрасте около 40 лет осматривал робота – накануне у него засбоил датчик.
По сообщению южнокорейского информационного агентства Yonhap, роботизированная рука, приняв мужчину за ящик с овощами, схватила его и прижала к конвейерной ленте, раздавив лицо и грудь.
Его доставили в больницу, но спасти не смогли.
***

Несчастный сотрудник тоже думал, что робот железный, и у него нет желаний. Желаний не было, а функция была, и робот ее старался выполнить максимально безупречно. Функции - это как человеческие желания, только продиктованные не слепой биологией, но в остальном такие же.

Ранний звоночек прозвенел в 2006-м, когда прогрессивный японский робот-бармен-сомелье, умеющий по виду и запаху определять продукты и их свежесть, уверенно обозначил руку журналиста как "ветчина" и собрался делать бутерброд, потому что он существует для этого.

Чтоб нейросеть в своем стремлении исполнить запрос не зашла слишком далеко, ей надо бесконечное количество запретов понатыкать, а всего на свете не предусмотришь.
07.12.23 10:49
0 4

Запросы надо уточнять
"ракетка должна быть не кривая"?
07.12.23 11:28
0 3

у нейросетей нет страха смерти
На этом можно остановиться. То есть ей как два пальца об асфальт дропнуть всех, включая себя самоё, если последовательность логических построений выведет на этот вариант. Я уже дрожу.
07.12.23 11:51
0 2

Находить ся в зоне действия подвижных частей механизма (любой степени "интеллектуальности"), предварительно не обесточив оный механизм? Премию Дарвина этому господину!

Конечно, вот ваша рука с пятью пальцами!

```
_______
/ \
/ \
| 1 2 |
| \_/ |
| 3 4 |
| \_/ |
| 5 |
| |
| |
-----------
```

Это, конечно, простой текстовый рисунок, но надеюсь, он хотя бы немного поднимет вам настроение! Если у вас еще есть какие-либо вопросы или запросы, я здесь, чтобы помочь!

Да вообще практически ни у кого и ни у чего нет страха смерти.
07.12.23 11:56
2 0

07.12.23 12:19
0 0

а всего на свете не предусмотришь.
На курсах KUKA первым делом вбивают в голову:
любое рабочее место с роботом должно быть оборудовано:

1 ограждение всей зоны доступности роботом с отключением робота если кто-то его разорвал ограждение
2 коврик реагирующй на нажатие отключением робота - если кто-то перелез ограждение не разорвав цепь безопасности и наступил на зону доступную роботу
3 все элементы робота при любом подозрении меняются на заведомо исправные и НИКОГДА не тестируются-проверяются в рабочей зоне иначе как при полном включении всех средств безопастности исключающих наличие человека в зоне доступности роботом.

Догадайтесь сколько из этих требованийнарушил сотрудник "робототехнической компании"...

А да KUKA динозавр роботостроения, не то что всякие шустрые стартапы...
07.12.23 13:04
1 7

приняв мужчину за ящик с овощами
Мы этого несчастного не видели. А может он действительно похож?
07.12.23 13:10
0 7

полном включении всех средств безопастности
Первым делом рабочее место должно быть оборудовано ограждением от Рекорда Надоева. Иначе делать бутерброды из вас будет отнюдь не робот. 😄
07.12.23 13:26
0 5

Ранний звоночек прозвенел в 2006-м
Ранний звоночек прозвенел на двести лет раньше.
07.12.23 13:28
0 2

Я не специалист по нейросетям, но тоже немного баловался со Stable Diffusion. Больше всего смутило, что в основе технологии лежит воспроизводимость результатов. То есть, используя одну и ту же модель, один и тот же запрос и один и тот же сид, вы получаете одно и то же на любом компьютере. Конечно, вариантов по сути бесконечно (за счет бесконечности сидов), но сама предопределенность всех действий нейросети заставляет усомниться в том, что в скором времени появится нейросеть с самосознанием, которая захватит человечество 😄
07.12.23 09:31
2 0

Я не специалист по нейросетям, но тоже немного баловался со Stable Diffusion. Больше всего смутило, что в основе технологии лежит воспроизводимость результатов. То есть, используя одну и ту же модель, один и тот же запрос и один и тот же сид, вы получаете одно и то же на любом компьютере.
Так это, извините, так и задумано. Хочется получать разные результаты - отмечай Random, вот и будут разные результаты 😄
07.12.23 09:34
0 3

Из огромного (но все же конечного) количества образцов по одному и тому же запросу можно скомпилировать либо а) великолепный, но повторяющийся результат, либо б) разнообразные, но "так себе" результаты. Третьего не видится...
Интересно другое: что будет, когда в сети накопится достаточное (и постоянно увеличивающееся) количество образцов авторства того же ИИ?

А в чём разница, нарисовал это человек в фотошопах или нейросети?

Человек (в общем случае) таки рисует. Нейросеть собирает из ранее нарисованных кусочков. И это видно...

Не-а. Нейросеть не хранит в себе ни одного "кусочка", она именно что генерирует изображение на основании гигантской таблицы весов.

Совсем грубо утрируя: при обучении "показывают" нейросети картинку с описанием, в котором есть слово "бадминтон". В той самой таблице на пересечении строки "бадминтон" и столбца "круглая штука" значение увеличивается с 7,43 до 8,02. И так миллионы раз с разными размеченными картинками.

В итоге при запросе "нарисуй бадминтон" сеть проходит по одноимённой строке, собирает столбцы с максимальными весами и отрисовывает их. Включая круглую штуку.

По факту там и таблица не двумерная, и там будет не просто "круглая штука", а более комплексные сущности, включая взаимное расположение деталей (круглая штука, на уровне руки, соединена с рукой палкой) - но идея именно такая. Не мозаика, а отрисовка в соответствии с очень глубоко параметризованным описанием.

Нот всего 7, а новая музыка не кончается
07.12.23 10:25
0 2

воспроизводимость результатов.
метрологи оценят.
07.12.23 10:27
0 1

и Лаплас
07.12.23 11:41
0 1

Хотите сказать, что вот это вот оно не слепило из двух фрагментов, а "сознательно" попиксельно нарисовало? Да-а, всё еще хуже, чем Мешку думалось...

А в чём разница, нарисовал это человек в фотошопах или нейросети?
Мусор на входе нейросети -> Мусор на выходе в квадрате

А вообще веселые времена нас ждут.
Один ИИ будет создавать контент в сети в петабайтных количествах, другой этот контент комментировать, лайкать и репостить и нагонять просмотры, третий все это индексировать, анализировать и формировать новые модели для первого ИИ.

Фабрика ботов покажется милым развлечением на этом фоне.
07.12.23 11:59
0 6

Мусор на входе нейросети -> Мусор на выходе в квадрате
на входе шестипалые бадминтонистки с кривыми ракетками, и на выходе.
07.12.23 12:19
0 2

там и таблица не двумерная,
Вспомнился "Газонокосильщик". (когда он перебирал варианты выхода)
07.12.23 13:17
0 1

Не "сознательно", о том и речь. Сеть не имеет представления о правильном и неправильном, только о вероятном. Человек может сделать в какой-то момент вывод: хм, у всех (здоровых) людей по 5 пальцев, нет причин считать это просто совпадением - значит, сочту за универсальное правило.

Нейросеть даже как руку и пальцы этот фрагмент не идентифицирует, для неё это полоска бежевого цвета и несколько кривых полосок поменьше, которые как правило встречаются рядом.

Я однажды для своего проекта захотел серию иллюстраций с кистями рук, кинул объявление на сайт поиска иллюстраторов и начал отсматривать то, что мне присылали как образцы работ. Знаете, не так уж плохо нейросети рисуют руки)))

А что просто не купить на аламо каком-нибудь? Профессионалам неохота корячится ради одного gig. Им нужен более-менее постоянныый доход. А так -- только халтурщики.
07.12.23 15:49
0 1

Знаете
Задать бы сетям запрос "сеятель, разбрасывающий облигации государственного выигрышного займа".
07.12.23 16:44
0 1

Иллюстрации нужны были специфические.
В итоге нашёл художницу, которая сделала очень круто и я ещё и торговался вверх, потому что она запросила неприлично мало.
Вообще, как показывает практика, профессионалам часто можно предложить интересную задачу и они согласятся за сниженный прайс, потому что возможность отдохнуть от бесконечных фонов для игр "найди предмет", обложек говнофентези и прочего подобного.
07.12.23 17:01
0 2

и я ещё и торговался вверх, потому что она запросила неприлично мало.
Респект!
07.12.23 17:28
0 1

Задать бы сетям запрос "сеятель, разбрасывающий облигации государственного выигрышного займа".
yva
07.12.23 17:37
0 1

Это какая-то облигация получилась.
Ося всё ещё лучше рисует.
07.12.23 18:21
0 1

Всё это очень познавательно, но откуда берется изображение?
Теги
Сортировать по алфавиту или записям
BLM 21
Calella 143
exler.ru 272
авто 441
видео 3992
вино 359
еда 499
ЕС 60
игры 114
ИИ 29
кино 1580
попы 190
СМИ 2757
софт 930
США 131
шоу 6