Адрес для входа в РФ: exler.world

Генерация изображений со скоростью ввода текста

07.12.2023 09:15  10527   Комментарии (133)

Я сейчас изучаю возможности Foocus V2 (собственно, для этого я и покупал новую видеокарту)  - это нейросеть, создающая изображения по текстовому описанию (и, возможно, по другим изображениям), базирующаяся на Stable Diffusion XL. Система крайне интересная, однако генерация каждой картинки по не особенно сложному запросу занимает на моем компьютере примерно 25 секунд. Что, с одной стороны, очень недолго, но, с другой, там явно есть возможности для совершенствования процесса.

Так вот, буквально вчера компания Stability.ai, разработчик Stable Diffusion XL, представила новую модель Stable Diffusion XL Turbo, которая может генерировать и изменять изображение прямо в процессе набора текстового запроса.

Вот как это выглядит.

А вот здесь в онлайне вы можете попробовать самостоятельно сгенерировать изображение (на английском) наблюдая за тем, как картинка появляется в реальном времени (внимание: бесплатно дается только пара попыток).

Вот, например, моя попытка.

Ну вот что мне нарисовала Foocus V2 в реалистичной манере по тому же запросу (без уточнений) за 30 шагов.

Тот же запрос у Leonardo.ai.

Примеры изображений, созданных с помощью Stable Diffusion XL Turbo.

Главная инновация SDXL Turbo заключается в способности создавать изображения за один шаг, что значительно меньше, чем 20-50 шагов, которые требовались его предшественнику. Компания Stability приписывает этот скачок в эффективности технике, которую она называет Adversarial Diffusion Distillation (ADD).

Компания Stability подробно описала внутреннюю работу модели в опубликованном во вторник исследовательском документе, посвященном технике ADD.

Изображения SDXL Turbo не столь детализированы, как изображения SDXL, полученные при большем количестве шагов, поэтому его нельзя считать заменой предыдущей модели. Но за счет экономии скорости результаты получаются впечатляющими.

Скорость генерации SDXL Turbo - это то, что называется "реальным временем". Stability AI утверждает, что на Nvidia A100 (мощном GPU с поддержкой искусственного интеллекта) модель может генерировать изображение размером 512×512 за 207 мс, включая кодирование, один шаг шумоподавления и декодирование. Подобная скорость может привести к созданию генеративных видеофильтров ИИ в реальном времени.

Генерация высокоточных изображений за один шаг. Все образцы сгенерированы с помощью диффузионной дистилляции (ADD)

Комментарии 133

вижу в будущем, как папа рассказывает сказку на ночь ребенку, а на тв по его словам сразу генерится видео-сказка в реал режиме ))
08.12.23 15:29
0 0

В плане генерации картинок Midjourney пожалуй будет лучше всех.
DALLE-3 лучше следует подсказке но общее качество пока хромает.
Свежий пример для сравнения privet.fun

У себя на форуме (phpBB движок, с расширением github.com сделал возможность для пользователей генерировать Midjourney / DALLE / Stability.ai был еще Leonardo AI но потом убрал его тк он не пользовался популярностью.

Вот примеры:
- Midjourney privet.fun
- DALLE-2 privet.fun DALLE-3 пока решил не ставить, дорого выходит
- Stability.ai privet.fun

Для Leonardo AI сделал отдельного бота если кому интересно t.me
Он кстати генерит (генерил?) NSFW privet.fun

Что касается именно генерации картинок то тут совершенно не обязательно покупать видоекарту, более того не вижу в этом большого смысла основываясь на своем опыте.
Сам начинал с локальных инсталляции SD но позже перешел к использованию API.

Акаунт для Midjourney стоит $30/m с безлимитным числом генерации в режиме relax, да это будет медленно но можно подцепить через API коих сейцас много (сам использую $10/m useapi.net) и генерить по паре-тройке сотен картинок в день без напряга.

DALLE-3, Leonardo AI и Stability.ai все имеют официальный API
DALLE-3 openai.com
Leonardo AI leonadoai.com
Stability.ai platform.stability.ai

DALLE-3 достаточтно дорого может выйти, Stability.ai самый доступный в плане стоимости, Leonardo AI где-то по середине.
Для Leonardo AI можно создать пару десятков бесплатный акаунтов с 150 кредитами в день каждый и крутить их, хватит за глаза (собственно это и сделано на t.me
07.12.23 18:36
0 0

Спасибо, ценно.
08.12.23 11:59
0 0

И снова новости происходят быстрее чем о них рассказывают.
07.12.23 18:14
0 0

Хм... Денех хочет...
07.12.23 16:55
0 3

Вот, например, моя попытка.
Странно.
в запросе Риоха, а на картинке Хванчкара с коротким горлышком...
07.12.23 16:42
0 1

Есть такое, ИИ по-прежнему в большом долгу.
07.12.23 16:55
0 1

(внимание: бесплатно дается только пара попыток).
вполне хватит, чтобы уложиться в запрос "дизайн купюры сто баксов, как настоящие, чтобы не отличить!"
07.12.23 16:05
0 3

Читал статейку, где один фантаст хвалился тем, что проиллюстрировал книгу целиком изображениями, сгенерированными нейросеткой. Поскольку никто не знает, сколько у фэнтезийных персонажей должно быть на самом деле пальцев на руках, получилось неплохо.
Что интересно, для составлений промтов писатель воспользовался помощью более знакомого с нейросетями друга.
Вангую появление новой профессии: художник-составитель запросов для нейросетей 😄
07.12.23 14:52
0 0

Для ComfiUI сделал схему позволяющую экспериментировать с подбором промта, стилей, моделей, лор и остального.
Для фокуса что то подобное пока в процессе.
Схему для Комфи можно скачать здесь:
openart.ai
Выложил
08.12.23 05:35
0 0

Некоторая структура есть. Чем дальше слово тем больший вес на остальные слова
Т.е. если цвет стоит посередине то скорее всего он будет на тех предметах что стоят перед ним, а если в конце то уже на всех.
Вес слова можно увеличить (скобками:1.5).
В ранних нейросетях (до осени этого года) длинный текст понимается хуже. В Далли3 уже можно применять литературные обороты.
Ну и главный принцип - нейросеть рисует то что ты ей скажешь, а не то что тебе хочется. 😄
Кстати, в Фокусе в кнопках "стиль" так же зашит текст промта в том числе негативный поэтому часто использование родных стилей фокуса перекрыват значение других и не даёт им полноценно работать.
08.12.23 04:11
0 0

Именно. Пока нет, поэтому в запросах бесполезный мусор. Когда немного причешут будет получаться лучше.
07.12.23 22:54
0 1

Я думаю будет несколько иначе. Сначала появится структурированный язык запросов. SAIQL. А потом уже учебники по этому языку.
Насколько я понимаю, там нет структурированного языка запросов, тем более что речь идет о разных нейросетях. Там запросы идут в свободной форме, и чем больше деталей, тем лучше.
07.12.23 22:52
0 0

Я думаю будет несколько иначе. Сначала появится структурированный язык запросов. SAIQL. А потом уже учебники по этому языку.
07.12.23 22:45
0 0

Вангую появление новой профессии: художник-составитель запросов для нейросетей 😄
Насколько я понимаю, такая профессия уже существует. Тем более что там вопрос не только в составлении запроса как такового, но и в использовании при этом соответствующих моделей, стилей и так далее.
07.12.23 15:25
0 1

Забавно все это, но для профессионального применения по прежнему пока не годится.
07.12.23 13:13
1 0

Ёлки есть
Ни одной ёлки не увидел, извините.
08.12.23 08:14
0 0

Не, не пойдет.
Пойдет и еще как.

Это же прошло, и без всяких ИИ
08.12.23 08:11
0 1

В твоём заказе порядок профессионального исполнения должен быть таким
Да, собственно, оно почти так и делается, только никакая нейросеть там нахрен не нужна. Зачем она мне, если у меня и так есть нужный мне исходник с которым я могу работать, полученный от фотографа или художника?
08.12.23 07:49
0 0

Нет заката.
А для этого есть фотошоп.
08.12.23 04:38
0 0

Так он и есть. Христ когда ему понадобилось что бы нейросеть рисовала снегурочек в классическом стиле заказал профессиональную фотосессию и на её базе создал модель корректно рисующую снегурочек а не эльфийских фей.
В твоём заказе порядок профессионального исполнения должен быть таким - в нейросетях создаёшь референсы кадра и согласовывает его с заказчиком, после этого так как заказчику требуется конкретная модель - создаёшь её (через фото сессию или 3D), и уже после генеришь финальные варианты согласовав которые шлифуешь их в ФШ.
Варианта "я сижу на попе и просто жмакаю кнопки" нет и самое главное - не будет. Если хочешь конечно крутой результат а не "и так сойдёт "
08.12.23 04:21
0 1

Да что вы такое говорите! 😂 И почему ни одна холера не хочет платить фотографам и художникам! Ведь есть же интернет, где всё бесплатно!
Так в моих словах не было никакого сарказма.
Это действительно, так и работает - хочешь результат, на бесплатный интернет не надейся.
aag
07.12.23 23:46
0 0

Профессиональному водителю достаточно 15 минут за рулём любого автомобиля, что бы сказать, можно его использовать в качестве такси или надо дорабатывать.
Да, но тут профессиональные водители пытаются пилотировать автожир в условиях лёгкого шквала.
07.12.23 21:58
0 0

Зато руки не оторвут.
Да, это так работает.
Да что вы такое говорите! 😂 И почему ни одна холера не хочет платить фотографам и художникам! Ведь есть же интернет, где всё бесплатно!
07.12.23 21:48
0 0

Сколько лет вы учились пользоваться этим инструментом?
Профессиональному водителю достаточно 15 минут за рулём любого автомобиля, что бы сказать, можно его использовать в качестве такси или надо дорабатывать.
07.12.23 21:43
0 0

Ну как "лучше"... Вы где-нибудь видели такой лес из абсолютно одинаковых клонированных деревьев? На второй фотке есть закат, но почему-то нет солнца. Ну и если совсем вдаваться в подробности... Катков (асфальтоУКатчиков, а не асфальтоУКЛАДчиков) такой конфигурации не существует в природе. Такая укладка асфальта вызовет истерический припадок смеха у любого дорожника.
07.12.23 21:33
0 0

И вот инструмент пока, как правильно сказал Алекс, "в большом долгу".
Сколько лет вы учились пользоваться этим инструментом?
Сколько лет самостоятельной практики имеете?
Кто ваш учитель?

Это как ругаться на набор акварельных красок в кривых руках.
Но ведь в ровных - и кусок угля выдаст шедевр.
07.12.23 21:29
0 0

Короче - отсутствует волшебная кнопка "Шыдевр бесплатно"
Не надо "шыдевр". Я его сам сделаю. Нужны исходники или инструмент для изготовления этих исходников. И вот инструмент пока, как правильно сказал Алекс, "в большом долгу".
07.12.23 21:20
0 0

Хорошо больно уложили. Не похоже на Россию, в России в лужу укладывают.
Это Сибирская республика.
Трасса Лена.
Межгосударственная.
07.12.23 20:01
1 1

Нет заката.
Ну вот такой закат.
По ТК работали, до 17:00.
07.12.23 19:13
0 0

А какой именно запрос был и на каком языке?
Пока здесь переписывались, нейросетка подслушала и уже все нарисовала
aag
07.12.23 19:01
0 0

Вот в свободном доступе
Нет заката.
aag
07.12.23 19:00
0 0

Возможно нихрена не выйдет и придется отправить фотографа, хотя это стоит чуть дешевле Боинга.
Зато руки не оторвут.
Да, это так работает.
aag
07.12.23 18:59
0 0

"asphalt paver on the road in russian forest during sunset".
Хорошо больно уложили. Не похоже на Россию, в России в лужу укладывают.
07.12.23 17:26
2 1

И что из этих стоков вытянуть можно кроме головной боли? 😄
07.12.23 17:21
0 0

А в фотобанке
Вот в свободном доступе.
Асфальтоукладчик везут на вертолёте.
Асфальт есть, но глубоко.

На объекте работают асфальтобетонный завод французской фирмы ERMONT, асфальтоукладчик и катки немецкой фирмы BOMAG. Транспортировка асфальта осуществляется на современных самосвалах VOLVO c подогревом кузова.
Справа в процессе укладки, слева - после укладки.
Ёлки немного подросли в процессе.
07.12.23 16:57
1 0

Мне нужна иллюстрация: "асфальтоукладчик укладывает асфальт на закате на дороге в лесу в котором растут елки".
А какой именно запрос был и на каком языке?
Тот же Bing (вроде на базе Dall-E) гораздо лучше справился. Запрос "asphalt paver on the road in russian forest during sunset".
07.12.23 16:43
0 5

Короче - отсутствует волшебная кнопка "Шыдевр бесплатно" 😄
Вообще смешно наблюдать как скептики и критики выдвигают две противоположные претензии: "ИИ отнимает кусок хлеба у тружеников потому что теперь каждый школьник одним кликом сделает шедевр" и "ИИ ваще ничего не умеет и нужно сидеть и трудится подбирая промт, модели, тренить Лоры и я ещё должен за это этим людям платить деньги".
Я потратил на эту сцену минут пятнадцать без использования референсов просто взяв в Гугле первый попавший укладчик. Что бы выполнить твой заказ нужно в разы больше работы. И можно будет подобрать и даже "рейскалер" определенной фирмы и модели.
Просто когда хочешь профессионального результата нужен и подход профессиональный а не "я тут два раза кнопки ткнул фигня ваш Моцарт ".

А далее будет ещё более профессиональный подход, будут банки моделей, будет рынок заказов на обучение лор на заказ. Будет ещё много всякого нового и разного.
Это новый мир к которому уже сейчас надо привыкать и уже сейчас надо разобраться как это работает (даже если вы планируете выступать со стороны заказчика).
07.12.23 16:41
0 1

для рекламных проспектиков сгодится.
Тут выдали вопрос ещё в том, можно ли это использовать в этих целях. Я не углублялся в тему, но слышал, что, например, сгенерированный код нельзя. Надо читать EULA.
07.12.23 16:32
0 0

Хотя сейчас обычный смартфон вполне выразительно передает асфальтоукладчики.
Вообще-то в идеале мне нужен ресайклер. Определенной фирмы. На закате. Но есть только асфальтоукладчик. Думал - а вдруг. Но Леонардо такое нарисовал - у меня чуть глаза не выпали. 😄
07.12.23 16:20
0 0

и даже асфальтоукладчик есть.
Очень сильно "почти". 😄 Вот асфальтоукладчик. На самом деле у меня есть нужная картинка, это я все в качестве примера. Мне очень нравится идея сказать кому-то или чему-то что мне нужно и тут же получить это без беготни с фотиком или многочасовым поиском в стоках. Или многочасовым прилаживанием в фотошопе хвоста ужа к морде ежа. Но то, что имеется сейчас не может мне помочь в моей работе. Пока.
07.12.23 16:12
0 0

Как вариант, но у меня нет ни хорошей техники, ни особых профессиональных навыков фотографирования.
На Аламо/shutter stock должно ж быть что-нибудь такое задешево (внизу уже ответил). Мне для лекций про гены как-то была нужна "девчонка с синеньким ожерелье и в красненьком платьице" (так как уже такие цвета в паверпойнте были в схеме) и за 9 долларов получил то, что надо. Без водяных знаков.
07.12.23 15:52
0 1

Как вариант, но у меня нет ни хорошей техники, ни особых профессиональных навыков фотографирования.
Придётся просить специалиста. Хотя сейчас обычный смартфон вполне выразительно передает асфальтоукладчики.
07.12.23 15:49
0 1

drive.google.com
Ёлки есть, асфальт есть, закат есть и даже асфальтоукладчик есть. Ну почти. 😄
Времени особо нет, просто слегка наметил направление куда двигаться.
07.12.23 15:26
0 0

Скорее всего, придётся приподнять задницу и пойти фотографировать реальный асфальтоукладчик в естественной среде обитания, на закате.
Как вариант, но у меня нет ни хорошей техники, ни особых профессиональных навыков фотографирования.
07.12.23 15:12
0 0

А в фотобанке есть готовое фото " асфальтоукладчик укладывает асфальт на закате на дороге в лесу в котором растут елки"?
Скорее всего, придётся приподнять задницу и пойти фотографировать реальный асфальтоукладчик в естественной среде обитания, на закате.
07.12.23 15:01
0 0

А в фотобанке есть готовое фото " асфальтоукладчик укладывает асфальт на закате на дороге в лесу в котором растут елки"?
Без понятия. Скорее всего придется очень долго и уныло искать. Возможно придется собирать картинку руками из нескольких. Возможно придется поступится закатом и елками. Возможно придется просить заказчика самого предоставить такую фотку. Возможно нихрена не выйдет и придется отправить фотографа, хотя это стоит чуть дешевле Боинга.
07.12.23 14:57
0 0

А в фотобанке есть готовое фото " асфальтоукладчик укладывает асфальт на закате на дороге в лесу в котором растут елки"?
07.12.23 14:41
0 0

для рекламных проспектиков мелких стартапов сгодится.
Не, не пойдет.
07.12.23 14:27
0 1

для рекламных проспектиков мелких стартапов сгодится.
Это да, для календариков, иллюстратива художественных книжек, какого-нибудь прикольного мерча, для не очень придирчивого клиента.
07.12.23 14:20
0 2

Это наноасфальт. С подогревом.
07.12.23 14:18
0 0

Почему?
Ну смотрите. Мне нужна иллюстрация: "асфальтоукладчик укладывает асфальт на закате на дороге в лесу в котором растут елки". Вот что выдал мне Клипдроп (первая картинка) и Леонардо (вторая). В первом случае есть елка, закат и асфальт, но асфальтоукладчика вообще нет и лес, прямо скажем, весьма условно обозначен. Акцент иллюстрации почему-то сделан на какой-то выдолб на асфальте, который непонятно зачем. Во втором случае, ура, есть техника, но это вообще ни разу не асфальтоукладчик, у нее серьезные проблемы с задней осью и колесами, (а может с передними, я не могу понять куда этот агрегат едет и вообще что это за агрегат, первый раз вижу такой дикий гибрид погрузчика и катка) и с водителем тоже, он, почему-то в лес смотрит, а не на дорогу. В лесу не наблюдается елок, только сосны. Акцент сделан на какой-то трубе, валяющейся на дороге, причем никакой трубы я совсем не просил. Итого - забавно, но мне все равно потребуется фотограф или фотобанк, потому что если я такое поставлю в публикацию - мне оторвут руки.

З.Ы. Кстати, у Алекса в иллюстрации от Foocus V2 у машины очевидно какие-то проблемы с рулем, он явно не там, где должен быть, и торпеда тоже какая-то очень странная. И котика с подушкой явно насадили на селектор передач.
07.12.23 14:11
0 0

Почему?
07.12.23 13:37
0 0

для профессионального применения по прежнему пока не годится.
для рекламных проспектиков мелких стартапов сгодится.
07.12.23 13:30
0 2

Картинки = котинки.
07.12.23 13:03
0 0

По поводу "скоростной генерации" - нужно понимать что на сегодняшний день эта технология проходит обкатку и особых результатов ждать не стоит. Хотя на её базе уже строят несколько новых вещей типа рисования скетча который нейросеть в режиме реалтайм генерит в полноценную картинку. Но опять таки - всё в стадии тестирования.
Если хочется именно результатов то стоит остановиться на модифицированных моделях SDXL (некоторые так вообще остались на простой SD).
Основной источник этих моделей (чекпоинт) сайт civitai.com
Там же можно и уточняющие модели LORA скачать.
07.12.23 11:57
0 2

По фокусу хорошее видео
07.12.23 11:50
1 2

Спасибо, посмотрю.
07.12.23 11:57
0 0

Посты с коринками привлекают больше внимания чем без? Есть ли смысл вообще спамить ими.
07.12.23 11:39
3 2

Если в любом комментарии кому-то мерещится ущемление его самооценки
А давай ты мне свои бредни не будешь приписывать, ладно? А то вопрос про твою голову становится все более открытым.
07.12.23 15:24
0 0

А зачем ты поставил смайлик в конце?
Чтобы не расстреляли.
07.12.23 14:01
0 3

А зачем ты поставил смайлик в конце? Просто интересно.
07.12.23 13:22
0 1

Это был вопрос про статистику просмотров.

Если в любом комментарии кому-то мерещится ущемление его самооценки, по-моему это вопрос не про мою голову уже 😄
07.12.23 12:32
0 1

Я не говорил что иллюстрация в посте про иллюстрации это спам. Я имел в виду в целом. Как это делает ixbt, где надо и не надо.
Я ставлю те иллюстрации, которые считаю нужным, там, где считаю нужным. Твоего разрешения или одобрения мне при этом не требуется совершенно. Если ты считаешь одну иллюстративную картинку к заметке спамом - отпишись и не читай, и не морочь мне голову.
07.12.23 12:09
0 2

Я не говорил что иллюстрация в посте про иллюстрации это спам. Я имел в виду в целом. Как это делает ixbt, где надо и не надо.
07.12.23 12:03
0 0

Посты с коринками привлекают больше внимания чем без?
С иллюстрацией всегда смотрится лучше, чем без иллюстрации. Что вроде бы совершенно очевидно.

Есть ли смысл вообще спамить ими.
То есть ты называешь спамом иллюстрации в посте, посвященном генерации картинок? Я не буду спрашивать, что у тебя с головой.
07.12.23 11:56
0 4

Да, пост с картинкой всегда более привлекательный и кликабельный.
07.12.23 11:49
0 1

Мечты, мечты...
07.12.23 10:51
0 0

Глаза в разные стороны
Результат тяжёлого инсульта.

Довести напильником.
Табакеркой


подрихтовать.
07.12.23 18:23
0 0

Глаза в разные стороны, множественные манжеты - это разве нормально?
Довести напильником.

Глаза в разные стороны, множественные манжеты - это разве нормально?

Имя файла длинное и с точкой оказалось.
Да, с этим бывают засады.
07.12.23 12:32
0 0

Хотя в превьюшке на сайте показывалось ок.
07.12.23 12:26
0 0

SDXL Turbo'м сгенерил и скачал.

Имя файла длинное и с точкой оказалось. На Андроиде фиг увидишь.

Руками перебил, и...
07.12.23 12:25
0 0

У меня показывает. Что за формат? А то расплодились всякие...
07.12.23 11:53
0 1

07.12.23 11:53
0 0

Картинку грузит, но не показывает почему-то
07.12.23 11:05
0 0

Так скоро и фильмы ИИ будет генерировать на основании собственных сценариев.
07.12.23 10:38
0 1

Так скоро и фильмы ИИ будет генерировать на основании собственных сценариев.
Это будет ещё одна причина не ходить в кино.
07.12.23 15:06
0 1

Слово не воробей, вылетит - сгенерирует.
07.12.23 10:35
0 8

Однажды... в Брянске...
07.12.23 10:04
0 2

Указ
Депутаты Госдумы по требованию Володина проработают определение «травля» и на уровне закона запретят ее в школах.
07.12.23 18:44
0 0

Есть такая история про Лукашенко, когда он только стал президентом.
Пришёл к нему министр финансов, обсуждают проблемы с инфляцией. Лука слушает, кивает головой, а потом говорит:
- А что если я издам указ?
- В смысле?
- Ну, чтобы инфляции не было?
Немая сцена.
Так это анекдот? Там когда Лука назначил на должность преседателя Нацбанка Прокоповича, тот в целях сдерживания курса рубля просто остановил безнал расчеты. Совсем. И это не анекдот.
07.12.23 14:38
0 1

Указ.

Есть такая история про Лукашенко, когда он только стал президентом.
Пришёл к нему министр финансов, обсуждают проблемы с инфляцией. Лука слушает, кивает головой, а потом говорит:
- А что если я издам указ?
- В смысле?
- Ну, чтобы инфляции не было?
Немая сцена.

Так может издать указ об отмене скулшутинга? А то вот Невада и Брянск в один день. Непорядок.
07.12.23 11:54
0 2

Нужно срочно принять закон...
07.12.23 10:29
0 0

leonardo.ai производит гораздо более сильное впечатление. там тоже появилась эта фишка.
07.12.23 09:50
0 0

Есть бот в Телеграме, t.me там нет (почти) ограничений
07.12.23 18:13
0 0

Хорош, но 150 кредитов в день маловато.
Всё-таки Фокус на компе можно кочевряжить бесконечно, пока не надоест.
Но нужна видяха, да.
07.12.23 11:48
0 0

Поизучаю, спасибо.
07.12.23 09:59
0 0

Просил Бинг нарисовать коробку Лего в стиле TIA Portal - ну так вышло.
Причём всё по отдельности он знает, но вместе ерунда.
07.12.23 09:48
0 0

Нейросети всё также понятия не имеют, что такое бадминтон
07.12.23 09:34
1 0

Ранний звоночек прозвенел в 2006-м
Ранний звоночек прозвенел на двести лет раньше.
07.12.23 13:28
0 2

полном включении всех средств безопастности
Первым делом рабочее место должно быть оборудовано ограждением от Рекорда Надоева. Иначе делать бутерброды из вас будет отнюдь не робот. 😄
07.12.23 13:26
0 5

приняв мужчину за ящик с овощами
Мы этого несчастного не видели. А может он действительно похож?
07.12.23 13:10
0 7

а всего на свете не предусмотришь.
На курсах KUKA первым делом вбивают в голову:
любое рабочее место с роботом должно быть оборудовано:

1 ограждение всей зоны доступности роботом с отключением робота если кто-то его разорвал ограждение
2 коврик реагирующй на нажатие отключением робота - если кто-то перелез ограждение не разорвав цепь безопасности и наступил на зону доступную роботу
3 все элементы робота при любом подозрении меняются на заведомо исправные и НИКОГДА не тестируются-проверяются в рабочей зоне иначе как при полном включении всех средств безопастности исключающих наличие человека в зоне доступности роботом.

Догадайтесь сколько из этих требованийнарушил сотрудник "робототехнической компании"...

А да KUKA динозавр роботостроения, не то что всякие шустрые стартапы...
07.12.23 13:04
1 7

07.12.23 12:19
0 0

Да вообще практически ни у кого и ни у чего нет страха смерти.
07.12.23 11:56
2 0

Конечно, вот ваша рука с пятью пальцами!

```
_______
/ \
/ \
| 1 2 |
| \_/ |
| 3 4 |
| \_/ |
| 5 |
| |
| |
-----------
```

Это, конечно, простой текстовый рисунок, но надеюсь, он хотя бы немного поднимет вам настроение! Если у вас еще есть какие-либо вопросы или запросы, я здесь, чтобы помочь!

Находить ся в зоне действия подвижных частей механизма (любой степени "интеллектуальности"), предварительно не обесточив оный механизм? Премию Дарвина этому господину!

у нейросетей нет страха смерти
На этом можно остановиться. То есть ей как два пальца об асфальт дропнуть всех, включая себя самоё, если последовательность логических построений выведет на этот вариант. Я уже дрожу.
07.12.23 11:51
0 2

Запросы надо уточнять
"ракетка должна быть не кривая"?
07.12.23 11:28
0 3

у нейросетей нет страха смерти, гормонов, желаний, поэтому пофиг.
***
8 ноября 2023
В Южной Корее робот насмерть задавил человека, не сумев отличить его от коробки с овощами.
Сотрудник робототехнической компании в возрасте около 40 лет осматривал робота – накануне у него засбоил датчик.
По сообщению южнокорейского информационного агентства Yonhap, роботизированная рука, приняв мужчину за ящик с овощами, схватила его и прижала к конвейерной ленте, раздавив лицо и грудь.
Его доставили в больницу, но спасти не смогли.
***

Несчастный сотрудник тоже думал, что робот железный, и у него нет желаний. Желаний не было, а функция была, и робот ее старался выполнить максимально безупречно. Функции - это как человеческие желания, только продиктованные не слепой биологией, но в остальном такие же.

Ранний звоночек прозвенел в 2006-м, когда прогрессивный японский робот-бармен-сомелье, умеющий по виду и запаху определять продукты и их свежесть, уверенно обозначил руку журналиста как "ветчина" и собрался делать бутерброд, потому что он существует для этого.

Чтоб нейросеть в своем стремлении исполнить запрос не зашла слишком далеко, ей надо бесконечное количество запретов понатыкать, а всего на свете не предусмотришь.
07.12.23 10:49
0 4

у нейросетей нет страха смерти, гормонов, желаний, поэтому пофиг.

будут лучше помогать по запросу, такой себе продвинутый поиск в гугле - и ок
07.12.23 10:35
0 3

На мой взгляд насмешки над нейросетями по поводу того, что они что-то не знают или не так рисуют и т.д. похожи на насмешки над ребенком, что он верит в то, что ветер дует от того что деревья качаются. Сети обучаются, прогресс обучения поражает воображение. Что будет дальше - неизвестно. Сейчас нейросети - это дети. Когда они станут подростками со всеми комплексами переходного периода - тут мы вздрогнем. Запомните этот твит.
07.12.23 10:23
5 18

Тоись в каждом запросе каждый раз нужно уточнять, что у человека на руке пять пальцев? Интеллект!..

Имеют понятие. Я думаю, если конкретизировать, то в точности нарисуют. Но даже вот на такое "Two young girls playing badminton on a green lawn" выдают.
Вот на чем можно изучать эффект зловещей долины, так это на творчестве нейросетей. 😄
07.12.23 09:58
0 1

ИИ же. Запросы надо уточнять - тогда и нарисует то что нужно.

Гыыы!

но это же мячик для пинг-понга!:)
07.12.23 09:46
0 0

Вот уже и сетку нарисовала.

Нейросети всё также понятия не имеют, что такое бадминтон
Имеют понятие. Я думаю, если конкретизировать, то в точности нарисуют. Но даже вот на такое "Two young girls playing badminton on a green lawn" выдают.

И что такое геометрия
07.12.23 09:38
0 0

Я не специалист по нейросетям, но тоже немного баловался со Stable Diffusion. Больше всего смутило, что в основе технологии лежит воспроизводимость результатов. То есть, используя одну и ту же модель, один и тот же запрос и один и тот же сид, вы получаете одно и то же на любом компьютере. Конечно, вариантов по сути бесконечно (за счет бесконечности сидов), но сама предопределенность всех действий нейросети заставляет усомниться в том, что в скором времени появится нейросеть с самосознанием, которая захватит человечество 😄
07.12.23 09:31
2 0

Всё это очень познавательно, но откуда берется изображение?

Это какая-то облигация получилась.
Ося всё ещё лучше рисует.
07.12.23 18:21
0 1

Задать бы сетям запрос "сеятель, разбрасывающий облигации государственного выигрышного займа".
yva
07.12.23 17:37
0 1

и я ещё и торговался вверх, потому что она запросила неприлично мало.
Респект!
07.12.23 17:28
0 1

Иллюстрации нужны были специфические.
В итоге нашёл художницу, которая сделала очень круто и я ещё и торговался вверх, потому что она запросила неприлично мало.
Вообще, как показывает практика, профессионалам часто можно предложить интересную задачу и они согласятся за сниженный прайс, потому что возможность отдохнуть от бесконечных фонов для игр "найди предмет", обложек говнофентези и прочего подобного.
07.12.23 17:01
0 2

Знаете
Задать бы сетям запрос "сеятель, разбрасывающий облигации государственного выигрышного займа".
07.12.23 16:44
0 1

А что просто не купить на аламо каком-нибудь? Профессионалам неохота корячится ради одного gig. Им нужен более-менее постоянныый доход. А так -- только халтурщики.
07.12.23 15:49
0 1

Я однажды для своего проекта захотел серию иллюстраций с кистями рук, кинул объявление на сайт поиска иллюстраторов и начал отсматривать то, что мне присылали как образцы работ. Знаете, не так уж плохо нейросети рисуют руки)))

Не "сознательно", о том и речь. Сеть не имеет представления о правильном и неправильном, только о вероятном. Человек может сделать в какой-то момент вывод: хм, у всех (здоровых) людей по 5 пальцев, нет причин считать это просто совпадением - значит, сочту за универсальное правило.

Нейросеть даже как руку и пальцы этот фрагмент не идентифицирует, для неё это полоска бежевого цвета и несколько кривых полосок поменьше, которые как правило встречаются рядом.

там и таблица не двумерная,
Вспомнился "Газонокосильщик". (когда он перебирал варианты выхода)
07.12.23 13:17
0 1

Мусор на входе нейросети -> Мусор на выходе в квадрате
на входе шестипалые бадминтонистки с кривыми ракетками, и на выходе.
07.12.23 12:19
0 2

А в чём разница, нарисовал это человек в фотошопах или нейросети?
Мусор на входе нейросети -> Мусор на выходе в квадрате

А вообще веселые времена нас ждут.
Один ИИ будет создавать контент в сети в петабайтных количествах, другой этот контент комментировать, лайкать и репостить и нагонять просмотры, третий все это индексировать, анализировать и формировать новые модели для первого ИИ.

Фабрика ботов покажется милым развлечением на этом фоне.
07.12.23 11:59
0 6

Хотите сказать, что вот это вот оно не слепило из двух фрагментов, а "сознательно" попиксельно нарисовало? Да-а, всё еще хуже, чем Мешку думалось...

и Лаплас
07.12.23 11:41
0 1

воспроизводимость результатов.
метрологи оценят.
07.12.23 10:27
0 1

Нот всего 7, а новая музыка не кончается
07.12.23 10:25
0 2

Не-а. Нейросеть не хранит в себе ни одного "кусочка", она именно что генерирует изображение на основании гигантской таблицы весов.

Совсем грубо утрируя: при обучении "показывают" нейросети картинку с описанием, в котором есть слово "бадминтон". В той самой таблице на пересечении строки "бадминтон" и столбца "круглая штука" значение увеличивается с 7,43 до 8,02. И так миллионы раз с разными размеченными картинками.

В итоге при запросе "нарисуй бадминтон" сеть проходит по одноимённой строке, собирает столбцы с максимальными весами и отрисовывает их. Включая круглую штуку.

По факту там и таблица не двумерная, и там будет не просто "круглая штука", а более комплексные сущности, включая взаимное расположение деталей (круглая штука, на уровне руки, соединена с рукой палкой) - но идея именно такая. Не мозаика, а отрисовка в соответствии с очень глубоко параметризованным описанием.

Человек (в общем случае) таки рисует. Нейросеть собирает из ранее нарисованных кусочков. И это видно...

А в чём разница, нарисовал это человек в фотошопах или нейросети?

Из огромного (но все же конечного) количества образцов по одному и тому же запросу можно скомпилировать либо а) великолепный, но повторяющийся результат, либо б) разнообразные, но "так себе" результаты. Третьего не видится...
Интересно другое: что будет, когда в сети накопится достаточное (и постоянно увеличивающееся) количество образцов авторства того же ИИ?

Я не специалист по нейросетям, но тоже немного баловался со Stable Diffusion. Больше всего смутило, что в основе технологии лежит воспроизводимость результатов. То есть, используя одну и ту же модель, один и тот же запрос и один и тот же сид, вы получаете одно и то же на любом компьютере.
Так это, извините, так и задумано. Хочется получать разные результаты - отмечай Random, вот и будут разные результаты 😄
07.12.23 09:34
0 3
Теги
Сортировать по алфавиту или записям
BLM 21
Calella 143
exler.ru 272
авто 441
видео 3990
вино 359
еда 499
ЕС 60
игры 114
ИИ 29
кино 1580
попы 190
СМИ 2755
софт 930
США 131
шоу 6