Адрес для входа в РФ: exler.world
VASA-1 - новая модель ИИ
Компания Microsoft представила модель искусственного интеллекта VASA-1, предназначенную для генерирования реалистичных видео персонажей, произносящих заданный текст, по одной фотографии и аудиоклипу с речью. VASA-1, способна не только воспроизводить движения губ, синхронизированные со звуком, но и улавливать широкий спектр нюансов лица и естественных движений головы, которые способствуют реалистичному восприятию.
Пишут, что эта модель поддерживает онлайн-генерацию видео 512x512 с частотой до 40 кадров в секунду с незначительной задержкой.
Для чего это может применяться? Ну, например, для создания реалистичных аватаров, которые имитируют человеческий разговор.
На странице проекта выложено множество примеров работы VASA-1, вот один из них.
Ну и вот ролик, который показывает, как работает эта технология в реальном времени.
С губными согласными всё очень плохо. Это я про второй ролик. В первом норм.
Ну чо, подтянут, подчистят. Всё хорошо будет.
Короче говоря, полностью теряется доверие к любому собеседнику, кроме того, которого можно пощупать.
А галочкой и заикание добавлять.
/ АБС, "ТББ"
Одни изобретают. Другие превращают это в дерьмо.
Ещё немного это доработают, и нельзя будет верить вообще ничему. Ещё больше информации превратится в фэйк. Все вокруг сплошной фэйк. Матрица.
ИИ, грят? ИИ. Для реализму? Молодцы, сейчас пропагандисты и лжецы это используют на миллион процентов, дураков оболванивать.
А это будет для умных дураков, таких, как американские студенты.
Видео с преступлениями Хамас? Это все фейк с использованием ИИ. Работа Моссад и ЦРУ. А Рафик неувиноватый. Фри Палестайн!
А то похоже что вся эта ИИ-подмена реальности больше во вред, чем на пользу.
- система распознавания знаков в авто.
- система удержания в полосе в авто.
- система распознавания лиц.
- фото-фильтры в камерах и графических редакторах.
- фейсбук, который узнает ваш фейс и ставит на него тег.
- тысячу видов диагностики в медицине.
- исследования в генной инженерии.
- гугл-переводчик (постоянно учится на вводе текстов от миллионов пользователей).
- система исправления ошибок в текстовых редакторах.
- гугл-карты (постоянно учится и улучшает маршрут).
- система рекомедации контента в интернете.
- гугл, которые вас подслушивает и подсовывает рекламу того, о чем вы говорили.
- сканирование текста с картинки и перевод его в текст.
- система шумоподавления и прочие аудио-чудеса.
- чат-боты.
- распознавание спама в имейлах.
- анализ снимков и нахождение новых объектов в астрономии.
- нахождение дронами вражеской техники на поле боя.
- аэрофотосъемка и анализ урожая в агрокомплексе.
- прогноз погоды.
- отсев резюме в любой большой компании, где много аппликантов.
- предсказания на фондовом рынке.
- анализ спроса на продукт и автоматическая корректировка цены в любой торговой сети.
... и еще тысячу других сфер, где применяются Нейросети, или как любят говорить, ИИ.
А сама теоретическая и математическая база под эти Нейросети была придумана где-то лет 40 назад. Никакой магии там нет. За нейросетями стоят многомерные числовые матрицы и математические операции с ними. Просто под это дело до недавнего времени банально не хватало вычислительных мощностей.
Я разве просил читать лекцию на общую тему "Где применяются Нейросети"?
Я спрашивал про
"реальные положительные применения этим ИИ-видео, так сказать на пользу человечеству".
Выделил специально для вас. Хотя если простой вопрос нужно уже 3й раз объяснять, то пожалуй отвечать не стоит.
Считать ли положительным?
Для них да.
нифига он не учится. уже больше года езжу одним и тем же маршрутом, а он все его никак спрямить не может:
... шарахаются.
Пришлось отключать улубку -автопилот и сливатся с угрюмым фоном.
Перед ним тоже извиняться?
Интересно, кому это может пригодиться?
Вот взломщикам и пригодится.
Правда звезды не будут этому рады...
Только Том Круз делает трюки, но за свой счёт и как хобби с рекламой.
Их и так могли заменить не менее способные актёры из середняка, но почему то в блокбастеры привлекают дорогих звёзд.
И "консервы" уйдут в прошлое, будут не сниматься впрок, а генерироваться по мере надобности.
В общем, как писал фантаст:
"Верь тому, что ты видел сам и тому, что ты можешь потрогать. Это не даст тебе стопроцентной гарантии, но все остальное под еще большим вопросом. " (с)
Т.е. можно будет заменить дикторов и комментаторов. Но ИМХО главное применение -- создание фейковых речей якобы от лица известных людей. Часть могут быть забавными, например Ньютон, рассказывающий про случай с яблоком. Но большинство это будет обман для криминальных и политических надобностей.
Да, чтоб два ответа не плодить - давно ли цифровые фото-видео-аудио записи стали доказательствами?..
В других странах суды также принимают такие доказательства при соблюдении ряда требований.
Суд на свое усмотрение может как принять так и отклонить эти материалы по велению своей левой пятки, на то он и суд.
Самый продвинутый ИИ от Anthropic AI - Claude 3 Opus, который, согласно некоторым заявлениям, "демонстрирует признаки сознания".
Метка вставляется самим AI на этапе генерации видео. По этим меткам однозначно определяется что видео не настоящее. 😉