Озвучить можно текст до 500 знаков. Есть возможность выбрать диктора, фон, добавить титры, а также фото или видео в левый верхний угол, как в настоящем новостном выпуске.
FASTEP — это ИИ-ассистент для работы с промышленным оборудованием. Он сам узнаёт технику, предлагает инструкции и показывает их в дополненной реальности. Графические подсказки закрепляются прямо на реальных органах управления. Даже если вы отвернулись, подсказка останется в правильном месте, а стрелка направит к ней. С FASTEP каждый рабочий и инженер становится экспертом. Подробности — на fastep.io
Команда стартапа FASTEP разрабатывает ИИ-ассистента с дополненной реальностью для пользователей бытовой техники и промышленного оборудования. Мы постоянно ищем новые способы обращения к аудитории и никак не могли пройти мимо свежей ИИ-платформы для создания видеороликов с дикторами от Mail.ru.
В конце концов, эта тема нам не просто потенциально полезна, но и близка. Мы провели блиц-тест диктора от «Смотри Mail.ru» в реальном кейсе собственной рекламы и сравнили его с Synthesia, аналогом из США. А теперь хотим показать вам результаты.
Обе платформы находятся в бета-стадии и предлагают попробовать свои возможности на тестовом ролике. Этим мы и воспользовались.
Пробный интерфейс Synthesia намного беднее. Здесь доступно только редактирование текста объёмом до 200 символов, а также выбор из трёх типов роликов. Сбоку показывают интерфейс, который можно будет получить за деньги. И он уже не уступает «мэйлрушному». Но доступ к нему выдают в индивидуальном порядке и только после того, как вы ответите на письмо, в котором вам пришлют ваш тестовый ролик.
Кстати, ролик присылают на email. Это удобно, но возможно лишь потому, что он небольшой — весит около двух мегабайт. Вес нашего ролика от «Смотри Mail.ru» составил около 44 мегабайт.
Текст для Synthesia:
Видео от Mail.ru сильно уступает по качеству озвучивания и мимики диктора. Российское решение также имеет интересный фокус на формат теленовостей. Интересно, будет ли он востребован?
Synthesia продемонстрировала преимущество по реалистичности графики и по звуку (даже на русском языке), но странно деавтоматизирована в части доступа к полному редактору.
Оба решения находятся в ранних стадиях развития, поэтому судить их по текущему состоянию мы считаем неправильным: ни один продукт не позиционируется как завершённый. Главное, что компании открывают к ним доступ, чтобы потребители могли оценить перспективы подобного софта — и заодно развлечься.
Нам на текущий момент более интересно ознакомиться с полной версией сервиса Synthesia.
Если вы тоже протестировали дикторов, расскажите о своих впечатлениях в комментариях. А лучше покажите, что получилось.
Идея сервиса интересная. Сегодня, чтобы снять видеоролик, нужен симпатичный человек с грамотной речью, хорошая камера, качественный звук, подходящий фон и многое другое. Этот сервис берёт на себя все эти задачи.
Сейчас он работает в бетта тестировании, поэтому не всё задуманное можно реализовать.
Итак, давайте посмотрим, что он из себя представляет.
Первым шагом нужно выбрать диктора. Это 4 девушки. Можно создать видео без диктора совсем.
Выбор диктора в сервисе Диктор от mail.ru
Затем вы выбираете сидя или стоя она будет говорить.
Выбор плана в сервисе Диктор от mail.ru
Затем выбираете фон.
На финальном шаге вы добавляете свой текст. Обозначаете ударения, если это нужно — в большинстве случаев сервис ставит их правильно, помечаете места, где нужно сделать паузу для акцента ну и для большей «натуральности».
Вуаля! Диктор говорит ваш текст голосом ведущего новостей.
Для большей информативности можно добавить картинки, ссылку (1), текст и музыку на фон. Музыку можно сделать тише или громче по отношению в голосу. Громкость голоса также можно менять.
Как было указано выше, сервис сейчас на стадии Бетта тестирования. Нам не удалось сохранить видео с картинками , ссылкой и текстом, поэтому мы добавили их отдельно в текст на сайт.
Время на прочтение
14 июля 2020 года компания Mail.ru Group запустила на базе платформы «Смотри Mail.ru» бесплатный сервис с виртуальными дикторами (сервис «Диктор»). С помощью этого сервиса любой пользователь может создавать новостные сюжеты с цифровыми ведущими. Сгенерированное с помощью сервиса видео можно сохранить на ПК или поделится им в социальных сетях.
При создании видео сюжета пользователю сначала нужно выбрать диктора — доступны цифровые ведущие по имени Мария, Татьяна, Тамара и Анита. Также нужно выбрать положение диктора — сидя за столом или стоя. Третий шаг — выбор заднего фона для ролика из семи вариантов. Задний фон анимированный, согласно его выбранному типу. Четвертый этап — добавить текст для ролика, максимум 500 символов, также можно вставлять паузу в реплики диктора. К сожалению, ждать генерацию ролика нужно достаточно долго из-за высокой нагрузки на сервис, как написано во время процесса. Например, тридцатисекундный ролик более часа в браузере генерировался.
После генерации ролика пользователь может просмотреть его первичный вариант, скорректировать текст, добавить медиа-файлы, титры. Сейчас сервис поддерживает форматы mp4, mp3, jpeg и png.
Разработчики проекта утверждают, что речь и мимика цифровых ведущих реалистичны. Цифровые дикторы были созданы с помощью системы компьютерного зрения группы Vision. Причем ролики генерируются таким образом, что дикторы не просто читают текст, а расставляют смысловые акценты и у них есть отображение эмоций. Это стало доступно путем использования системы искусственного интеллекта Mail.ru Group. Синтезом речи дикторов в этом проекте занималась команда разработчиков голосового помощника «Маруся».
Инструмент позволит компаниям, медиа и блогерам быстро выпускать сюжеты студийного качества, говорят в компании.
Сервис «Смотри Mail.ru» разработал платформу с цифровыми ведущими для производства новостей и репортажей в телевизионном формате, сообщили vc.ru в компании.
Чтобы сделать новостной видеоролик, нужно загрузить текст (его прочитает ведущий) и, если необходимо, изображения, музыку, титры и ссылки. Пользователь может выбрать внешность диктора из предложенных вариантов и оформление студии (например, в цветах компании).
Речь и мимика ведущих реалистичны, утверждают в компании. Например, читая новости, они расставляют смысловые акценты и воспроизводят эмоции. Сервис бесплатный для пользователей.
При создании платформы группа использовала собственные ИИ-разработки: над синтезом речи работала команда голосового помощника «Маруся», а в основе моделей ведущих лежит система компьютерного зрения группы Vision. Видеоизображение синхронизируется с речью ведущего — чтобы точно отображать движение губ и мимику, система обучалась на реальных людях и видеозаписях.
Mail.ru Group рассчитывает, что платформой будут пользоваться крупные компании, нишевые медиа и блогеры. Использование видеоредактора позволит им быстро выпускать сюжеты и экономить на производстве контента.
Видео от профессиональных медиаплощадок смогут попасть в рекомендательную систему сервиса «Смотри Mail.ru», что позволит пользователям заработать на видео, отмечают в компании. По прогнозам группы, к 2022 году 79% интернет-трафика в России будут составлять онлайн-видео.
Похожий сервис есть у «Сбербанка»: в апреле 2019 года компания представила виртуальную телеведущую с ИИ «Елена». Система позволяет создать ролик с новостным сюжетом, она генерирует речь и мимику.
Платформа Visper с искусственным интеллектом, чтобы создавать видеоролики: презентации, новости, обзоры.
У нас получился такой ролик-анонс «Юридического словаря для журналистов и блогеров» (прочитайте).
https://youtube.com/watch?v=AOx4AKwEBtU%3Ffeature%3Doembed
Виртуальный диктор сервиса Visper объясняет, чем отличаются иностранные агенты и нежелательные организации, экстремизм и терроризм, клевета и оскорбление.
Как создать обучающий, новостной ролик или презентацию
Проведите подготовительную работу:
Нажмите «Создать новый ролик».
В колонке слева выберите персонаж — на выбор три категории: реалистичный, анимационный из фото. Также выберите пол персонажа: мужской или женский. Ниже нажмите «Применить ко всем слайдам».
Выберите голос — на выбор четыре варианта: жизнерадостный, добрый, деловой, бодрый. Ниже нажмите «Применить ко всем слайдам».
Выберите вид слайда, положение персонажа в кадре. Ниже нажмите «Применить ко всем слайдам».
Выберите фон для студии: фотографию, видео или сплошной цвет. Нажмите «+» рядом с предложенными вариантами, чтобы загрузить свой фон. Ниже нажмите «Применить ко всем слайдам».
Установите фоновую музыку. Установите жесты для персонажа.
В специальное поле введите текст, который диктор будет озвучивать, или загрузите аудио до 20 секунд. Добавьте в текст для озвучки эффекты: ударения, паузы, замедлите или ускорьте речь.
В нижнем поле введите название ролика.
Когда все будет готово, нажмите в правом нижнем углу на кнопку «Сгенерировать».
Инструменты, чтобы менять видео, можно или прокручивать мышкой или переключаться по функциям в колонке слева