Нейросеть способна «производить секунду звука за 500 миллисекунд».
Facebook разработала новую скоростную систему по преобразованию текста в речь на основе искусственного интеллекта. Система способна «производить секунду звука за 500 миллисекунд» и высококачественные голоса без использования специализированного оборудования. Программа работает в режиме реального времени и на обычных процессорах.
Разработчики соцсети потратили на её разработку около шести месяцев. Она состоит из четырех частей, каждая из которых отвечает за область речи - лингвистику, произношение, акустическую модель и нейронную кодировку голоса.
ИИ отвечает за выстраивание всех лингвистических цепочек, разрабатывает модель речи и подбирает стиль озвученного текста. Также, с помощью стиля система может создавать новые голоса: «мягкие», «быстрые», «формальные».
Система уже работает на Portal - устройстве Facebook для видеовызовов и доступна в других приложениях: от сервисов чтения для слабовидящих до VR.
Создайте аккаунт, бесплатно выйдете на B2B-Маркетплейс с вашим портфолио из услуг и продуктов.
Получайте лиды через Indexcall, а продажи делайте напрямую. Свой сайт вам больше не нужен.
Оставить заявку на бирже - самое простое. Также рекомендуем найти в маркетплейсе услугу, выбрать поставщика по отзывам и сделать заказ прямо тут.
Имея аккаунт на Indexcall, вы всегда можете оставить отзыв о поставщике, услуге или продукте для бизнеса.
Сожалеем, но заказ у себя недоступен. Ваши потенциальные клиенты после нажатия на кнопку заказа попадают на форму заказа. Вы получите уведомление, если заявка будет размещена.
Создайте аккаунт, добавьте в свое портфолио услуги и вы станете участником этого рейтинга. Чем больше у вас отзывов или ниже цены, тем выше вы в Рейтинге.