Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Нейросеть смогла воссоздать лицо человека по голосу
Новая нейросетевая модель смогла воссоздавать по записи речи человека примерное изображение его лица.
Алгоритм получил название Speech2Face. На основе записи голоса он может точно определить пол и чуть менее точно — национальность. Еще менее точно программа может предсказать возраст говорящего. Также программа способна составить примерный портрет человека, но точность реконструкции оставляет желать лучшего.
Для обучения нейросети ученые использовали массив более чем из миллиона коротких видео, на которых говорили люди. Программа разделяла видео и аудиодорожку. Сначала она обрабатывала лицо человека на видео, воссоздавая его в анфас. Затем программа работала с аудиодорожкой, создавая спектрограмму — зависимость мощности сигнала от времени. Затем результаты двух алгоритмов объединили и лицо соотнесли со спектрограммой.
Обучив нейросеть на большом массиве данных, ученые протестировали модель на фотографиях лиц людей. Оказалось, алгоритм хорошо угадывает пол человека, но редко может определить его возраст с точностью до десяти лет, а также лучше всего воссоздает лица людей с европейской и азиатской внешностью. Последний факт ученые объясняют неравномерностью выборки по национальностям.
Ученые сказали, что точность воссоздания внешности по голосу всегда будет довольно низкой из-за множества особенностей, влияющих на речь. Голос также может меняться в течение жизни, поэтому его точное сопоставление с внешностью едва ли возможно.
Исследователи сосредоточились на прогнозировании таких параметров, как пол, возраст и национальность. И если первый и третий параметры система определяла с высокой точностью, то над расчетом возраста создателям Speech2Face еще стоит поработать. Ученые отмечают, что их программа поможет лучше понять корреляцию внешности человека с его голосом.
Другая группа ученых ранее создала нейросеть, которая может угадывать имя человека по фотографии, выбирая один из нескольких вариантов. Точность определения составила 54–64 процента, что выше случайного выбора из двух вариантов, где вероятность правильного ответа равна 50 процентам.
Специалисты УКБ №1 имени С.Р. Миротворцева СГМУ имени В.И. Разумовского провели успешное эндоскопическое удаление крупного кровоточащего новообразования толстой кишки у ребенка без разреза, через просвет кишки.
В 2023 году земные детекторы зарегистрировали нейтрино чрезвычайно высокой энергии — настолько большой, что теоретически оно просто не могло ее иметь. Чтобы обосновать параметры этой частицы, группа физиков предположила, что она происходит из черной дыры, взорвавшейся в ранний период истории Вселенной.
Голоса «детей» викторианской эпохи показали, как индустриализация изменила акценты английского языка
Современные акценты английского языка во многом отражают социально-экономические процессы, происходившие в Великобритании в викторианскую эпоху, то есть с 1837 года по 1901 год. Лингвисты доказали это, проанализировав архивные аудиозаписи разговоров с людьми, которые родились в указанный период и после него.
Биологи использовали данные отлова змей за 22 года, чтобы объяснить появление редких ядовитых рептилий в засушливых и нетипичных для них районах штата Гоа. Анализ показал, что королевские кобры Западных Гат используют железнодорожную сеть как скоростной коридор для расселения, случайно путешествуя в товарных вагонах из родных лесов к побережью.
Астрономы впервые напрямую связали основание гигантского джета с «тенью» первой «сфотографированной» сверхмассивной черной дыры M87*. Анализ данных, полученных с помощью Телескопа горизонта событий (EHT), позволил проследить, где именно формируется релятивистская струя и лучше понять механизмы ее возникновения.
Яркий надувной тюбинг, в народе прозванный «ватрушкой», стал символом зимнего отдыха. Он кажется удобным, мягким и потому — безопасным. Это ощущение обманчиво и ежегодно приводит к тысячам серьезных травм. В чем же кроется фундаментальная опасность этого популярного развлечения? На этот вопрос для нашего издания ответил Олег Рубан, кандидат технических наук, доцент кафедры физики РТУ МИРЭА, объяснив, почему законы физики превращают безобидный на вид тюбинг в неуправляемый снаряд.
От рыб произошли все наземные позвоночные, включая нас, но как именно рыбы стали главным населением морей — до последнего времени оставалось неясным. Авторы новой научной работы попытались доказать, что причиной этого было вымирание, возможно, вызванное белыми ночами.
Международная команда палеонтологов описала новый вид динозавра размером с крупную современную птицу. Он носил на голове плотный костяной нарост, который эти животные, возможно, использовали для внутривидовых разборок. Находка показывает, что даже мелкие хищники мелового периода могли решать конфликты не только когтями и зубами, но и ударами головой.
Образцы грунта, взятые астронавтами полвека назад, вложили еще один важный кирпич в здание научной картины мира: гипотеза о том, что Земля исходно была сухой, не стыкуется с фактами. Похоже, идею о невозможности сохранения большого количества воды на «теплых» планетах придется пересмотреть.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно

Последние комментарии