Видеокамера записывает голос без микрофона
14.06.2013
Используя высокоскоростную камеру, делающую тысячи кадров в секунду, японцам удалось сделать запись даже самых мельчайших колебаний поверхности кожи лица и шеи человека, которыми сопровождаются звуки, исходящие от голосовых связок человека.
В мире существуют различные программы, широко используемые всевозможными спецслужбами и правоохранительными органами, которые по движениям губ, челюстей и мышц лица человека могут распознать те слова, которые произносит этот человек. Наиболее сложные программы могут распознать речь человека на различных языках, но в любом случае, компьютер может с некоторой долей вероятности правильно воспроизвести только слова, чистый текст, не включающий в себя никаких интонаций и эмоциональной составляющей.
Используя высокоскоростную камеру, делающую тысячи кадров в секунду, исследователям из университета Васеда (Waseda University in Tokyo) в Токио удалось сделать запись даже самых мельчайших колебаний поверхности кожи лица и шеи человека, которыми сопровождаются звуки, исходящие от голосовых связок человека. После съемки специализированная компьютерная программа, основанная на сложнейших алгоритмах, превратила снятые колебания кожи в соответствующие им звуковые колебания, в голос человека.
"С помощью нашей технологии мы можем получить не только слова, произнесенные человеком, но и его голос с интонациями, несущими эмоциональную составляющую речи", - рассказал Ясухиро Оикоа (Yasuhiro Oikawa), руководитель научной группы, выступая на Международном конгрессе по акустике (International Congress on Acoustics), проходившем в начале июня в Токио.
Используя технологию высокоскоростной съемки, исследователи сделали запись того, как два добровольных участника произносили одно и то же слово на японском языке. Камера снимала с частотой 10 тысяч кадров в секунду (для сравнения, в обычном видео используется съемка с частотой 24 кадра в секунду, а особо качественное видео снимается с частотой 60-80 кадров в секунду). Помимо этого, голос добровольцев записывался с помощью обычного микрофона, а колебания кожи их лица и горла регистрировались с помощью датчиков-виброметров.
После того как компьютерная программы выдала рассчитанную ей на основе визуальных данных последовательность звуковых колебаний, исследователи сравнили их с реальными данными, записанными с помощью микрофона и виброметров. Оказалось, что рассчитанные звуки совпадали с реальными звуками, расходясь лишь в незначительных деталях. Проигрывая получившийся звуковой файл, исследователи смогли достаточно четко распознать отдельные произносимые слова и опознать голосовые интонации.
Технология реконструкции речи и голоса человека с помощью высокоскоростной камеры находится еще в экспериментальной стадии, только доказывающей работоспособность самой идеи. До конца этого года исследователи планируют довести эту технологию до уровня, когда она сможет работать в режиме реального времени, распознавая и воспроизводя не только короткие слова, фразы, а и достаточно длинные предложения. Для этого исследователи собираются серьезно переработать программное обеспечение системы и реализовать функцию анализа колебаний поверхности кожи некоторых других частей лица человека, к примеру, щек, что предоставит в их распоряжение большее количество информации, позволяющей более качественно реконструировать речь, голос и интонации человека.
<< Назад: Гарнитуры серии Sound Blaster от Creative 15.06.2013
>> Вперед: Процессор с частотой 5 ГГц 14.06.2013
Последние новости науки и техники, новинки электроники:
Жидкий кальциевый нитрат для овощеводства
07.06.2026
Хозяйство Solbergs Gartneri, расположенное в Веттре, Норвегия, выращивает огурцы на площади 12 500 м2. В текущем сезоне оно полностью заменило традиционный водорастворимый кальциевый нитрат на продукт, производимый компанией N2 Applied из воздуха, воды и возобновляемой электроэнергии. Первые испытания нового удобрения начались еще в конце прошлого сезона в небольшом объеме, после чего хозяйство приняло решение о полном переходе.
Технология N2 Applied основана на использовании плазмы для получения азотной кислоты из атмосферного воздуха и воды, которую затем превращают в жидкий кальциевый нитрат. Этот формат особенно удобен для систем фертигации. Важным преимуществом является отсутствие аммония в составе, что дает агрономам больше возможностей для точной корректировки питания растений. Владелец хозяйства Кристиан Солберг отметил, что теперь они могут более гибко реагировать на изменения pH в субстрате, снижая или увеличивая внесение аммония по необходимости.
Одним из главных мотив ...>>
Игровой монитор MSI MPG OLED 322URDX36
07.06.2026
Компания MSI представила монитор MPG OLED 322URDX36, который стал первым в мире 31,5-дюймовым монитором с технологией Triple Mode.
Эта инновация позволяет пользователю одним нажатием переключаться между тремя режимами: 4K (3840x2160) при 360 Гц для максимальной детализации и кинематографичности, 2K/QHD (2560x1440) при 520 Гц для оптимального баланса качества и плавности, а также Full HD (1920x1080) при впечатляющих 680 Гц - идеальном варианте для динамичных киберспортивных дисциплин. Такая гибкость открывает новые возможности для игроков разного уровня.
Монитор построен на базе панели QD-OLED пятого поколения с технологией Penta Tandem и субпиксельной структурой RGB Stripe. Это решение устраняет традиционные проблемы OLED-дисплеев, такие как цветовая окантовка и снижение четкости текста. Благодаря усовершенствованной структуре изображения становятся более естественными и приятными для глаз даже при длительных игровых сессиях.
Среди ключевых достоинств модели - поддержка VESA D ...>>
Дифузное покрытие для теплиц
06.06.2026
В тепличном овощеводстве и ягодоводстве управление светом играет ключевую роль в повышении урожайности и качества продукции. Растения особенно активно используют красную и синюю части спектра для фотосинтеза, в то время как зеленый свет в значительной степени отражается. Французская компания Ondex разработала инновационное решение, которое позволяет эффективнее использовать доступный солнечный свет без дополнительных затрат на досветку.
Французский производитель Ondex вывел на рынок диффузное тепличное покрытие OptiRed DIFFU100. Этот материал смещает часть зеленого спектра в красный, усиливая фотосинтетическую активность растений. В 2026 году начались масштабные производственные испытания покрытия в юго-западной Франции на экспериментальной станции Invenio-FL. Исследования проводятся на ремонтантной землянике, выращиваемой на гидропонике с марта по июль, и на перце, посаженном в почву с середины мая по октябрь.
По замыслу разработчиков, увеличение доли красного света должно спосо ...>>
Планшет Acer A210 Eye-Care
06.06.2026
Компания Acer о выпустила новый планшет A210 Eye-Care - простое и практичное устройство начального уровня по привлекательной цене.
Новый 8-дюймовый планшет Acer A210 Eye-Care оснащен IPS LCD-дисплеем с разрешением 1280x800 пикселей. Благодаря компактным размерам 120x204x7,8 мм устройство удобно лежит в руке и легко помещается в сумку. Тонкий корпус толщиной всего 7,8 мм делает его идеальным спутником для чтения электронных книг, просмотра веб-страниц, онлайн-обучения и потребления видеоконтента. Технология Eye-Care специально направлена на снижение нагрузки на глаза при длительном использовании.
Планшет работает под управлением операционной системы Android 14 "из коробки" - это редкость для устройств такого ценового сегмента. Acer предлагает две основные конфигурации: 4 ГБ оперативной памяти с 64 ГБ встроенного хранилища и 6 ГБ ОЗУ с 128 ГБ памяти. Пользователи могут дополнительно расширить объем памяти с помощью карты microSD, что позволяет комфортно хранить приложения, фотограф ...>>
Умная капсула GISMO: миниатюрный анализ здоровья кишечника изнутри
05.06.2026
Медицина активно ищет способы сделать диагностику заболеваний желудочно-кишечного тракта менее инвазивной, комфортной и информативной. Триллионы бактерий, населяющих наш кишечник, производят множество веществ, которые могут сигнализировать о воспалениях, нарушениях микробиоты и даже ранних стадиях серьезных заболеваний задолго до появления симптомов. Именно поэтому ученые из Бельгии и Нидерландов разработали революционную технологию - крошечную умную капсулу, способную "путешествовать" по пищеварительной системе и собирать ценные химические данные в реальном времени.
Капсула GISMO (Gastrointestinal Smart Module), созданная специалистами imec и OnePlanet Research Center, по размеру сравнима с конфетой Tic Tac. Пациенту достаточно проглотить ее, после чего устройство начинает каждые 20 секунд анализировать химическую среду кишечника, в частности окислительно-восстановительный потенциал (redox balance), уровень pH и температуру. Собранные данные передаются на небольшой приемник, которы ...>>
Случайная новость из Архива Следите за глазами выпившего
08.06.2002
Известно, что прием алкоголя нарушает координацию между руками и глазами. Это явление английские инженеры и физиологи из Бристольского университета предлагают использовать для проверки трезвости водителя.
Когда дорога поворачивает, глаза водителя как бы стремятся заглянуть за поворот. Вслед за взглядом руки начинают поворачивать руль. Создан прибор, следящий за глазами водителя и рулем. В нормальном случае поворот глаз опережает поворот рук на 0,75 секунды. После приема разрешенной английскими правилами дорожного движения дозы алкоголя опережение уменьшается до половины секунды, а после четырех рюмочек водки - до четверти секунды.
Прибор может предупредить водителя, что ему лучше остановиться и уступить кому-нибудь место за рулем. Другая версия способна даже самостоятельно выключить мотор и связаться с полицией.
Сейчас университет занят патентованием устройства и поиском желающих его производить.
|
Смотрите полный Архив новостей науки и техники, новинок электроники
Главная страница | Библиотека | Статьи | Карта сайта | Отзывы о сайте

www.diagram.com.ua
2000-2026