e.motion
Статьи

Три измерения звука

Автор: Дмитрий Смирнов
Опубликовано в журнале «Домашний компьютер» №12 от 20 ноября 2004 года.

Искусственный трехмерный звук я впервые услышал на премьерном показе фильма «Скала» в одном московском кинотеатре, первом в России, оборудованном системой Dolby Digital. Запомнился спецэффект: сначала зрители услышали за спиной приближающийся звук ракеты, а потом уже увидели ее на экране, стремительно уносящуюся к горизонту. Детского удивления, впрочем, не было — казалось бы, понятно, как можно создать этот эффект с помощью нескольких микрофонов.

Удивление пришло несколько позже, когда я обнаружил подобный эффект в компьютерной игре. Удивился же я потому, что играл в простых стереонаушниках; ни о какой многоколоночной системе Dolby речи не шло. Тем не менее, я четко различал не только звуки «слева-справа» — некоторые из них определенно находились позади, источник других был расположен немного справа и впереди, «во-от за тем углом»?

В целом

Всем существующим разработкам в области 3D-звука предшествовали серьезные вычисления и исследования. Главная задача разработчиков состояла в том, чтобы создать такой сигнал, который будет при помощи двух или более источников звука (колонок или динамиков наушников) передавать звук, воспринимаемый нами как трехмерный.

Для описания 3D-звука используется алгоритм HRTF (Head Related Transfer Function; переводится примерно как «функция передачи звука относительно головы»). Принцип использования HRTF основан на описанном выше эффекте: звук, достигая человеческого уха, претерпевает значительные искажения во время прохождения через голову и тело человека (точнее, после того, как он их огибает). В зависимости от расположения источника звук искажается по-разному. Получив информацию о частоте звука и степени его искажения, человеческий мозг определяет положение источника. Таким образом, если заранее известна эта функция, а также направление и расстояние до источника, с помощью сложных вычислений можно смоделировать звук, распространяющийся из определенной точки пространства. Опыты, с помощью которых был выведен алгоритм HRTF, проводились на специальном слуховом манекене KEMAR1. С помощью KEMAR был создан набор библиотек HRTF, описывающих сочетания звука, услышанного манекеном, и оригинального звука в зависимости от его частоты и положения в пространстве относительно слушателя. Для моделирования источника звука с помощью библиотек HRTF достаточно знать его азимут, высоту и частоту.

Специалисты компании Sensaura пошли еще дальше. После серии опытов они определили, что HRTF в чистом виде работает только при воспроизведении через наушники, каналы которых идеально разделены. Моделирование звука в этом случае — относительно простое дело: каждый динамик контролирует свое ухо. Однако при воспроизведении того же самого звука через колонки правое ухо слышит также звук, призванный «обманывать» с точки зрения трехмерности левое, и наоборот. Для исключения этого явления требуется добавить в звук дополнительные компенсационные вычисления, причем они должны выполняться индивидуально с учетом положения слушателя относительно колонок. На первый взгляд, это практически нерешаемая задача; право, не ставить же в колонки датчики, определяющие положение слушателя! Подстраивать же параметры стереофонии каждый раз вручную пользователь вряд ли станет. Тем не менее, удачные алгоритмы компенсации все же были разработаны; они получили название Transaural Cross-talk Cancellation (TCC).

Решена задача была с помощью другой идеи инженеров Sensaura. Она заключается в том, что функции HRTF действуют только для среднестатистического уха, так как выведены с помощью одного манекена или усредненных показаний большой группы людей. Однако уши у всех людей разные. Поэтому Sensaura разработала цифровую модель уха, в которой можно задавать параметры ушной раковины. С помощью этой цифровой модели сочетанием разных параметров можно воспроизвести форму практически любого уха.

Получившийся драйвер цифрового уха работает так: при его установке человек слушает ряд тестовых звуков и настраивает параметры драйвера, чтобы наилучшим образом ощущать трехмерность звука. Индивидуальные параметры слушателя записываются в специальный «профиль», он впоследствии и используется приложениями.

Воспроизведение объемного звука с помощью наушников или пары колонок в любом случае достигается сочетанием настроек параметров HRTF и TCC, что не всегда является удобным решением. С некоторых пор промышленным стандартом звуковых карт стала поддержка не только 2- , но и 4- , 6- и даже 8-канального звука. В случае шести каналов чаще всего встречается система 5.1 (читается «пять-точка-один»): два фронтальных динамика-сателлита, два тыловых, один центральный и один басовый динамик-сабвуфер играющий роль «точки-один». Низкие частоты находятся, соответственно, на нижней грани человеческого восприятия; ухо неспособно распознать положение источника таких звуков, поэтому технически удобно выделить для низких частот только одну колонку с динамиком большого диаметра.

Звук формата 7.1 (то есть восьмиканальный) был выпущен Dolby Labs чуть больше года назад. В 7.1 добавляется пара дополнительных боковых сателлитов, тыловые же отводятся чуть глубже назад. Этот формат разработан на базе 5.1 и может воспроизводиться на акустике 5.1, правда при этом незначительная часть информации будет утеряна.

В частности

Теперь, когда мы составили представление о принципах моделирования 3D-звука, можно рассмотреть готовые технологии, использующие эти решения. Как ни странно, музыка, записанная в трехмерном формате, до сих пор не получила широкого распространения. Конечно, выпущен ряд компакт-дисков и DVD, звук на которых закодирован для воспроизведения на «трехмерных» проигрывателях. Однако их пока не так много, да и большинство домашних музыкальных центров все еще не оборудовано декодерами для воспроизведения 3D на простых стереодинамиках. Итак, какие же это технологии?

Aureal3D (A3D). Технология компании Aureal, в основе которой лежат принципы воспроизведения трехмерного звука с помощью двух колонок. Любопытно, что в разработке этого стандарта использовались и технологии NASA. О целях, с которыми американские военные занимались исследованием 3D-звука, остается только догадываться.

AC-3. Такое название получила реализация технологии Dolby 5.1 в компьютере. По сути, за этой аббревиатурой скрывается звук, разложенный на колонки 5.1.

DirectSound3D (DS3D). Не секрет, что большинство современных компьютеров работают под управлением операционных систем компании Microsoft. Последняя в рамках пакета DirectX выпустила набор драйверов DirectSound3D. Эта технология, поддерживающая базовые функции трехмерного звука, — своеобразный «буфер», интерфейс между разработчиками программного обеспечения и «железа». Так, дело программистов сторонней компании — написать программу, умеющую передавать трехмерный звук интерфейсу DS3D. Дело же Microsoft — передать этот звук на то или иное устройство (звуковую карту). Разработчики звуковых карт делают свою продукцию совместимой с DS3D и пишут для нее соответствующие драйверы. Таким образом, любая игра может работать на любой звуковой карте при условии, что они обе поддерживают DS3D.

Сама по себе технология DS3D поддерживает лишь базовые функции трехмерности. Однако она является неким открытым интерфейсом, под который можно написать расширения — программы, дополняющие функциональность DS3D. На работу с этим интерфейсом ориентировано большинство разработок Sensaura и ряда других компаний. В числе этих «других» нельзя не назвать технологию EAX компании Creative Labs.

EAX. Технология EAX, активно использующаяся в играх, включает в себя инструменты балансировки источников звука, моделирование объектов в трехмерном пространстве, поддержку эффектов реверберации. Также она симулирует распространение звука в закрытых и открытых помещениях и плавный переход из одной окружающей среды в другую.

Q3D. Разработка компании QSound предназначена для работы с четырьмя и более колонками. Так же, как и EAX, она ориентирована в основном на игры и делает ставку на реалистичную имитацию атмосферы. Q3D считается алгоритмом, достаточно качественно воспроизводящим звук при умеренных запросах к аппаратным ресурсам. Естественно, он также реализован в качестве расширения DS3D.

В итоге

Итак, что нужно для полноценного объемного звука в игре? Как минимум, три вещи:

  • звуковая карта с поддержкой стандарта 5.1 и EAX 2.0;
  • минимум 2 колонки, а лучше 4, а лучше 6, а совсем хорошо 8;
  • собственно, игра, поддерживающая звук в соответствующем формате (EAX).

При выборе звуковой карты следует обратить внимание на поддержку стандартов 5.1 и EAX 2.0. Впрочем, это умеют почти все современные звуковые карты. Зачастую звуковые чипы, поддерживающие 3D-звук, уже интегрированы в материнскую плату. Аудиофилов или тонких ценителей звука и спецэффектов, впрочем, они редко устраивают — что ж, их всегда можно отключить и установить в систему отдельного аудиомонстра.

Формат 7.1 поддерживают звуковые карты семейства Creative SB Audigy 2 ZS Pro 7.1 или Terratec Aureon 7.1. Стоимость старших моделей этих серий может составить две-три сотни вовсе не условных единиц.

Естественно, после подключения звуковой карты нужно установить драйверы, поддерживающие трехмерный звук, и указать, какой тип акустики вы используете. Кстати, многие карты в состоянии сами оценить, что же в них воткнули.

Ощущение объема можно создать и при помощи двух колонок, но ставшие уже традиционными 5.1, конечно, дадут им серьезную фору. Набор акустики приемлемого (для игр — уж точно) качества можно купить не меньше чем за 150 долларов.

Но мало просто купить колонки. Чтобы в игре затвор вашего автомата клацал у вас в руках, а не где-то в области почек, акустику надо еще и правильно расставить. Две колонки установить и настроить проще, чем 6 или 8. Традиционная схема 5.1 требует определенного объема и положения слушателя относительно колонок: готово ли к этому пространство вокруг вашего компьютера? Ведь не у всех есть возможность поставить компьютер в центре комнаты и расположить колонки по периметру. Так что для многих вариант с двумя колонками может оказаться не только приемлемым, но и единственно возможным. Важно, чтобы эти две колонки были достаточно качественными и «многополосными» (то есть состояли бы не из одного динамика).

Проблема еще и в том, что производители игр не всегда успевают ориентироваться в изменяющихся форматах 3D-звука, технологиях его кодирования и воспроизведения, и часто ограничиваются моделированием его для двух колонок посредством уже упомянутой сross-talk сancellation.

Все технологии, о которых мы рассказали, возникли буквально в последние десять лет. Так что в том, что разработчики игр еще порадуют нас в ближайшее время умопомрачительными 3D-эффектами, сомневаться не приходится.


1 Не подумайте, что от слова «кемарить», хотя манекен занимается как раз тем, что сидит и слушает; аббревиатура означает Knowles Electronics Mannequin for Acoustic Research, т. е. манекен для акустических исследований компании Knowles Electronics.

  • WordPress

Speak Your Mind

Tell us what you're thinking...
and oh, if you want a pic to show with your comment, go get a gravatar!

e.motion