Polls

Cuantas horas programas al día?
 
Inicio arrow Tutoriales arrow Lo + Nuevo arrow Introducción a Sonido en video Juegos (3ª parte)
Introducción a Sonido en video Juegos (3ª parte) PDF Print E-mail
Written by Javier Loureiro   
Sunday, 17 December 2006

Introducción a Sonido en video Juegos (3ª parte)

por Jose Luis Fernandez Fasani

Hola a todos, perdón por la gran demora en escribir el cuarto tutorial, agradezco todos los mail que me han mandado, le doy gracias a la gente a cargo de la página de poder mostrar el trabajo que hemos hecho en conjunto a mi compañero y mi profesor guía.

Vamos a lo nuestro, en los otros tutórales, se hablo de sonido 3D como concepto, de que se trata y como trabaja. También se hablo de los sistemas de audio 5.1 y ahora le quiero mostrar como funcionan los sistemas de audio 3D, ya que son los sistemas mas usados por la gente, ya que no todo el mundo posee los sistemas 5.1, 6.1, 7.1 etc.

1. INTRODUCCIÓN

Estas técnicas buscan, en teoría, sumergir aún más al oyente en lo que esté ocurriendo en la pantalla entregando una imagen sonora más de acuerdo con la realidad. Es necesaria la diferenciación de las dos técnicas de sonido más utilizadas en video juegos en lo referente a sonido, la reverberación y el posicionamiento en 3D.
Creative Labs utiliza la reverberación para la simulación de ambientes y recintos acústicos mediante su tecnología EAX; otros desarrolladores tales como Aureal, Sensaura y Qsound, entre otros, utilizan algoritmos de posicionamiento de sonido netamente 3D. La librería DirectX de Microsoft, para todos los sistemas Windows actuales, incluye la aplicación DirectSound3D para el posicionamiento de audio 3D.
El concepto de sonido o audio 3D se entiende como la existencia de fuentes generadoras de sonido (objetos) localizadas en un entorno o espacio 3D alrededor del oyente (ambiente o environment en inglés). Dicho sistema debe ser capaz de posicionar audio en 3D, en las tres dimensiones que rodean a un oyente y no tan solo en el plano horizontal surround.

La posición ideal para la ubicación de los monitores con respecto a la cabeza del oyente es formando un triángulo equilátero entre ellos, con los monitores inclinados aproximadamente 30º con respecto al eje vertical. La altura ideal para la ubicación de los monitores corresponde a la altura en que se encuentren ubicados los oídos del oyente.

Sistema de Altavoces 3D (Estéreo) en Configuración Ideal

(Altavoces formando un Triángulo Equilátero con el Oyente).

 

2. HRTF (Head Related Transfer Function)

El posicionamiento tridimensional de los sonidos es posible a través dos o más altavoces, tanto como en audífonos, gracias a la utilización de la Función de Transferencia Relacionada a la Cabeza.
Este es un modelo de la percepción humana con dos oídos en función de la posición de diversas fuentes sonoras en el espacio. El modelo más simple considera a las diferencias inter-aurales de tiempo y de intensidad (Teoría Duplex), mientras que otros modelos consideran los obstáculos que representan para el sonido la cabeza y el torso, pero por lo general estás siempre están basadas en conjuntos de filtros FIR.
Resulta necesario a su vez, del uso de las técnicas de cancelación por crosstalk (CC), para que el posicionamiento sea posible en dos o más altavoces, de forma de minimizar el efecto del sonido percibido por los oídos por parte de los altavoces que no les correspondan. Es decir que se debe aplicar CC a la señal del canal izquierdo para minimizar la percepción de esta señal por parte del oído derecho.

Modelo de Cancelación por Crosstalk de Sensaura

Existen sistemas 3D diseñados para cuatro o más altavoces, entre los cuales se encuentran MultiDrive de Sensaura y a CMSS (Creative Multispeakers Surround Sound) de Creative. MultiDrive crea dos hemisferios sonoros complementarios, frontal y posterior, cuando se utilizan cuatro o más altavoces, sin utilizar técnicas de paneo 2D. Esta tecnología es promovida como la primera tecnología multi-altavoces 3D del mundo puesto que utiliza HRTFs en cuatro canales.

3. Drivers y APIs

Los drivers son programas que controlan el acceso del sistema operativo a un dispositivo de hardware determinado. Son tantos o más importantes que el resto del hardware y el software, puesto que de su correcto funcionamiento dependerá el funcionamiento de todo el sistema en sí. La figura grafica la interrelación entre estos elementos. Las APIs controlan funciones de bajo nivel y prestan soporte a diversos dispositivos de entrada (teclado, mouse, etc.), mezcla de sonido, visualización en pantalla, entre otros.

Relación entre Software, Drivers, APIs, Hardware.

Para que un sistema operativo pueda trabajar con cualquier tarjeta de sonido, se requiere de una API (application program interface), la cual es un conjunto estándar de funciones y comandos que permite a las aplicaciones que requieran los servicios de una tarjeta de sonido tener una manera uniforme de comunicarse con ella, librando a su vez a los programadores de escribir el código que les permita a sus programas controlar las innumerables tarjetas de sonido existentes en el mercado.
Cuando un programa esta ejecutándose y solicita el funcionamiento de la tarjeta de sonido, el sistema operativo se comunica con la API requerida, la cual recibe las instrucciones, las interpreta y las convierte al lenguaje nativo del hardware correspondiente, para enviárselas a la tarjeta de sonido en el lenguaje que sus drivers puedan comprender.
Por lo general los drivers son escritos de acuerdo a las especificaciones de una API determinada.
Del poder y la velocidad de procesamiento dependerá la cantidad de streams de audio estéreo o 3D (DirectSound o DirectSound3D respectivamente) que pueden mezclarse al mismo tiempo. Para que uno o varios sonidos sean posicionados en el espacio 3D en tiempo real se requiere de una gran velocidad de procesamiento y transmisión de datos.
Una tarjeta moderna es capaz de mezclar hasta 32 muestras de audio en general, siendo posible mediante soporte para aceleración por hardware, la mezcla de hasta 64 muestras DirectSound.

4. Primeros Modelos

El ejemplo más sencillo de posicionamiento de un sonido es por medio del paneo en dos dimensiones (estéreo). El primer motor de sonido que considero esta técnica fue el del juego DOOM de ID software, el cual reproduce cada fuente monofónica en estéreo para ubicar las fuentes sonoras en el plano horizontal, variando simplemente el volumen de las canales izquierdo y derecho. Este motor además permite el filtraje de altas frecuencias pensando en las fuentes sonoras que puedan ubicarse detrás del oyente.
Con este sistema es imposible el ubicar fuentes sonoras en el plano vertical.
A partir de la HRTFs se han desarrollado algunos algoritmos que modelan tanto la percepción humana como la acústica de los recintos reales, entre otras tecnologías. Cabe resaltar que existe una marcada diferencia entre los dos métodos principales que se están utilizando, la reverberación y rastreo de ondas (wavetracking o por rayos de onda, conceptos tocados en los anteriores tutoriales).
Mientras que los modelos de reverberación, si bien logran crear la atmósfera sonora de un espacio acústico con cierta precisión y una relativa facilidad en cuanto a la implementación de los comandos requeridos en la programación de la parte de sonido del juego, son, en comparación, un modelo más simplista del que constituye un modelo de distancia basado en el rastreo de ondas.

5. Modelos de Distancia

Un motor de sonido 3D debe poder establecer, como condición mínima, la distancia entre la posición del oyente y la posición de una o varias fuentes sonoras. Para lo cual generalmente se atenúa el volumen de las fuentes distantes, dependiendo de su distancia, bajo una escala logarítmica. Para esto debe establecerse el rango de acción acústica de las fuentes sonoras y de percepción del sonido por parte del oyente, es decir, establecer la distancia mínima de escucha, desde la cual el sonido empieza a desvanecerse, y la distancia máxima a partir de la cual las fuentes sonoras ya no serán escuchadas por el oyente.
Cuando se consideran varios objetos que puedan tener distancias mínimas y máximas diferentes en relación al personaje de un jugador, como se muestra en la figura, se incrementa en gran medida la cantidad de operaciones que necesitan realizar los componentes de hardware para la generación del audio

 

6. Fuentes de Sonido Volumétrico

El primer motor en utilizar el enfoque de sonido volumétrico fue A3D 3.0 de Aureal, posteriormente Sensaura amplió el modelo con su tecnología ZoomFX.
El concepto de sonido volumétrico consiste en que muchas fuentes sonoras en la vida real, están constituidas por varias fuentes sonoras independientes, por lo cual se emulan dichos sonidos largos y compuestos, por medio de la mezcla y distribución de varios archivos de audio sobre una superficie determinada de un objeto en el juego.
ZoomFX es un algoritmo que recrea el tamaño acústico de objetos emisores de sonido, definiendo una gran cantidad de objetos como una colección de fuentes puntuales.
Por ejemplo, el sonido producido por un tren en la vida real es más amplio y compuesto que el de una motocicleta, debido a que la fuente sonora se esparce sobre un área mayor y no es emitida desde un solo punto.
Otra técnica de Sensaura, denominada Dynamic Decorrelation, está dedicada a la mezcla de varias fuentes de sonido volumétrico simultáneas.

 

7. Wavetracking

Wavetracking es todo aquel método o modelo capaz de considerar la propagación del sonido en un espacio o escenario determinado, por medio del cálculo de los caminos de propagación del sonido directo y de las reflexiones de primer y segundo orden, así como de las oclusiones por las cuales pueda ser afectado el sonido en su camino de propagación desde que es emitido hasta que arriba al oyente.

 

El modelo de A3D analiza la geometría del recinto y determina después los caminos de propagación de las ondas en tiempo real, considerando sus reflexiones y su paso a través de objetos acústicos diversos, pero esta tecnología dista de ser realista debido a soporta pocas muestras de audio. Debe considerarse que para trazar la geometría del escenario o recinto se requiere de un alto nivel de procesamiento.
Pueden simularse las oclusiones, obstrucciones y exclusiones del sonido en cuanto a la propagación de este en un ambiente determinado, mediante la variación del volumen y el filtraje de frecuencias altas de los archivos de sonido utilizados, dependiendo de la geometría del recinto y de los materiales relacionados a los objetos de un juego dado.

8. Oclusión

El fenómeno de oclusión ocurre cuando una fuente generadora de sonido es percibida a través de objetos o estructuras por las cuales pueda atravesar el sonido, tales como paredes, puertas o ventanas. En este caso la fuente sonora y el oyente no están en contacto directo, el filtraje al que se somete al sonido original debiera depender tanto de las dimensiones geométricas como de los materiales por los cuales esté constituido el obstáculo del sonido; las reflexiones tempranas y su reverberación posterior se tratan bajo los mismos principios de filtraje.

 

9. Obstrucción

La oclusión de un sonido se produce cuando la fuente sonora y el oyente se encuentran en la misma habitación y la señal directa es empantallada por algún objeto físico, tal como puede ser un pilar en la Fig. 3.23. En esta situación se filtra al sonido que se propaga en camino directo de la fuente hacia al oyente, pero las reflexiones tardías alcanzan al oyente sin alteración más que la producida por los materiales sobre los cuales se hayan reflejado las reflexiones.

 

10. Exclusión

Cuando la fuente sonora y el oyente se encuentran en distintas habitaciones pero es posible el contacto directo entre ellos, es que se produce el fenómeno de exclusión del sonido. El sonido directo alcanza, en este caso, al oyente sin modificación alguna, pero el sonido reflejado requiere ser filtrado y/o distorsionado para simular el empantallamiento producido los obstáculos, según sean sus dimensiones y propiedades de materiales.
Debe tomarse en cuenta que el trazado del recorrido del sonido desde una fuente sonora dada hasta el oyente, considerando la propagación directa y las múltiples reflexiones que se producen, más el procesamiento requerido para la manipulación de los sonidos en función de su procedencia, empantallamientos u otros fenómenos acústicos reales, supone un esfuerzo considerable por parte de los componentes de hardware dedicados a emular dichos fenómenos en tiempo real.

Este trabajo es parte de la Tesis “Estudio Comparativo entre sistema de Audio 3D y Sistemas 5.1 Aplicado en Video Juegos” Realizada en la Universidad Tecnológica de Chile, sede Vicente Pérez Rosales.
Desarrollado por José Luis Fernández, Marcelo Lazzati.
Profesor Guía de la Tesis, Roberto Muñoz.

Cualquier pregunta que tengáis sobre el tema podéis mandarlo a This e-mail address is being protected from spam bots, you need JavaScript enabled to view it , Jose Luis Fernandez, Ingeniero en Sonido.

 

DEDICADO A MI MADRE, MARTA FASANI

 

Comentarios
Añadir nuevoBuscar
Escribir comentario
Nombre:
Email:
 
Website:
Título:
Código UBB:
[b] [i] [u] [url] [quote] [code] [img] 
 
Security Image
Por favor introduce el código anti-spam que puedes leer en la imagen.

Copyright (C) 2007 Alain Georgette / Copyright (C) 2006 Frantisek Hliva. All rights reserved.



menéameDigg!Del.icio.us!Google!Technorati!Yahoo!
Last Updated ( Sunday, 17 December 2006 )
 
< Prev   Next >

Lista de Correo

visita la lista de correo de codepixel. Es una lista abierta, asi que podrás subscribirte y preguntar tus dudas de programación, compartir tus opiniones, aportar ideas, y formar parte de la comunidad codepixelera.