¿Cuál es el idioma más difícil del mundo para ¿Lectura de labios?

Hay muchas cosas que no sabemos sobre la visión y la percepción del habla.

La lectura de labios tiene una atracción casi mística en la población auditiva. Los científicos informáticos invierten dinero en programas automatizados de lectura de labios, los científicos forenses lo estudian como una posible fuente de información criminal, Seinfeld basó un episodio completo en su posible (mal) uso en fiestas. Para los lingüistas, es un tema de estudio tremendamente controvertido y fluido. ¿Qué están mirando realmente los lectores de labios? ¿Qué tan precisa es la comprensión del habla sobre la base de las señales visuales solo? ¿Qué idioma, de las más de 6,000 lenguas distintas en el mundo, es el más difícil de leer?

 

Esta última pregunta, aunque aparentemente simple, resiste todo intento de responderla. Cada teoría se encuentra con muros de evidencia, la investigación es limitada e incluso la comprensión básica de qué es la lectura de labios, qué tan efectiva es y cómo funciona está cargada de puntos de vista conflictivos. Esta pregunta, francamente, es una pesadilla.

 


Cuando pensamos en leer los labios, generalmente estamos asumiendo que un lector de labios está operando en completo silencio, lo cual no es así, gracias a la popularidad y las mejoras técnicas en los implantes cocleares y los audífonos, A menudo el caso. Lector de labios profesional con sede en Seattle Consuelo González comenzó a perder la audición a una edad muy temprana, comenzando aproximadamente a las cuatro y media. “Durante un período de aproximadamente cuatro años se redujo a las listas”, dice ella. (Realizamos una entrevista por video chat, para que ella pudiera leer mis labios). Hoy está profundamente sorda y, sin audífonos, no oye ningún sonido. Con ellos, puede captar algunos sonidos ambientales, algo de tonalidad en el habla, pero no lo suficiente como para comprender lo que se le dice, sin verlo, eso es.

 

Resulta que todos hacemos un poco de lo que hace González, es decir, usamos lo que vemos para comprender lo que se nos dice, incluso si no podemos escucharlo bien. “Ya en los años 50, hubo estudios clásicos que mostraron que las personas son mejores para percibir el habla en presencia de ruido de fondo si se puede ver la cara del hablador”, dice Matthew Masapollo, quien estudia la percepción del habla en la Universidad de Boston. Existe una profunda conexión entre los sentidos auditivo y visual cuando se comprende el habla, aunque esta conexión apenas se entiende. Pero hay todo tipo de estudios extraños que muestran cuán conectada está la visión con la percepción del habla.

 

Tomemos el efecto McGurk, llamado así por el investigador que lo descubrió accidentalmente en la década de 1970. Digamos que hay un video de una persona que dice sílabas sin sentido: “gaga”, pero el audio se ha intercambiado con la misma persona que dice “baba”. Se les pide a los sujetos que vean el video e identifiquen qué sonido se está hablando. Curiosamente, la mayoría de la gente percibe, usando ojos y oídos, algo completamente diferente: “papá”. El efecto McGurk muestra cuán extrañamente unidos son el sonido y la imagen en la percepción del habla, pero no es el único estudio de este tipo, dice Masapollo.

 

Hay otro estudio en el que las personas que sostienen un tubo en la boca, forzando su boca a hacer una forma de “oh” u “ooh”, son mejores para leer ese sonido vocal cuando lo hablan otras personas, en comparación con las personas que no tienen tubos en la boca. Otra peculiaridad de la lectura de labios es que un par de sonidos vocálicos es más fácil de leer que otro, incluso cuando los “labios” son solo una especie de representación de una boca en un punto claro. ¿Convertir esa representación en un ligero ángulo? La peculiaridad se ha ido. Otro descubrió que es más fácil entender a alguien mientras mira un video de él hablando, incluso si la cara está borrosa o pixelada, tal vez algo relacionado con el movimiento o el ritmo de la cabeza.

  The McGurk Effect shows just how weird the relationship between sound and image are in speech perception. El efecto McGurk muestra cuán extraña es la relación entre el sonido y la imagen en la percepción del habla.

También se han realizado muchos estudios sobre bebés antes del habla que sugieren que están recopilando información visual de los hablantes que los rodean. Los videos silenciados reproducidos de personas que hablan el idioma con el que un bebé está familiarizado, el idioma que se convertirá en la lengua materna del bebé, atraen la atención del bebé por más tiempo que los videos de personas que hablan otro idioma. Parece que hay algún tipo de capacidad innata de lectura de labios en todos nosotros.

 

Hay un par de teorías diferentes sobre cómo se desarrolla esto a medida que crecemos. Una es que la información visual es mayormente redundante al discurso que escuchamos. Otro enfoque es que las señales visuales proporcionan información, pero que realmente no sabemos cómo medirla y registrarla. Para agregar a la complejidad, hay una gran variabilidad entre los individuos. Algunas personas que pueden escuchar generalmente dejan que su habilidad innata de lectura de labios caduque, confiando en el componente de audio del habla, mientras que otras hacen más uso de la información visual todo el tiempo. Pero muchas fuentes en línea afirman que la lectura de labios es solo un 30 por ciento precisa .

 

Pero eso no se aplica realmente a las personas con discapacidad auditiva. González no sabe lenguaje de señas americano. Ella se basa completamente en la lectura de labios y los pequeños fragmentos de sonido que puede detectar con su audífono. Nuestra conversación fue muy fluida, una vez que coloqué mi computadora portátil en una superficie estacionaria para que la cámara dejara de moverse. En ningún momento durante la conversación tuve alguna inquietud acerca de si González podía entender cada palabra que dije.

 

La baja tasa de éxito comúnmente citada para la lectura de labios no se basa en personas como González. Gran parte de la investigación utiliza sujetos con audición normal; Masapollo, por ejemplo, no trabaja con personas sordas. Su trabajo se trata menos de leer los labios que de la percepción del habla. De hecho, es extrañamente difícil encontrar datos sobre la efectividad de la lectura de labios como lo practican las personas que realmente lo hacen como parte de su vida diaria. Las personas con un examen auditivo normal tienen una precisión de alrededor del 10 al 12 por ciento, y se sugiere que las personas con discapacidad auditiva tienen una precisión del 45 por ciento. Pero la mayoría de estos estudios son un poco raros, ya que tienden a evaluar la precisión al ver si las personas pueden identificar fonemas individuales (los sonidos que forman palabras, como “gah” o “th”) o palabras. Pero, según González, así es como funciona la lectura de labios.

 

“No leemos los labios”, dice ella. “Algunas personas piensan que estamos viendo fonemas y encadenándolos en palabras. No funciona nada de eso. Estamos viendo palabras y poniéndolas juntas en oraciones “. El contexto lo es todo para un lector de labios, porque, bueno, el contexto lo es todo para cualquiera que intente comprender el habla, independientemente de qué sentido se esté utilizando. Si puede engañar a un lector de labios para que confunda las palabras “bola” y “toro” no refleja la precisión del mundo real, porque es poco probable que esas palabras se usen de una manera que no aclare cuál es la intención: “El perro quiere que le tires su toro “.

 

No muchos estudios reconocen nada de esto, aunque uno de 2000 , en la revista Percepción y psicofísica , lo hizo. En él, los investigadores examinaron las habilidades de lectura de labios entre las personas con discapacidad auditiva (IH, en el estudio) y la audición normal. De manera crucial, estaba evaluando la capacidad de comprender oraciones completas en lugar de solo fonemas. “La percepción visual del habla en lectores de labios IH altamente calificados es similar en precisión a la percepción auditiva del habla en condiciones de escucha algo difíciles o algo favorables”, concluyeron los investigadores. Esto sigue con lo que González me dijo: Lipreading, una vez que eres realmente bueno en eso, es más o menos equivalente a entender a un orador en un restaurante ocupado.

 


La lectura de labios es, en la comunidad sorda , a veces denominada técnica “oralista”. El oralismo se refiere al énfasis en tratar de interpretar el habla en lugar de crear una forma alternativa de comunicación, a saber, el lenguaje de señas. La mayoría de los países desarrollados han experimentado un impulso para alejarse del oralismo hacia el lenguaje de señas; ahora hay docenas de diferentes lenguajes de signos en todo el mundo. Casi se considera ofensivo, para algunos, enfatizar la lectura de labios en lugar de una forma de comunicación que no ponga en desventaja a las personas sordas.

 

Debido a eso, generalmente son los pobres y, a menudo, los analfabetos quienes confían en la lectura de labios. González es una verdadera excepción aquí, como alguien que se ha ganado la vida leyendo los labios. En países como India y China, con altas tasas de analfabetismo entre los sordos y recursos reducidos para la enseñanza, el oralismo sigue siendo popular, pero no está muy bien documentado.

 

Existe un cuerpo de literatura sobre lectura de labios en varios idiomas que no son inglés, pero no aclaran las cosas. El problema al tratar de encontrar el lenguaje más difícil de leer es que la lectura de labios se basa en gran medida en el individuo, y la mayoría de los mejores lectores de labios en cada idioma, los que dependen de él, no aparecen en los estudios. Así que descubrir cómo las cosas difieren de un idioma a otro requiere muchas conjeturas. “Es difícil saberlo objetivamente, porque nuestra experiencia con un idioma en particular informa cómo prestamos atención a ciertas cosas”, dice Masapollo. “Lo que podría ser difícil para un hablante de inglés podría no ser difícil para un hablante japonés. Depende mucho de la experiencia “.

 

Mi primer pensamiento fue averiguar qué fonemas son especialmente difíciles de distinguir, bajo el supuesto de que un lenguaje que tiene más de esos debe ser más difícil de leer, ¿verdad? Hay datos sobre esto: un estudio sueco del Journal of Speech, Language and Hearing Research en 2006 incluye una tabla de los fonemas que fueron más difíciles de adivinar correctamente al leer los labios. A veces, estos fonemas se colocan en grupos junto con fonemas de aspecto similar, llamados “visemas” (aunque no todos piensan que las divisiones son tan simples como eso suena).

 

Según ese estudio, el fonema más difícil es el que no existe en inglés; es el sonido entre “th” y “d”, común en los idiomas del sur de Asia como el hindi. (La palabra “Hindi” en sí, pronunciada correctamente, contiene el sonido.) En general, los sonidos más difíciles de percibir son aquellos para los que muy poco sucede en los labios: consonantes como “d”, “g”, “n” y “K”, todo parte de un viseme. (Naturalmente, a menudo se puede usar el contexto para distinguir “punto”, “conseguido”, “no” e incluso “nudo”).

 

Pero el hecho de que los sonidos se hagan sin los labios no significa necesariamente que sean invisibles para un lector de labios, tal vez más exactamente como un “lector de voz”. Le envié a González un video de un hombre que hablaba Jul’hoan, que se habla en partes de Namibia y Botswana. El idioma tiene una cantidad increíblemente grande de consonantes, incluidas docenas de clics. Encontró que esto no era difícil de detectar: ​​los labios pueden no moverse de la misma manera que una consonante inglesa, pero el movimiento de la lengua, las mejillas, la mandíbula y los músculos del cuello se los hicieron evidentes. Por supuesto, ella no habla Jul’hoan, por lo que no puede decir si sería fácil o difícil de leer. Quizás de manera previsible, no hay estudios sobre la lectura de labios de Jul’hoan, pero no parece imposible que un lenguaje con consonantes sea legible.

 

Otro elemento de algunos idiomas que podría presentar dificultades para leer los labios proviene de los tonos. Muchos idiomas en todo el mundo son tonales, lo que significa que dependen del tono para transmitir significado, casi como una canción. El inglés es apenas tonal (aunque elevamos el tono al final de una oración para transmitir preguntas), pero algunos idiomas tienen una gran cantidad de tonos complejos que son vitales para comprenderlos. Los tonos son producidos por la laringe y pueden no requerir ningún movimiento perceptible de la lengua, labios, mejillas o mandíbula. ¿Pueden ser percibidos visualmente?

  Cultural factors, from mustaches to covering one's mouth, can greatly impact the ability to lipread. Los factores culturales, desde el bigote hasta cubrirse la boca, pueden afectar en gran medida la capacidad de leer los labios.

Bueno, sí, pensamos. Un estudio de 2008, publicado en Journal of the Acoustical Society of America , probó la comprensión tonal de la lectura del habla en mandarín, que tiene cuatro tonos, o cinco si incluye el ” tono neutral “. Ese estudio evaluó a sujetos con audición normal que dominaban el mandarín, y descubrió que, al principio, eran terribles para detectar tonos en el habla sin audio. Pero después de solo 45 minutos de entrenamiento, mejoraron drásticamente. Esas sesiones enseñaron a los sujetos a observar los movimientos del cuello, la barbilla y la cabeza, porque ciertas caídas, extensiones y vibraciones que pueden indicar el tono resultan bastante fáciles de detectar.

 

Todavía otros idiomas dependen en gran medida de otra clase de sonidos hechos sin mucho de los labios, es decir, al usar la laringe o crear un sonido en la garganta. Algunos idiomas tienen muchos sonidos guturales, incluidos el galés, el hebreo y el holandés, que tienen varias consonantes en la parte posterior de la cavidad bucal. La investigación no es muy concluyente sobre si estos sonidos son más difíciles de leer. Algunos estudios sugieren que los fonemas guturales se confunden fácilmente o son más difíciles de detectar. Pero tienen el mismo problema que “bola / toro”. El hecho de que un lector de labios experto no pueda ver un sonido no significa que no sepa que está ahí.

 

Lo que en realidad podría dificultar la lectura de labios no tiene nada que ver con el lenguaje: es la personalidad. “Algunas personas son muy tímidas, no muevan sus caras o labios”, dice González. “No mucho en cuanto a expresiones. Eso lo hace más difícil “. Como hemos visto, la lectura de labios implica mucho más que los labios: toda la cara, la cabeza e incluso el resto del cuerpo proporcionan información crítica. Si alguien no es muy expresivo, no está usando todas las señales que emplea un lector de labios experto, entonces, dice González, puede ser difícil de leer.

 

Los estudios que analizan el panorama general de las pistas del lenguaje visual son un poco difíciles de interpretar y apuntan a muchas generalizaciones amplias. Un estudio de la Universidad de Kumamoto encontró que los angloparlantes dependen mucho más de la información visual que los hablantes japoneses. Otro descubrió que los hablantes japoneses muestran mucha menos emoción en sus expresiones faciales que los europeos occidentales. El contacto visual podría considerarse algo grosero en Japón, lo que reduce aún más la conductividad del lenguaje para la lectura del habla. También ha habido un análisis de una tendencia japonesa a cubrirse la boca con una mano, especialmente para las mujeres mientras se ríen. Realmente no hay suficientes datos concretos sobre eso para sacar algún tipo de conclusión, pero cualquier forma de ocultar los labios haría una tarea ya difícil mucho más difícil. Eso incluso se aplica a barbas y bigotes. Dice González. “Un bigote que cae sobre el labio superior puede afectar la capacidad de ver lo que está sucediendo”.

 


Entonces, ¿dónde nos deja eso en nuestra pregunta central sobre qué idioma es el más difícil de entender a partir de las señales visuales? “La respuesta corta es que no lo sabemos”, dice Masapollo.

 

Esto es comprensible, aunque no muy satisfactorio, pero tengo algunas teorías. Nomino al hebreo como uno, debido a su combinación de una gran cantidad de sonidos guturales y una gran cantidad de hablantes que son judíos observantes y usan largas barbas. Ese estudio sueco apuntó a idiomas como el hindi, el tamil y el gujarati, todos hablados en la India, que también es quizás el país más bigotudo del planeta. El japonés también debe considerarse, gracias a un montón de cosas culturales que pueden reducir la conexión entre la visión y el habla. Echaré en checheno, porque tiene un número tan sorprendente de consonantes y vocales, alrededor de 50 de cada uno, incluido un montón de sonidos que se hacen en la boca y la garganta. En el extremo opuesto del espectro se encuentra Pirahã, un idioma hablado por unos cientos de personas en la Amazonía brasileña. Pirahã tiene tan pocos fonemas como un idioma puede tener, lo cual sospecho que haría que muchas palabras se vean iguales. También es un lenguaje tonal y puede estar sustancialmente informado por el ritmo; nadie está muy seguro. (Es uno de los lenguajes más misteriosos y controvertidos del planeta).

 

No hay una buena respuesta a la pregunta, pero, de nuevo, hay muy pocas buenas respuestas a cualquier pregunta sobre la lectura de labios.

 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

También te pueden interesar