Tras la pista de las voces: reconocer el habla para resolver casos

Nuestro Día - 7/6/2022 - Duracion: 29:40

Transcripción

00:00:04El tema que vamos a charlar, ahora sí, menos mal que tenemos a alguien que nos lo explique bien
00:00:10porque podríamos estar horas tratando de y podríamos chamuyar y yo podría tirar 1000 películas sin
00:00:17dudas y podríamos meter toda la lo que aprendimos en las escuelas de periodismo, que no hay que
00:00:23hacer de de, de extendernos, con palabrerío y demás.
00:00:27Es realmente apasionante y tiene que ver con una pata forense que acá no habíamos charlado nunca.
00:00:34Todavía no, nunca he y no va a ser la primera vez o por lo menos sí.
00:00:38Con respecto a este desarrollo, sí es cierto que nuestro país tiene como una tradición interesante
00:00:45por el por los peritajes.
00:00:47Quiero decir, no sé, pienso en el en el equipo de antropología forense, pienso en tu misma policía.
00:00:52Fueguina, que cuenta con el único registro de Pisa de Argentina y decir, son muchos casos.
00:00:57Tenemos una tradición importante y venimos a decir a nivel nacional de de perseguir a los que
00:01:03merecen justicia.
00:01:04De hecho hay muy pocos países en nuestra región que han perseguido a los militares como los hemos
00:01:08perseguido nosotros y seguiremos haciéndolo en este caso.
00:01:11Tiene un poco que ver con lo que estoy contando, pero por una línea medio aparte estamos hablando de
00:01:16distintos software de desarrollo nacionales que tienen como intención seguir las pistas de las voces
00:01:22en las escenas del crimen.
00:01:23Ajá, que es algo muy interesante.
00:01:25Estamos viviendo una época en donde.
00:01:27Vimos muchas cámaras de seguridad donde muchas de nuestras comunicaciones pasan a través de las
00:01:31redes sociales o del mensajero de Facebook o la mensajería de Instagram.
00:01:35Mismo WhatsApp, quiero decir, o cualquier red social que les ocurra la voz empieza a tener
00:01:39nuevamente una función muy pero muy importante, y obviamente también es así en el mundo del delito,
00:01:45por decirlo de alguna manera.
00:01:46En este caso hablamos de 2 sistemas de reconocimiento de voz, con lo que se están reconstruyendo
00:01:51casos judiciales en nuestro país.
00:01:53Hablamos de before I Florencia, así que para hablar de estos desarrollos.
00:01:57Vamos a conversar con Jorge Bucay y les director del laboratorio de investigaciones sensoriales
00:02:03conocido como inem de uva Conicet y miembro también del programa ciencia y justicia del Conicet, y
00:02:08nos está escuchando en este momento.
00:02:10¿Qué tal Jorge?
00:02:11¿Cómo te va?
00:02:11Buenos días.
00:02:11Gracias por estar acá nuestro día.
00:02:14¿Hola, qué tal, cómo estás?
00:02:15Bien, muy bien, un placer.
00:02:18Tenerte acá, bueno, hacíamos esa presentación un tanto un tanto rústica, no sé si me habré
00:02:22equivocado en algo, pero en principio es muy interesante siempre ver que que nuestro país va como un
00:02:27poco a la vanguardia de de los distintos de los distintos países de nuestra región y sobre todo como
00:02:32una creatividad muy, muy particular, que nos puedes contar sobre Eva Perfore y Florencia.
00:02:37Y si no tenes que corregir, corregirnos.
00:02:39Obviamente, novela está todo muy, muy correcto, intuitivo, lo de la tradición me acordaba de
00:02:47Vucetich con.
00:02:48Las huellas digitales, ahí está, tienes razón, mira, mira, ahí.
00:02:52Ahí tienes un ejemplo fuertísimo que se que están.
00:02:56Dio en todo el mundo Nobel.
00:02:59Bueno, con respecto a estos software o sistemas que hemos desarrollado.
00:03:06El, los nombres evocan lo que significa la evaluación perceptual en, en caso forenses, o sea, iba a
00:03:17pedir por el Ford.
00:03:20Viene de.
00:03:22Acaso, por ende, bien bien, en realidad, lo primero que desarrollamos fue potencia.
00:03:29Florencia es un sistema automático de identificación de hablantes y lo gracioso de todo esto fue que
00:03:40surgió por un concurso, un concurso que se hizo en Estados Unidos.
00:03:45Sí.
00:03:46Y nosotros veníamos trabajando en la fonética del español de la Argentina, comparando nuestro sonido
00:03:55con lenguas como el japonés, el alemán, viendo las similitudes, las diferencias, así que teníamos ya
00:04:04muchos años de trabajo en lo que es la acústica.
00:04:11El análisis del habla vinculado a la fonética.
00:04:16También es decir, en un trabajo que era 10 inter disciplinario, donde hay lingüistas, ingenieros, yo
00:04:25soy ingeniero, hoy es el día del ingeniero, queridos.
00:04:30¿Ayer fue el día del ingeniero la razón?
00:04:35¿Sí, YY bueno, la gente de fonoaudiología, es decir, hay varias patas que hacen al tema de la
00:04:46comunicación por aula, no?
00:04:48El tema de la comunicación verbal.
00:04:52Que es apasionante desde ya entender como el que hablamos.
00:04:56¿Cómo es que reconocemos?
00:04:58Y este concurso que se planteó desde una oficina de de especial que tienen dedicadas AO dedicado a
00:05:12los forense.
00:05:14¿El organizó un concurso porque los investigadores?
00:05:18No actuábamos en el área forense.
00:05:21Si por una cuestión de de, digamos de imposibilidad técnica.
00:05:29Imagínate si yo comparo 2 voces y yo tengo una sola voz y tengo que decir de quienes tendría que
00:05:38tener una base de datos de todo el mundo, claro.
00:05:41No es cierto o por lo menos de todos los hablantes de una lengua.
00:05:47O por lo menos de todos los hablantes de una región.
00:05:51Así que que el investigador científico, no sólo acá, en todas partes, le escapaba a este problema y
00:06:01bueno, al escapar lo escaparse de este problema, bueno, surgieron fonetistas solicita que se
00:06:10llamaban súper expertos con un súper oído y que empezaron a hacer, digamos pericias.
00:06:19Para la justicia.
00:06:22Algunas correctas y otras para nada correctas.
00:06:26Entonces, qué hizo esta oficina de de de la de lo que es el Ministerio de Comercio, no de Estados
00:06:38Unidos, dijo, bueno, vamos a ver.
00:06:41¿Cómo está la cosa en el mundo?
00:06:43Vamos a hacer un una competencia, vamos a darle voces sin que sepan a quienes pertenecen y a los
00:06:52distintos laboratorios de todo el mundo les enviaron a estos pares de voces y en cada laboratorio se
00:07:01debía definir si eran de la misma o de distintas personas que estaban hablando.
00:07:08Bueno, cuando nosotros.
00:07:12Recibimos ese anuncio, ese aviso, nos preguntamos, bueno, qué hacer si nos metíamos, nos metíamos.
00:07:21Al final nos jugamos, lo hicimos.
00:07:26Y.
00:07:28Te digo que nos fue muy bien, nos fue bastante bien, al punto que salimos una posición muy, digamos,
00:07:39alta del Tour de la Competencia.
00:07:42Le ganamos a países que.
00:07:45¿Como Rusia, como España con Italia que tenían antecedentes fuertes, no en el tema YY más que nada
00:07:56porque habían salido al mercado en mercado a nivel comercial, bueno, te imaginas el estímulo que
00:08:04significó eso?
00:08:05Nos nos metimos de lleno a desarrollar un producto, armamos lo que se llama una empresa de base
00:08:15tecnológica en el conicet.
00:08:18Y empezamos a hacer la difusión a nivel local.
00:08:24En este sistema automático utiliza técnicas de procesamiento digital de voz ajá bastante
00:08:34sofisticada.
00:08:35Sé que tienen que ver con el análisis digital.
00:08:39La comparación de estos rasgos distintivos del habla y de la voz YYA.
00:08:47Partir de ahí, el uno puede sacar una distancia, vamos a llamarlo hace una distancia entre las 2
00:08:55voces.
00:08:56Y lo cierto es que ninguna persona habla de la misma forma en 2 circunstancias distintas, claro, así
00:09:05que siempre hay una distancia distinta de cero, aún cuando se trate del mismo locutor.
00:09:11Mira si ese tal es así, que esa variabilidad que se llama la variabilidad propia del hablante.
00:09:21Ese se espera y, de hecho, muchas veces ocurre que ocurre que sea mucho menor que la variabilidad
00:09:29que hay con otros hablantes, así que es un tema este más que nada de variabilidad y termino
00:09:37variabilidad evoca a la probabilidad, es decir, cuando uno compara voces no puede decir nunca si
00:09:47éste está la voz, pero sin dar una relación de probabilidades.
00:09:52Claro, me imagino que eso, pero la justicia debe ser sumamente útil.
00:09:55¿En qué casos de digo me animo a decir policiales?
00:10:00¿Se se pudo utilizar esto, pensamos en, no sé, me imagino en conversaciones telefónicas vinculadas
00:10:04AA corrupción a narcotráfico, pero tienen historial estas herramientas de de haber resuelto
00:10:09crímenes?
00:10:10Bueno, primero debe decir que hay un aspecto de confidencialidad en todo esto.
00:10:17Pero es en principio tanto gendarmería nacional, es decir, la fuerza de seguridad Policía federal en
00:10:29todas las que responden al Ministerio de Seguridad se han utilizado nuestros desarrollos.
00:10:37Por otro lado están las defensorías Eh y las fiscalías en el ámbito judicial, así que hay más de 100
00:10:47casos ya que han resuelto.
00:10:50¿En donde han utilizado?
00:10:53¿Que nuestro sistema y en principio lo que nosotros hacemos es asesorar a los peritos que trabajan
00:11:04en las instituciones, pero también le damos servicio cuando lo solicitan, Eh?
00:11:10Se pueden comunicar con la página que se llama Black Box.
00:11:16Black como negro y Vox con ve corta, OXO también el conicet en el conicet tenemos el programa de
00:11:27ciencia y justicia que no sólo se dedica a estos temas de del habla y de la voz, sino a todos los
00:11:37temas de especialidad que que desarrollan los investigadores, es un tema que quizás les.
00:11:46Vea más cercano es el de las noticias falsas, mira, ajá.
00:11:53¿Vieron que se habla de las fake news?
00:11:56Sí.
00:11:59Pero a veces esas fake news son grabaciones de voz dicha por un individuo que dice, bueno, que
00:12:08agrede o dice obscenidades o ataca otra persona.
00:12:14Vamos a resumirlo, un supuesto agresor.
00:12:18EO sí o alguien que dice algo que.
00:12:25Diciendo que es una persona determinada, pero con un tono subido, el de agresión y de de abuso.
00:12:35¿Sí entonces, qué ocurre?
00:12:37¿En esos casos?
00:12:40Se trata de determinar si efectivamente el que está hablando es el que dice ser o es un imitador que
00:12:49le hace decir cualquier cosa.
00:12:52Bueno, en ese plano también hemos actuado, no sólo acá en el país, sino en Uruguay, en Colombia,
00:13:00ajá.
00:13:02En Colombia hay mucho interés hay, hay distintas.
00:13:07ONGO instituciones así de de apoyo a la comunidad, Jorge, y Decís que específicamente de Colombia,
00:13:17es que que que que han convocado estos servicios porque también es para este asunto, para corroborar
00:13:22si.
00:13:23Sii voces que se utilizan para para difundir fake news efectivamente, son verdaderas.
00:13:29Exactamente el tema de las fake news hace que.
00:13:36Que se quiera, como decimos, que verificar que la persona que habla en forma agresiva es quien dice
00:13:48ser y bueno, en Colombia, sucedido con en el ámbito político.
00:13:54Lo mismo en Uruguay.
00:13:57Nos han estas instituciones de estas ONG que están así a la búsqueda de de noticias que que deben
00:14:10ser verificadas comprobadas.
00:14:13¿Bueno, en en época electoral te imaginas que hay de todo?
00:14:18Es verdad, y sí que que recuerdo un caso en Uruguay, donde nos solicitan comprobar un unos bichos y
00:14:33bueno, nosotros pro.
00:14:36Empezamos a trabajar, nos dijeron, bueno, que lo necesitaban.
00:14:39Urgente dijimos, bueno, por lo menos necesitamos un día para hacer todo el procesamiento, imagínate,
00:14:47hay que cortar, evitar las voces, hay que prepararlas y mira lo que pasó.
00:14:55Al otro día el el, el personaje, digamos en cuestión, da una conferencia de prensa y esta oenegé le
00:15:07dice, bueno, nosotros ya hemos solicitado al conicet de la Argentina que que evalúe esa grabación
00:15:17que usted dice que no es suya y ya nos están mandando el resultado.
00:15:24Bueno ahí.
00:15:26Nos contó, salió inclusive en en los diarios digitales.
00:15:31Este hombre dio un vuelco y dijo, bueno, sí, yo la conozco a la persona, yo le dije eso, pero en
00:15:39forma amistosa.
00:15:40¿Así que sólo la mención salió marcha atrás, viendo, pues, analizada su voz y le agarró un ataque de
00:15:52nervios YY confesó lo que había sido el te imaginas que efectividad?
00:15:59Es decir, cuando uno habla de ADN o habla de otras evidencias que que a veces realmente pueden ser
00:16:09más importantes en cuanto a efectividad, la voz tiene un componente emocional y individual tan
00:16:18grande que que bueno, que que a veces tiene mucho más efecto decir no, usted es el que dijo esto,
00:16:28usted es.
00:16:30El el que está acá en esta cuestión, o sea, tiene un un factor de personal, la voz en cada uno de
00:16:38nosotros.
00:16:40Que cuando la escuchamos, nuestra propia voz no, realmente hay que saber eludir muy bien para no
00:16:49admitir que tu voz, no sé si me explico, pero si si hay un componente, digamos el de emoción propia,
00:16:58que le da un valor tremendo, imagínate en este caso ni hicimos la pericia y sólo el hecho de
00:17:05mencionar que que había venido acá el conicet lo hizo confesar.
00:17:11Así que hay muchos casos que evidentemente tienen que llegar al juez.
00:17:18El juez es el que decide, eso es lo que hay que poner en claro.
00:17:23No es el perrito, no somos nosotros, no son las OMG, no es el el, digamos, el juzgado el que decide
00:17:36uno le acerca a la probabilidad.
00:17:39Le dice, bueno, estas 2 voces tienen una probabilidad de ser.
00:17:44¿De la misma persona, de tanto, EH que?
00:17:49Y luego es el juez que toma esa evidencia y luego con otras evidencias hace la determinación final,
00:17:58pero acá lo importante es transmitir que sea el juez, o sea una oenegé.
00:18:04¿O sea que un juez es siempre hay que tomar él los resultados de una pericia de voz, como una
00:18:12probabilidad?
00:18:13Nunca es sí.
00:18:14¿Oh, no hay unos pocos casos donde uno puede decir si es o no, no es cuando se habla de una
00:18:23identificación, el suponete entre cuatro o 5 personas, y vos sabéis ya de antemano que uno de los
00:18:32cuatro fue el que dijo tal cosa, entonces ahí como esa distanciada menor con ese que habló, qué dijo
00:18:42tal cosa entonces?
00:18:43Ahí sí.
00:18:44¿Por qué?
00:18:45¿Qué pasa?
00:18:46¿Estoy comparando con un individuo respecto de otros 3, entonces llamalo 3, cuatro o 10?
00:18:57Pero cuando se trata de 100,000 personas hay que hablar de probabilidad.
00:19:05Y entonces esto empieza a funcionar cuando uno tiene una base de datos representativa de las voces
00:19:14de una población, ese es otro tema, digamos a discutir.
00:19:20Polémico porque.
00:19:22Así como ponemos la huella digital o el iris o el ADN, es lícito tener grabadas las voces de las
00:19:34personas, dice aceptable.
00:19:37¿Bueno, ese es un tema que se va a venir de discusión, Eh?
00:19:43Por cuestiones éticas el hay un registro de violadores en donde se guarda el ADN.
00:19:53Se toma el alivio porque normalmente el violador reincidente y entonces ahí se está pensando que en
00:20:01caso muy específicos sí se puedan tener bases de datos de box, claro, pero es todo un camino que hay
00:20:09que recorrer.
00:20:10No es todo un camino de de aceptación y de y normativa para no digamos ir por encima de los derechos
00:20:21de cada individuo.
00:20:23Mhm es que, como es como siempre, está abierto, es como siempre la cuestión de seg.
00:20:30¿Seguridad o en libertad?
00:20:31No como estamos ahí, siempre la humanidad, midiendo un poquito un poquito.
00:20:37Sí, tal cual, da igual.
00:20:39¿De todas maneras, esto sirve para entender que hay 2 formas de hacer la identificación, una, cuando
00:20:47vos tenés una voz que no sabes de quién es, ajá y tenés posibles sospechosos, no?
00:20:55Eh, pero no no tenés la certeza, tenes sospechosos, entonces uno compara esa voz con un sospechoso,
00:21:04pero eso tiene que estar dentro de un marco.
00:21:07De referencia que son las voces de la población donde donde viven esas personas porque eso da una
00:21:18referencia de si la distancia es realmente corta o es o es mucha OO es grande.
00:21:25Claro, y es muy distinto, como se ve en las películas.
00:21:30Qué bueno, eso es.
00:21:32Es una pelicula donde uno dice, Ah, bueno, es fulano de tal, imagínate para decir eso tendría que
00:21:41tener ya de antemano las voces grabadas de de media población, no, entonces esto de la del de la
00:21:54primer situación donde vos tenés base de datos, anonima anonima que no, no, no, no.
00:22:01No necesariamente se sabe la identidad de los que están en la base, pero si esas voces sirven para
00:22:07darle el marco de referencia a la distancia, cuando vos comparas 2 voces, no sé si eso no es tan
00:22:17sencillo de entender porque hay una probabilidad de similitud dividido o en relación a una
00:22:26probabilidad de que pueda ser cualquier otro.
00:22:29Entonces ese es una relación de probabilidades.
00:22:33Bueno, es un tema de estadística de de probabilidad, que se suma a lo que hablábamos de los rasgos
00:22:43distintivos de una persona.
00:22:46De hecho, nosotros identificamos a nuestros familiares o amigos porque ya tenemos en esta memoria de
00:22:54largo plazo tenemos rasgos distintivos, pero a veces nos equivocamos entonces.
00:23:02Está el sistema automático que hemos desarrollado, ya te digo que compite a nivel internacional.
00:23:10¿En precio y en calidad es es realmente muy interesante lo que se ha logrado, EH?
00:23:18Con investigadores aquí en el laboratorio.
00:23:22Y por otro lado, está la forma de identificar más antigua del mundo, que es con la oreja.
00:23:29¿Claro, Eh?
00:23:29¿Yo escucho la proposición, digo, si estos 2 tipos me parecen que son el mismo o estas 2 personas
00:23:37son las mismas, la que está hablando, pero qie ocurre en ciencia?
00:23:43Hay que normalizar esa comparación, entonces no la hace una sola persona.
00:23:48La tienen que hacer por lo menos 3 o 5 personas.
00:23:53Y además evaluar no una impresión general.
00:23:58Hay que desmenuzar la voz y decirle, bueno la entonación, el timbre, el acento, la intensidad, la
00:24:08frecuencia de vibración de los pliegues vocales o la frecuencia fundamental, el grado de aspereza
00:24:15que tiene la voz, el grado de escape de aire sopló al hablar bueno, los locutores saben muy bien.
00:24:24¿Estos aspectos de la calidad de la voz YY entonces, ahí se desmenuzan 17 parámetros o rasgos que
00:24:37son comparados uno por uno y en cada uno de ellos hay que ver si son típicos de la región o no,
00:24:46supone que podemos escuchar una voz nasal o gangosa?
00:24:51¿Quieres esa chao?
00:24:52Ya esta es.
00:24:54Los las 2 voces son muy naturales, tiene que ser el mismo momento, tal vez en ese en ese lugar donde
00:25:05viven las personas, todos hablan con una salida clara e imagínate en Brasil que hay tan tan típicas
00:25:14la nacionalidad bueno, hay aspectos que tienen que ver con lo que es el típico del lugar y entonces
00:25:23eso también.
00:25:25Se tiene que evaluar y considerar no para cada para cada comparación qie valor me que me quede con
00:25:33ese.
00:25:33Con el dato de los los 17 rasgos que deja la voz, lo pongo consciente que es uno de de todas las
00:25:39pruebas que va dejando cuando habla un peligro, sobre todo si vivimos de hablar, como es nuestro
00:25:44caso Jorge.
00:25:44Así que vamos a tener más cuidado con lo que decimos.
00:25:48No, no, no, no, pero a ver si vos te comes el sonido, ese sí y todos lo sé, digamos.
00:25:58Lo anulan, bueno, que no te digo que seas normal, pero eso es lo típico, claro y no va a llamar la
00:26:06atención el mira.
00:26:09Hay rasgos como él, decía.
00:26:13La nacionalidad la articula la forma de articular la forma de decir, cada fonema de de tu.
00:26:23Sistema no fonológico, esto es más técnico, pero cada fonemas va a tener un rasgo en realidad.
00:26:30Cada problema tiene varios rasgos, pero va a haber uno que va a sobresalir y el oído entrenado lo
00:26:37reconoce.
00:26:40Ese es el sistema perceptual, o sea, se necesita gente entrenada.
00:26:44Claro.
00:26:45Si el factor humano, como decimos siempre.
00:26:48Sí, ahora de todas maneras, Fíjate que al juez.
00:26:53¿Le interesa muchísimo tener la impresión humana, porque si vos te dejas llevar por lo que te dice
00:27:03una máquina o decir, bueno, y cómo se esta máquina ahora?
00:27:10Si comparas la respuesta humana y la respuesta de la máquina y coinciden, ahí está listo el asunto,
00:27:20es decir, la respuesta humana, aunque no sea tan eficiente como la máquina.
00:27:26De hecho, no lo es.
00:27:28La máquina supera por la cantidad de cálculos y de rasgos que puede comparar y analizar, pero si vos
00:27:37tenés una evaluación humana que.
00:27:40Que apoya la de la máquina, entonces ahí es mucho más contundente.
00:27:46Claro que por eso se busca todavía la comparación hecha por un humano porque tiene un valor también
00:27:57simbólico, no como respuesta, ahora, si no coinciden ahí, bueno, ahí hay que seguir analizando.
00:28:07Hay que seguir buscando muy bien.
00:28:09Bueno, muy interesante Jorge, te agradecemos un un montón el tiempo bueno.
00:28:14Y no analizar estas cosas porque vamos a seguir metidos ahí en la cuestión de por qué de repente los
00:28:19la pasión de los argentinos por el peritaje y lo bueno que nos hemos vuelto en eso vamos a seguir
00:28:24estudiando asique gracias por haber pasado por nuestro día Jorge de verdad.
00:28:28No, genial, genial, que lo puedan difundir y que puedan difundir también que él está abocado a
00:28:37mejorar la justicia, no no directamente, pero a través de servicios a al sistema y a todos los
00:28:46actores del del sistema judicial, decirle bueno, acá están, los investigadores usen los aprovechen,
00:28:54los, cada uno en su área y en su especialidad.
00:28:58No, así es, eso es eso es lo que quiero yo transmitir.
00:29:02¿Y después, bueno, el acérquense al Comité de hay páginas donde se pueden visitarnos?
00:29:11No son tan tremendamente técnicas.
00:29:15Sí que.
00:29:17Que necesite algo desde un trabajo hasta un asesoramiento, vayan al conicet, que hay mucha gente
00:29:25dispuesta, queda hecha la invitación, nada más, un gran abrazo y que tengas un lindo día Jorge,