#YoHago Hernán San Martín, Director del Laboratorio de Mecatrónica de la Facultad del Ejército
Radio Con Vos - 15/2/2024 - Duracion: 17:40
Transcripción
00:00:00Pero hay una historia que no quería
00:00:02dejar de compartir con ustedes y que
00:00:04viene a alimentar la edición del yo hago
00:00:08de hoy yo hago es una sección donde
00:00:10nosotros nos metemos en el laburo de
00:00:12alguien es el laburo en general de
00:00:14alguien que nos resulta muy llamativo
00:00:18que no sabemos cómo se hace eh o de
00:00:21alguien que tiene un trabajo muy común
00:00:23pero que tampoco sabemos cómo se hace
00:00:25acá una vez por semana vamos a recibir a
00:00:28quienes tengan este tipo de trabajo y
00:00:30nos vamos a meter en su laburo en este
00:00:32caso me enteré de qué hace Hernán que
00:00:36nos visita hoy por una nota que hizo en
00:00:38la televisión pública nuestra colega
00:00:40Verónica González Verónica González es
00:00:43periodista es ciega trabaja en la
00:00:46televisión pública y escucha pasaron
00:00:47cosas muchas veces me comenta algunas
00:00:50notas o momentos del programa pero en
00:00:53este caso lo que mostró por primera vez
00:00:56en televisión fue Cómo habla ahora
00:01:00después de haber recibido una novedosa
00:01:03terapia y un sistema para hacerlo de
00:01:06esta manera Cómo habla ahora Jorge Rivas
00:01:09se acuerdan de Jorge Rivas Jorge Rivas
00:01:12fue diputado nacional fue vicejefe de
00:01:15gabinete de la nación en el primer
00:01:18gobierno de Néstor kishen cuando todavía
00:01:20hablaban de la transversalidad y había
00:01:24distintas identidades políticas que se
00:01:26estaban fusionando con el kismo Bueno
00:01:28arrias lo saltan eh se golpea fuerte feo
00:01:32y queda cuadripléjico y sin habla eh
00:01:36pero con la capacidad intelectual
00:01:38intacta bueno eh A través de un software
00:01:41empezó a comunicarse con un software que
00:01:43hablaba mecánico así como un robot
00:01:45durante mucho tiempo fue diputado habló
00:01:48en las sesiones de diputado eh Como
00:01:50diputado con esa voz pero ahora empezó a
00:01:53hablar con una voz muy parecida a la que
00:01:56él tenía antes del golpe y esto es
00:02:00consecuencia de un laburo con
00:02:01Inteligencia artificial alucinante que
00:02:04ahora te vas a enterar Cómo se hace pero
00:02:06Rivas Nos mandó un saludo y nos mandó un
00:02:08saludo con su voz escucha volver a
00:02:11escucharme después de 16 años fue para
00:02:13mí muy fuerte y movilizador solo te
00:02:15cuento para dimensionar la importancia
00:02:18que este proyecto tiene para quienes
00:02:20hemos perdido el habla una anécdota que
00:02:23vale más que 1 palabras al primero que
00:02:25le avisé que me habían entregado el
00:02:27nuevo software fue a mi viejo a través
00:02:30de un mensaje de voz me devolvió el
00:02:32mensaje llorando Así que Hernán Gracias
00:02:35y a través tuyo algo extensivo el
00:02:38agradecimiento a todos y todas y a
00:02:40nuestra querida universidad
00:02:43pública Qué grande Hernán a quien se
00:02:45refiere es Hernán San Martín ingeniero
00:02:48electrónico parte del laboratorio de
00:02:50mecatrónica de la facultad de ingeniería
00:02:53del ejército yo ni sabía que existía eso
00:02:56boludo bienvenido Buenas tardes gracias
00:02:58por venir Cómo estás Muchas gracias por
00:03:00la invitación s mi hijo si cuando le
00:03:03haga Escuchar esto ahora está en la
00:03:04Colonia pero cuando le haga Escuchar
00:03:05esto se vuelve loco
00:03:07mecatrónica la verdad que es muy
00:03:08interesante Sí sí sí es una disciplina
00:03:11que combina varias cosas Y que bueno hoy
00:03:13está en boga porque digamos todo lo que
00:03:15son drones impresoras 3D Inteligencia
00:03:17artificial robótica se puede meter
00:03:19dentro de la mecatrónica de alguna
00:03:21manera Claro claro bueno ustedes eh
00:03:23hicieron esto eh No solos no sino con
00:03:26otra gente exactamente Es un proyecto
00:03:28conjunto con la universidad eh
00:03:29tecnología nacional la sede de la plata
00:03:31bien está la utn y la Facultad de
00:03:34ingeniería del ejército eh Y lo que
00:03:37hicieron para que él pueda hablar con su
00:03:40voz Qué es Mira nosotros teníamos
00:03:42registros e como comentas vos de las
00:03:45sesiones en las cuales estuvo
00:03:46participando Y a partir de eso lo que se
00:03:48hace es Se entrena un modelo este de
00:03:50Inteligencia artificial y lo que haces
00:03:53es con esas muestras poder generar un
00:03:56software a partir del cual él va
00:03:59escribiendo y sale su voz como como la
00:04:02tenía digamos antes para eso vos
00:04:04necesariamente tenés que tener registros
00:04:05de cómo tenía digamos la voz el usuario
00:04:08el paciente antes del incidente que que
00:04:11haya sufrido Bueno pero ahora todo el
00:04:12mundo tiene registro de su propia voz
00:04:14porque todos mandamos mensajes de audio
00:04:15por ejemplo esto de cara al futuro va a
00:04:18ser espectacular porque ya no va a ser
00:04:19tan difícil digamos encontrar registros
00:04:21de buena calidad más aún hay iniciativas
00:04:23donde la gente empieza como a guardar su
00:04:26un registro de buena calidad de buena
00:04:28adicción e de una longitud determinada
00:04:31de características del audio determinada
00:04:33para que en caso de que esto pase Dios
00:04:35no quiera bueno se pueda Reproducir la
00:04:38voz sin demasiados problemas Cómo habla
00:04:39exactamente Jorge cómo cómo es que él
00:04:42elige las palabras bueno el proceso en
00:04:44el caso de Jorge es más complejo porque
00:04:45él tiene mucha reducción del movimiento
00:04:48entonces tiene un un software que le
00:04:50traquea el movimiento de la cabeza con
00:04:52eso va posicionando el cursor sobre un
00:04:54teclado digital que aparece en pantalla
00:04:56y cuando el cursor está sobre la tecla
00:04:59que él qui apretar él tiene movilidad en
00:05:01uno de los dedos aieta click sobre
00:05:03digamos el Mouse y ahí selecciona la
00:05:05letra eso es Letra por letra o tiene
00:05:06como un predictivo es Letra por letra y
00:05:09tiene un un predictor que es mejorable
00:05:11pero digamos tiene un predictor Para
00:05:13algunas palabras que ya están
00:05:14previamente grabadas o bueno como
00:05:16WhatsApp o el mail digamos claro o sea
00:05:19él habla a la velocidad que
00:05:21eh escribe pero con la con la mirada
00:05:24digamos exactamente exactamente o
00:05:27sea para entrevist y demás cuestiones lo
00:05:30que hace muchas veces es grabar
00:05:31previamente el mensaje para que después
00:05:33ya lo pueda Reproducir pero en una
00:05:35conversación este digamos cara a cara
00:05:37con él eh Hay algunos tiempos donde él
00:05:39tiene que escribir digamos claro hay que
00:05:41dejarle un tiempo para que escriba o sea
00:05:44ustedes sobre lo que trabajaron Es sobre
00:05:46el audio el nuevo audio generado con su
00:05:49voz No tanto sobre el sistema de
00:05:51elección de las palabras también
00:05:52trabajamos sobre eso mejoramos la
00:05:54interface con la cual él se comunica con
00:05:56ese software y hay muchas etapas más
00:05:59como para mejorar todo lo que queda
00:06:00ahora es experiencia de usuario vos
00:06:02podés eh hacer más grandes más chicas
00:06:04las teclas repetir no sé la barra
00:06:06espaciadora en el medio imagínate que es
00:06:08bastante complejo y cansador tener que
00:06:10estar recorriendo el teclado con la
00:06:12cabeza Entonces él te va tirando eh
00:06:15algunas cosas que estarían buenos
00:06:17mejorar y bueno nos va realimentado para
00:06:19mejorar su experiencia Hernán para una
00:06:21persona que no tiene eh reducía la
00:06:23movilidad que simplemente el problema
00:06:26que tiene Es la falta de habla ahí
00:06:29directamente podría escribir y hablar a
00:06:32la velocidad que
00:06:34escribe sin ningún problema exactamente
00:06:37vos ahí tenés un proceso de de
00:06:39entrenamiento de la red neuronal para lo
00:06:41cual primero vos tendrías que cargar una
00:06:43muestra de tu voz con eso se hace
00:06:46digamos el entren lo que se llama
00:06:47entrenamiento a partir de que el sistema
00:06:49ya está entrenado cada vez que vos
00:06:51ingresá algo por teclado eso se llama
00:06:53inferir entonces vos haces una
00:06:55inferencia del audio de lo que estás
00:06:58ingresando de forma escrita Y entonces
00:07:01ahí tendrías el tiempo que se tarda en
00:07:03la inferencia en particular para estos
00:07:06proyectos que son como más de impacto
00:07:07social lo que buscamos es que el
00:07:09procesamiento sea en los mismos
00:07:11dispositivos Porque si vos lo tenés que
00:07:12hacer en la nube eso consume todo el
00:07:15tiempo tendrías que estar pagando
00:07:16permanentemente digamos un servidor Y
00:07:19eso no tendría impacto social Sería
00:07:21inviable para todo el público pero en
00:07:23quién pensas por ejemplo cuando decís
00:07:24esto lo pensamos con impacto social
00:07:26quién lo podría usar bueno La idea es
00:07:28que en próximas etapas nosotros podamos
00:07:29seguir desarrollando y esté abierto para
00:07:32todo el público en general Pero quién lo
00:07:33puede llegar a necesitar alguien que que
00:07:36se da un golpe por ejemplo claro
00:07:38cualquier persona que no pueda hablar
00:07:39por ejemplo hay gente que ha sufrido
00:07:41traqueotomía muy fuer pues tiene
00:07:43movilidad perfecta pero no sé tuvo un
00:07:45cáncer de garganta bueno no puede hablar
00:07:47Ah mira entonces a partir de ahí ahora
00:07:50estamos por ejemplo con con un paciente
00:07:52es un Coronel retirado del ejército que
00:07:54sufrió eso un cáncer de garganta él se
00:07:56puede mover perfecto pero no puede
00:07:57hablar y va a recuperar su voz y va a
00:07:59recuperar su voz como la tenía antes ex
00:08:01Wow incluso la va a poder usar más
00:08:03rápido que Rivas porque Rivas tiene que
00:08:05hacer esto de la vista tal cual cu mir
00:08:07miramos Eh bueno Y cómo es que la
00:08:09Inteligencia artificial trat de
00:08:11explicarlo lo más para tontos posible
00:08:13porque para nosotros Inteligencia
00:08:14artificial es algo como de ciencia
00:08:15ficción Cómo es que se mete eso en en la
00:08:19posibilidad de generar una voz eh Y cómo
00:08:22hacés voz que eso pase bueno a ver este
00:08:25hoy en día Todo lo que es este
00:08:26Inteligencia artificial generativa está
00:08:28muy en boga vos tenés como la
00:08:30posibilidad de generar audio video e
00:08:33podes generar imágenes Sí sí el papa
00:08:35haciendo break dance o el león de mi ley
00:08:38aplastando el congreso que en realidad
00:08:40es la catedral todos esos esas imágenes
00:08:42son por Inteligencia artificial
00:08:44Exactamente para que sea digamos
00:08:46entendible ves lo que haces es generar
00:08:48un algoritmo computacional un programa
00:08:51que a partir de muestras sí lo que hace
00:08:54es generar una copia digital y cada vez
00:08:57que vos tenés
00:08:59digamos vos tenés una base de muchos
00:09:02audios de esa misma persona con
00:09:04distintas tonalidades distintas formas
00:09:06de expresarse y también tenés bases de
00:09:10digamos audios de un montón de gente eso
00:09:12se llama dataset si querés como una base
00:09:14de datos supergigante con eso entrenas a
00:09:17este algoritmo o a este software
00:09:19entonces a partir de ese aprendizaje
00:09:22después lo que haces para una voz que se
00:09:24llama voz objetivo o voz Target es
00:09:26tratar de copiar específicamente esa vz
00:09:29Entonces el proceso es de alguna manera
00:09:32un poco incierto de lo que va a suceder
00:09:34porque cuando vos generas el
00:09:36entrenamiento es una caja negra y cuando
00:09:39obtenés el resultado y después haces la
00:09:40inferencia a veces se puede escuchar
00:09:43mejor se puede escuchar peor hay
00:09:44palabras que se depende de Con qué
00:09:46material lo hayas entrenado y del modelo
00:09:48matemático que vas hayas usado dentro de
00:09:50esa caja negra con lo cual si te sirve y
00:09:53te gusta perfecto y si no hay que
00:09:55reentrenar el modelo cambiando los
00:09:57algoritmos matemáticos o cambi creando
00:09:59este dataset que es el conjunto de
00:10:02muchas voces diferentes Pero qué es lo
00:10:04que no existía hace se meses y ahora sí
00:10:06existe o hace un año y ahora sí existe y
00:10:09que te permitió hacer esto Mira los
00:10:11algoritmos van mejorando cada vez más eh
00:10:14cada vez hay nuevos modelos que permiten
00:10:16hacer las cosas más rápido más fácil que
00:10:18son en muchos casos de código libre y
00:10:20los puedes aprovechar esto el dataset
00:10:23tampoco es sencillo Porque no es
00:10:25cualquier audio tienen que ser recortes
00:10:27de cierta calidad de cierta duración
00:10:29etcétera etcétera entonces van
00:10:30apareciendo toda esa información y
00:10:33después lo que ocurre también es que
00:10:34muchas empresas utilizan estos modelos
00:10:38para vender servicios pero por ahí no lo
00:10:40hacen con la búsqueda de tener impacto
00:10:42social o esto de poder adaptar el punta
00:10:45a punta que Jorge digamos con poca
00:10:47movilidad pueda eh usarlo a través del
00:10:50traqueo del movimiento de su cabeza o
00:10:53que se pueda usar en una computadora
00:10:54local y no en la nube Porque si vos a
00:10:57cualquier usuario le decís mira mir
00:10:59tenés que pagar cada vez que vas a
00:11:00hablar y bueno probablemente pocos
00:11:02puedan afrontarlo en el otro extremo de
00:11:03la situación de Jorge está por ejemplo
00:11:05el El Bueno lo digo es el presidente de
00:11:10Clarín el dueño de Clarín Héctor maneto
00:11:12que habla también como consecuencia de
00:11:14de problema de
00:11:16salud un cáncer habla con con una voz
00:11:19muy metálica eh pero que aú así es su
00:11:23voz o sea él es casi inentendible a mí
00:11:26me ha tocado estar en algunas
00:11:27conferencias que dio donde aparece
00:11:29subtitulado directamente lo que dice
00:11:31porque es casi inentendible Pero todavía
00:11:34es de su cerebro a la a la garganta la
00:11:38orden vos podrías llegar a leer eso y
00:11:40que eso dispare la voz artificial que
00:11:43ustedes generan Sí pero bueno tiene otro
00:11:45grado de complejidad porque ahí ya tenés
00:11:47una integración a nivel biológico si
00:11:49querés a nivel neuronal cl exactamente
00:11:52ya es otra rama de desarrollo si quieres
00:11:56pero eventualmente va a llegar eso va a
00:11:57llegar ah por supuesto o sea estamos
00:12:00cerca de que las las órdenes que nuestro
00:12:03cerebro le da a nuestro cuerpo sean
00:12:04decodificadas por máquinas y
00:12:06sintetizadas de este de esta forma yo
00:12:08creo que sí yo creo que sí de hecho elon
00:12:09Mask digamos tiene una empresa dedicada
00:12:11este neuralink que busca ese tipo de
00:12:14desarrollos la O sea la tecnología de
00:12:16Inteligencia artificial Está avanzando
00:12:18perdón a un nivel y a una velocidad que
00:12:20realmente es abrumadora y también la
00:12:23miniaturización de la electrónica Está
00:12:25avanzando mucho Entonces está como
00:12:27convergiendo las tecnologías necesarias
00:12:29para que ese mundo digamos de ciencia
00:12:31ficción realmente lo podamos tener sobre
00:12:33la mesa PR qué alucinante eh qué
00:12:35alucinante Hernán es muy costoso eh
00:12:38poder acceder a algo como esto porque
00:12:41vos hablas mucho del tema del impacto
00:12:43social entiendo que la idea también es
00:12:45que cualquiera pueda acceder a eso pero
00:12:48hoy por hoy es muy costoso mira estos
00:12:51productos cuando son comercializados a
00:12:53través de empresas s son muy costosos
00:12:55nosotros el desarrollo lo hicimos a
00:12:57través del estado y lo que buscábamos
00:12:59era continuidad de financiamiento del
00:13:01Estado para poder cedir en la misma
00:13:02línea y para también poder universalizar
00:13:05de forma tal de que vos tengas una
00:13:06plataforma donde cargas tu voz te
00:13:09descargas el software ya entrenado y lo
00:13:11puedas usar en tu computadora eso
00:13:14obviamente lleva varias etapas más de
00:13:16desarrollo nosotros hicimos una primera
00:13:18etapa donde es algo muy hecho ad hoc a
00:13:20medida de Jorge y para sus necesidades
00:13:22Pero todavía no es del amplio espectro
00:13:24que querríamos así que estamos buscando
00:13:26bueno financiamiento ahora a través de
00:13:27fundaciones de otras entidades ya que
00:13:29desde el estado estamos un poco más
00:13:31acotados hoy en día eh Bueno a a la
00:13:34búsqueda de de nuevo financiamiento para
00:13:36poder continuar una vez que esa
00:13:37plataforma esté desarrollada De punta a
00:13:40punta desde ya que va a requerir
00:13:41mantenimiento pero si vos te la podes
00:13:43Descargar y correrla en tu propia
00:13:45computadora bueno Ah yo no tenés que
00:13:47pagarle nada nada a nadie Claro claro
00:13:49eso es lo que quiere decir que quedó
00:13:51disponible para otra gente exactamente
00:13:54bien exactamente eh estamos hablando en
00:13:57el y hago de hoy con Hernán San Martín
00:13:59que es ingeniero electrónico pero que
00:14:01forma parte del laboratorio de
00:14:03mecatrónica de la facultad de ingeniería
00:14:05del ejército todas cosas que si algún
00:14:07niño de 8 10 11 años nos está escuchando
00:14:10seguro les remil flashea estoy seguro eh
00:14:13segurísimo eh qué más hicieron Hernán
00:14:16además de esta voz de Jorge Rivas alguna
00:14:18otra que me puedas contar Mira
00:14:20laboratorio es muy linda la historia
00:14:22porque empezó como un club Se generó a
00:14:23través de alumnos que estaban
00:14:25entusiasmados armamos un club Y a partir
00:14:27de ahí empezamos a trabajar en el fondo
00:14:29de un aula después gracias a Dios la
00:14:31facultad nos apoyó muchísimo y fue
00:14:32creciendo se armó un laboratorio Y
00:14:34empezamos a presentar eh proyectos a
00:14:37distintas líneas de financiamiento del
00:14:38estado y también hacer servicios digamos
00:14:40para para el sector privado yo ni sabía
00:14:42que existía la Facultad de ingeniería
00:14:43del ejército Mira está muy cerca está
00:14:44acá en cabilo y dorreo Cabildo 15 mira y
00:14:47es gratis obviamente eh tiene una cuota
00:14:49subsidiada o sea es mucho más barata que
00:14:51las otras universidades y estudian
00:14:53ingeniería los ingenieros los oficiales
00:14:55militares y tienen de compañeros A
00:14:57alumnos civiles Yo estudié ahí de hecho
00:14:59eso te iba a preguntar vos tenés grado
00:15:00sosit no no no no no yo casualmente e
00:15:04estudié ahí después me quedé como
00:15:05profesor y armamos el laboratorio y me
00:15:07quedé trabajando ahí pero yo fui como
00:15:09civil y Bueno tengo alumnos que son
00:15:11militares tuve compañeros que son
00:15:12militares y se da una dinámica muy linda
00:15:15Mira Che y qué me me ibas a contar qué
00:15:17hicieron ahí en esa Bueno entonces este
00:15:19a partir de ahí se genera lo que es el
00:15:21laboratorio Y empezamos con la línea de
00:15:23proyectos sociales eh instalamos paneles
00:15:25solares en aldeas guaraníes durante
00:15:27varios años estuvimos trabajando en eso
00:15:29termotanques y paneles en escuelas Del
00:15:31Noroeste argentino en la época de la
00:15:34pandemia participamos en el diseño de un
00:15:36respirador que fue el único que salió en
00:15:38una tanda de producción pequeña cuando
00:15:40estábamos en la crisis de los
00:15:41respiradores Sí claro se los chorean un
00:15:43país al otro exactamente eh hicimos un
00:15:46montón de máscaras de protección
00:15:47sanitaria en ese momento y Bueno siempre
00:15:50estamos hay mucho proyecto educativo de
00:15:52de bajar esto que decís vos que le
00:15:53flashea a los chicos de 7 8 10 15 años a
00:15:56las escuelas a los clubes entonces damos
00:15:59cursos de formación en robótica este
00:16:01digamos estudiantil robótica educativa
00:16:04Mira querés dar alguna dirección para
00:16:05eso porque hay un montón de docentes que
00:16:07nos escuchan Mira hay alguna dirección
00:16:09del del eh del laboratorio o algún mail
00:16:12alguna lugar ened s si buscan la
00:16:14Facultad de ingeniería del ejército ahí
00:16:16tienen el contacto Y a partir de ahí
00:16:17digamos este se van a poder encontrar
00:16:19toda la info y bueno Nosotros le pusimos
00:16:22un nombre en particular al al
00:16:24laboratorio un nombre de fantasía Si se
00:16:26quiere que es infinium labs así que ahí
00:16:28estamos en instagram en linkedin y
00:16:30también nos pueden encontrar los voy a
00:16:32empezar a seguir Hernán gracias por
00:16:33venir loco un placer muchas gracias a
00:16:35ustedes Hernán San Martín ingeniero
00:16:37electrónico le hicieron una voz igual a
00:16:40la que tenía al exdiputado Jorge Rivas y
00:16:43vino a contarnos acá al Yago

