📞 # 195 ¿Sabes cuánto le cuesta a tu empresa que no sepamos comunicarnos eficientemente? Mucho

Semana 195: Deepfakes, lectura física y los logos en la era digital y de la IA

Dec 21, 2024

Hola, soy Alex Rayón Jerez. De #bilbao y #millennial (por los pelos).

Bienvenido/a a mi newsletter Digital & Data. Damos una especial bienvenida a los 107 nuevos suscriptores/as con los que somos ya 15.026 reflexionando sobre cómo los humanos no entendemos una tecnología hasta que no la adoptamos masivamente. Que es, precisamente, lo que está ocurriendo con las tecnologías digitales. Suscríbete aquí 👇

Esta humilde newsletter, que nació para ayudarme a pensar y ordenar ideas en mi día a día, ha superado los 15.000 suscriptores. No tengo palabras de agradecimiento y de sorpresa con lo conseguido. Cierto síndrome del impostor me asalta. Muchas gracias a todas y todos ❤️

De esa cifra, 21 son de pago :) Un 0.14%. Nunca he buscado la monetización (rechazo el 95-98% de las peticiones de patrocinio, por ser temas muy alejados a lo que escribo). Pero es evidente que esto ha cogido un volumen y relevancia que invita a reflexionar sobre su futuro. Para nuestra compañía (Brain & Code), ha sido clave. Hemos arrancado varios proyectos gracias a la newsletter y ha reforzado la visibilidad de marca en foros muy cualificados. 2024 ha sido un gran año, y 2025 promete también.

Si esta humilde newsletter tiene este impacto, creo que es lógico pensar en su futuro. Cosa que estoy haciendo. He tenido ya algún acercamiento con cosas. Nada concreto de momento. Pero sí garantizaros que todo seguirá igual para vosotros/as en 2025.

Lo que sí es sólido es vuestro tiempo y compromiso. Gracias de corazón ❤️

📷 Una imagen

Llevo unos días enganchado, en mis escasos ratos libres, a Sora. Como sabéis, es la herramienta de texto a vídeo de OpenAI. Ha mejorado muchísimo. Supongo que han trabajado mucho el modelado de sistemas, la representación física y mecánica del mundo, etc. Ahora mismo (diciembre de 2024), permite crear clips de hasta 20 segundos en resolución 1080p a partir de indicaciones de texto, imágenes o videos. Además, ofrece herramientas de edición como Remix, Re-cut, Blend, Presets, Loop y Storyboard, que facilitan la creación y edición de videos. También cuenta con una galería social donde los usuarios pueden compartir y colaborar en proyectos. OpenAI ha implementado medidas para evitar la difusión de contenido dañino, incluyendo marcas de agua en los videos y restricciones para generar deepfakes explícitos. Este lanzamiento posiciona a Sora no solo como una herramienta de generación de video con IA, sino también como una plataforma completa de edición, compitiendo con software de edición de video tradicional. Es decir, OpenAI se ha dado cuenta que además de hacer modelos, puede hacer aplicaciones sobre ello. No sea que le pase lo mismo que con Microsoft Copilot, que es ahora seguramente el principal producto competidor de ChatGPT.

📚 Cinco lecturas

#1 “Llámame cuando puedas” - Sus efectos

Estos días me encontré este artículo de The Wall Street Journal. Aborda cómo la expresión "llámame" en un mensaje de texto nos genera ansiedad en estos tiempos que nos ha tocado vivir. La falta de contexto en estas solicitudes puede llevar a preocupaciones sobre posibles emergencias o malas noticias. Nos asustamos.

Detalles

En la era digital actual, donde predominan las comunicaciones asíncronas como los mensajes de texto, una solicitud de llamada sin detalles puede resultar desconcertante.
La autora del artículo sugiere proporcionar más información o contexto al solicitar una llamada puede aliviar la ansiedad y mejorar la comunicación entre las partes. Piénsalo.

¿Por qué es relevante?

Yo es lo que hago. Es curioso como cuando llamo y alguien no me coge, y es alguien con quien interactúo poco, le dejo un mensaje dándole más contexto.

#2 Quizás estamos interpretando mal lo que es la IA

Luigi Mangione, el joven de 26 años arrestado en relación con el asesinato de Brian Thompson, CEO de UnitedHealthcare, en Nueva York, ha despertado todo tipo de reacciones. No es éste el espacio para hablar de ello. En medio de esta situación, se produjo un error en los resúmenes de noticias generados por inteligencia artificial de Apple, que interpretó incorrectamente un titular de la BBC sobre Mangione, sugiriendo erróneamente que se había disparado a sí mismo. Este fallo llevó a la BBC a contactar a Apple para abordar el problema. Y los titulares de medios, no se han hecho esperar.

Detalles

Como bien dijo Karpathy, la IA Generativa son “máquinas para imaginar”. El “resumen pop” sería que es “normal y natural que alucinen”. Pero, la buena noticia es que son controlables. Es algo que tenemos ahora en el core de nuestros programas: una sesión sobre el control de alucinaciones, con métodos a nivel de arquitectura de los modelos, introduciendo restricciones en la generación probabilística de los modelos y controlando los gaps en los datos de entrenamiento. Es muy técnico para este espacio, pero como diría aquel, “Sí se puede”.
De alguna manera, podríamos decir que guiamos sus sueños con los prompts. Los prompts inician el sueño, y, basándose en el recuerdo difuso que el LLM tiene de sus documentos de entrenamiento, la mayoría de las veces el resultado conduce a algo útil.

¿Por qué es relevante?

Considera un motor de búsqueda como Google. Cuando buscamos, devuelve, literalmente, uno de los "documentos de entrenamiento" más similares que tiene en su base de datos. Aplicando la misma lógica que con los LLM deberíamos decir que este motor de búsqueda tiene un "problema de creatividad": nunca responderá con algo nuevo. Un modelo de lenguaje grande (LLM) está soñando al 100% y tiene el problema de las alucinaciones. Un motor de búsqueda no sueña en absoluto (0%) y tiene el problema de la creatividad. Cuidado con entender cada herramienta como si fuera otra. Es cuestión de contextualizar bien lo que hace cada una, no son comparables.

#3 Centros de procesos de datos, la IA y ceteris paribus

Ceteris paribus es una expresión en latín que significa "todo lo demás constante". Se utiliza principalmente en economía, filosofía y otras ciencias sociales para analizar el efecto de una variable sobre otra, asumiendo que todas las demás condiciones relevantes permanecen sin cambios. Es lo que está pasando ahora con la demanda energética y la IA. Todo es una catástrofe y no habrá energía para alimentar. Salvo, claro, que cambiemos algo ;-)

Detalles

Hace unos días me topé con este artículo. Investigadores están explorando el uso de chips que emplean luz para interconectar componentes, con el objetivo de acelerar el entrenamiento de modelos de inteligencia artificial (IA) y reducir su consumo energético. Esta tecnología, conocida como fotónica integrada, permite una comunicación más rápida y eficiente entre las partes del chip, superando las limitaciones de los enlaces eléctricos tradicionales.
En otras palabras: estos avances podrían eliminar los cuellos de botella en la comunicación de datos entre nodos de cómputo, permitiendo una escala nueva en el hardware de IA sin restricciones en la localización de datos. Algo que se plantea desde hace meses como solución a mover datos por todo el planeta.

¿Por qué es relevante?

Cuidado con no confiar en el poder de la tecnología para transformar las cosas.

#4 ¿Sabes cuánto le cuesta a tu empresa que no sepamos comunicarnos eficientemente? Mucho

El informe "2024 State of Business Communication" de Grammarly, ofrece una visión detallada sobre el estado actual de la comunicación en el entorno laboral y el impacto de la inteligencia artificial generativa en este ámbito. El resumen rápido: entre 12 y 25.000 dólares por empleado de coste generamos si no tenemos las habilidades claves de comunicación efectiva. Nada como un buen correo o una buena representación visual de la información, que es lo que os hablo ahora.

Detalles

Los trabajadores del conocimiento dedicamos aproximadamente el 88% de su semana laboral a comunicarse a través de múltiples plataformas. Esta intensificación en la comunicación ha llevado a una sensación de saturación entre los empleados, afectando su productividad y bienestar.
La saturación no ha mejorado precisamente nuestras habilidades de comunicación. Por ello, llevo semanas peleándome para mejorarlo. ¿Cómo? Entre alguna cosa más, la más impactante son los diagramas mermaid (que expresan en diagramas el texto). Te dejo un prompt: “Create a reverse outline of [LO_QUE_SEA] and show the result as a mermaid flowchart which shows the logical flow of elements as well as cross-references or redundancies of topics using arrows.” (Donde pone “LO_QUE_SEA”, lógicamente, podéis pegar lo que queráis).

¿Por qué es relevante?

En la era de la comunicación global, las habilidades de expresión y comunicación son más importantes que dedicar tiempo por exceso. Piénsalo.

#5 Sobre los deepfakes y algunos datos

De esas cosas contraintuitivas que me gustan. Por mucho que se diga, y basándonos en este estudio, analizando 78 casos de uso de inteligencia artificial (IA) en elecciones durante 2024, recopilados por el WIRED AI Elections Project, los autores destacan que la mayoría de los usos de IA no fueron engañosos. De los 78 casos analizados, 39 no tenían intención de engañar. El uso más común de la IA fue en campañas políticas, donde en 19 de 22 casos se utilizó para mejorar materiales de campaña de manera transparente.

Detalles

La creación de desinformación no requiere necesariamente de IA, ya que las herramientas tradicionales pueden producir resultados similares con costes comparables. Atribuir a la IA esta maldad es, como siempre, algo perjudicial.
Los autores concluyen que centrarse en la demanda de desinformación es más efectivo que enfocarse en la oferta. El problema de la desinformación política es estructural e institucional (no confiamos ya, pérdida de la solidez de las instituciones, etc.), y no puede atribuirse únicamente al uso de la IA. Por lo tanto, las soluciones deben abordar las causas subyacentes de la demanda de desinformación en lugar de limitarse a restringir la generación de contenido con IA.

¿Por qué es relevante?

En definitiva, que la desinformación política no es un problema exclusivo de la inteligencia artificial, y que las intervenciones más efectivas deben centrarse en las dinámicas que impulsan la demanda de dicho contenido. Es algo que he explicado en entrevistas con medios en las últimas semanas en varias ocasiones.

🔊 Un audio

Hablando de Karpathy y las alucinaciones, recomiendo este vídeo siempre. Recordad que podéis verlo con inteligencia biológica y tiempo biológico, pero también con Gemini, que con el prompt “summarize the key points on hallucinations of this video xxxxxx“, os resume las principales ideas de un vídeo de Youtube.

💬 Un comentario en redes sociales

Una de las cosas más importantes que una empresa debe tener es un logotipo potente, uno que se grabe en la retina y cuente al instante la historia de la marca. Y es que los seres humanos somos esencialmente visuales. El lenguaje escrito tiene apenas unos 5.000 años, y la imprenta menos de 600. Sin embargo, la comunicación visual mediante imágenes dibujadas o pintadas se remonta a nuestros ancestros neandertales. Procesamos la información visual unas 60.000 veces más rápido que las palabras. Investigadores del MIT estimaron en su día que el cerebro humano puede identificar correctamente una imagen en tan solo 13 milisegundos. El jaguar en salto de la marca Jaguar, conocido como el "leaper", cumplía con todo esto. El de ahora, en fin, juego arriesgado. No soy un experto en logos, pero sinceramente, me llama mucho la atención. ¿Intento a la desesperada? Puede ser.

🎲 Una lectura aleatoria

El artículo "In Praise of Print: Why Reading Remains Essential in an Era of Epistemological Collapse" de Ed Simon, reflexiona sobre la importancia de la lectura en formato físico en una época caracterizada por la sobrecarga de información digital y la erosión de la verdad. Simon destaca las advertencias tempranas de figuras como Terry Pratchett y Carl Sagan en la década de 1990 sobre los peligros de la digitalización desenfrenada y la posible decadencia epistemológica. Pratchett, en una entrevista con Bill Gates en 1995, expresó su preocupación por la dificultad de verificar la veracidad de la información en internet, anticipando problemas de desinformación que hoy son evidentes. Sagan, por su parte, alertó sobre cómo el empoderamiento tecnológico en manos de unos pocos y la pérdida de la capacidad crítica de la población podrían conducir a una regresión hacia la superstición y la oscuridad. Simon sostiene que, en la actualidad, las predicciones de estos pensadores se han materializado en una crisis de la verdad, donde la sobreabundancia de información digital ha debilitado nuestra capacidad para discernir la realidad. En este contexto, la lectura en formato impreso se presenta como un refugio que permite una experiencia más profunda y reflexiva, fomentando la interioridad y la comprensión crítica, cualidades que son fundamentales para contrarrestar la desinformación y preservar la integridad epistemológica.

Muchas gracias por leerme una semana más ❤️

¿Te gusta esta newsletter? ¡Suscríbete! ¡Compartid el enlace con vuestros amigos! ¡Enlazad el boletín en redes sociales!