👓 # 146 Lo que hace ChatGPT, ¿es plagio?

Semana 146: 2024 tendrá un récord histórico de elecciones

Jan 13, 2024

Hola, soy Alex Rayón Jerez. De #bilbao y #millennial (por los pelos).

Bienvenido/a a mi newsletter Digital & Data. Damos una especial bienvenida a los 98 nuevos suscriptores/as con los que somos ya 10.723 reflexionando sobre cómo los humanos no entendemos una tecnología hasta que no la adoptamos masivamente. Que es, precisamente, lo que está ocurriendo con las tecnologías digitales. Suscríbete aquí 👇

📷 Una imagen

Alrededor de la Inteligencia Artificial, es muy habitual hablar y citar los sesgos. Pero lo que no sé es cuánto de claro está en qué consiste. Mostrar ejemplos sueltos o búsquedas con respuestas sesgadas, es el método habitual. Pero el problema parece ser mayor que hechos anecdóticos. Un estudio de varios investigadores de la Universidad de Michigan expone un sesgo de género realmente preocupante. Como sabéis, un aspecto clave en el prompting es definir el rol con el que actuará el agente conversacional. Pues bien, cuando este rol es definido de forma masculina o neutral, ofrece mejores respuestas (en términos de acierto) que cuando es definido para actuar con rol femenino. ¿Por qué? Al definir roles como “mentor”, “socio” o “chatbot” (masculinos), son realmente eficientes en dar respuestas. No tanto roles como “asesora”, “guía” o “mentora”. Esto nos lleva a la conclusión de siempre: los algoritmos regurgitan lo que estudian/aprenden. Es decir, el problema lo tenemos en la materia prima, en los datos. Si llevamos anclados en importantes sesgos décadas, tenemos trabajo por delante en expresar y llevar a datos una mayor neutralidad. Y esto empieza por ser primero consciente de esta limitación que tenemos.

📚 Cinco lecturas

#1 El plagio y las alucinaciones de la IA… y de los humanos

Si hacéis una rápida búsqueda en Google, veréis cómo hay numerosas web hablando de que la IA “plagia” o “alucina”. Con independencia de la opinión que tenga de estos manifiestos (os la podéis imaginar), pensaba en que claro, los humanos no cometemos tales fechorías. He pensado mucho en esta semana en ello tras saber que la Presidenta (“Rectora”) de la Universidad de Harvard ha tenido que dimitir. No directamente por su aparente plagio en serie, pero sí parece que siendo éste un elemento importante. ¿Qué es plagiar?

Detalles

Definir el plagio en el mundo académico es complicado, por básico que parezca. ¿Qué es plagiar en la práctica? Por ejemplo, parafrasear (que para la IA Generativa es básicamente decirle que lo redacte con un estilo distinto). ¿Es plagio? Es un tema debatido en la ciencia de la ética académica. En este estudio se habla mucho de ello.
¿Cómo citar algo técnico o un hecho histórico? Es complicado. Los que hemos escrito una tesis doctoral, sabemos que muchas veces es complicado describir algo complejo pensado o diseñado por un tercero. Muchas veces entrecomillamos y atribuimos.
La atribución o cita: ¿poner entrecomillado es suficiente? En la literatura muchas veces se dice que estás siendo “vago” en la interpretación y explicación. Es decir, que no entiendes lo que citas. Entonces, ¿lo parafraseo? Volvemos al punto inicial.

¿Por qué es relevante?

Sarah Elaine Eaton, de la Universidad de Calgary (Canadá), que lleva años estudiando la ética académica de las universidades y tiene numerosas publicaciones en el tema, dice que éste es el mayor debate ahora mismo en la ciencia académica: la disyuntiva entre citar explícitamente sin entender vs. parafrasear. Esto, en la era de la IA Generativa, va a generar aún más debates. Al tiempo.

#2 La Ley de Wirth y los copilotos de programación

La Ley de Wirth recibe su nombre por Niklaus Emil Wirth, creador de mi gran querido lenguaje Pascal, y recientemente fallecido. Describe cómo el software (lo que no puedes tocar) se está haciendo más lento de forma más acelerada que la que el hardware (lo que puedes tocar) se hace más rápido. En otras palabras: los programas son más ineficientes.

Detalles

El bueno de Wirth, al que estudié mucho durante mis años de universidad, hizo un relato hacia el software ágil. Menos es más.
El mundo es cada vez más complejo. Las empresas cada vez queréis más personalización de todo. Esto hace que el software sea más difícil de mantener.
Se calcula que la mitad de los desarrolladores de software están empleando ya Github Copilot, y que más del 80% usan ChatGPT. Esta encuesta es muy esclarecedora.

¿Por qué es relevante?

Si el software era complejo y pesado, replicarlo con la IA Generativa no lo hará más eficiente. Más bien al contrario. Menos es más, recuerda. Mantener software es muy caro.

#3 Tesla Full Self-Driving (FSD)

El mundo de la automoción está esperando un anuncio inminente de FDS Beta V12. Para los aldeanos de Bilbao como yo, sería algo así como un cambio sísmico del algoritmo de conducción autónoma. Pasarían los coches de un sistema basado en reglas a un sistema basado en redes, mucho más capaz de aprender. Y, por lo tanto, de conducir solo.

Detalles

El propio Elon Musk parece que ha dejado caer que el anuncio es inminente. Parece que el retraso en su anuncio viene por la cantidad de pruebas que están haciendo.
Tesla ha estado fichando equipos de IA durante muchos años. Tiene uno de los mejores equipos del mundo en IA. Era evidente que algún día llegaría. La mejora vendrá en términos de seguridad (aún más) y básicamente en que eso traiga tener un ordenador con ruedas, no poner un ordenador en un coche, que no es lo mismo.

¿Por qué es relevante?

La conducción autónoma es más segura que la humana. Pero claro, tenemos el valle inquietante siempre ahí esperándonos.

#4 Biden echa por tierra una Ley de Trump sobre los “riders”

Los “riders” es un eufemismo para referirme a los trabajadores de plataformas digitales que, como freelance, facturan sus servicios a compañías. De esta manera, éstas, evitan tener que hacer contratos, con la flexibilidad que esto trae. Trump facilitó perpetuar este modelo, y esta semana Biden ha echado la ley atrás. Esto podría cambiar varias de las plataformas que a lo largo del mundo usan este modelo. Veamos.

Detalles

¿Cuándo considerar “trabajador” o cuando “freelance”? Es buena pregunta, y su fundamento se asienta en varias cuestiones clave de nuestros contratos sociales. A lo largo y ancho del mundo, en general, son varios los elementos los que hacen la diferencia: el carácter transitorio o no del trabajo, el grado de control sobre el trabajador que tiene la empresa, el grado en el que la habilidad o competencia del trabajador juega un papel, etc.
Es evidente que para manejar una bicicleta o conducir un coche, no hace falta tener grandes destrezas.
EEUU tiene un marco social diferente al nuestro, en Europa, por ejemplo. Pero suele influenciar a otras jurisdicciones cuando son asuntos digitales.

¿Por qué es relevante?

Porque la transformación digital del empleo también popularizó esto que se llamó la “gig economy”. Plataformas digitales que prestaban su servicio con un ejército de freelances. Muchos de ellos, en situaciones vulnerables. No es fácil encontrar los equilibrios, y seguro que es un proceso de alta variabilidad, donde la ley es difícil. Pero, del 0 al 1, hay un gran mundo de grises que convendría matizar.

#5 2024: el año de las elecciones

2024 marcará un récord histórico en votaciones: hasta 4.000.000.000 de personas votarán, récord. Y, casualidades de la vida, hemos descubierto una tecnología con dos textos e instrucciones, nos permite generar deepfakes. Mensajes falsos. ¿Cómo de vulnerables serán las sociedades a los mensajes políticos falsos?

Detalles

Entiendo que somos muy vulnerables. Necesitamos más intérpretes de la realidad, y menos consumidores de información. Y sin embargo, creo que la tendencia va justo al revés.
Además, tenemos la sociología y antropología en contra: nos gusta más lo negativo y malo que lo bueno.

¿Por qué es relevante?

La Ley de Brandolini, también llamada “principio de asimetría de la estupidez”, dice que “La cantidad de energía necesaria para refutar bullshit (falsedades, estupideces) es un orden de magnitud mayor que la necesaria para producirlo”. Por eso siempre hay personas (en empresas, comunidades de vecinos, etc.) que triunfan, porque son muy hábiles explotando esta asimetría. Y esto lo saben algunos grupos políticos que no tienen pudor alguno.

🔊 Un audio

¿Tienes 5 horas disponibles? Yo tampoco. Pero, te recomiendo dedicar micro-ratos que todos conjuntamente sumen 5 horas para escuchar esta “entrevista” de 5 horas de Jordi Wild a Villarejo. Maravilloso relato.

💬 Un comentario en redes sociales

Poco que añadir al tweet de abajo. La IA, que parece que se va a meter en nuestros objetos más cotidianos (coches, electrodomésticos, ropa, etc.) está haciendo vivir un momento dorado a las áreas de I+D y de producto. Es decir, debemos dar un salto a crear nuevos productos y servicios, que mejoren lo que ya hacemos, introduciendo la IA. Esto hace que debamos prestar más atención de por qué la gente nos compra. Qué nos compra. Y a partir de ahí ver qué mejorar. Es el momento del diseño, de pensar fuera de la caja. Ya tendremos un paradigma reinante más tarde.

🎲 Una lectura aleatoria

El escándalo del 'Post Office' de Reino Unido. No es solo un titular de periódico, también una serie de TV saca a la luz la condena injusta contra 900 carteros por un “error informático”. Imagínate que de repente se descubre que faltan miles de dólares en el negocio del que eres responsable. Lo más probable es que seas sentenciado por robo y contabilidad falsa, con condenas de prisión. 736 directores de sucursales con historiales impecables fueron culpados de robo, fraude y contabilidad falsa sin haber hecho nada. Claro, esto se ha sabido ahora. El problema parece estar en un sistema informático diseñado por la multinacional Fujitsu. En 2000, la compañía implementó un sistema informático (un ERP por entendernos) en todas las oficinas de correos del país llamado Horizon. "Se sabía muy bien que el programa era muy flojo", han dicho ahora algunos empleados. El asunto parece de ciencia ficción, pero es real. También es real que se diga que es un ERROR INFORMÁTICO. Y lo pongo en mayúsculas, porque, ¿os acordáis cuando decíamos antes lo de la complejidad del software? Por lo que he ido leyendo esta semana, éste es un ejemplo de libro. Si complicamos todo, y dificultamos poder crear programas estables, pues, podemos llegar a estos extremos. Menos es más. Más diseño y menos preferencias personales. Por cierto, “error informático” es un tanto oxímoron; la informática expresa lo que un humano tiene en mente o quiere implementar.

¿Te gusta esta newsletter? ¡Suscríbete! ¡Compartid el enlace con vuestros amigos! ¡Enlazad el boletín en redes sociales!

Digital & Data | Alex Rayón

Discussion about this post