Tendemos a pensar que las tecnologías representan o un avance hacia el progreso o el principio de nuestro fin, pero la realidad siempre es mucho más compleja y contradictoria.
↑ Escucha la versión en audio de esta columna
Este ensayo más que una respuesta es una continuación de las reflexiones de “No quiero leer texto producido por Chat GPT” escrito por mi colega Luciana Musello. Mi intención aquí no es posicionarme en el lado opuesto de su opinión; de hecho, coincido con la mayoría de sus argumentos.
Considero más bien que esta es una oportunidad para seguir profundizando algunas de sus reflexiones y, como Luciana sugiere al final de su ensayo, explorar una adopción crítica de la escritura generativa. Aunque, evidentemente, sí hay una aparente oposición en nuestras perspectivas porque yo sí quiero leer textos producidos con IAs.
Antes de entrar en el análisis y explicar la razón del título, aclaro que no, no me considero un tecno entusiasta ni creo que las tecnologías sean garantías de progreso. Es evidente que muchos “avances” tecnológicos son cada vez más una amenaza para la humanidad, incluso para la vida en el planeta. Pero esto no quiere decir que la tecnología no pueda traer posibilidades de mejoras.
El desarrollo tecnológico es complejo, hay que asumirlo. Una misma tecnología, dependiendo de cómo se administre y distribuya, puede traer grandes beneficios colectivos así como puede servir para fines represivos o autoritarios.
Este año, junto a otras inteligencias artificiales generativas, el chat GPT ha provocado una ola masiva de especulación sobre los impactos revolucionarios que traerá. Los relatos híper entusiastas contrastan con las afirmaciones más apocalípticas. Es pertinente sospechar que estas reacciones tan extremas son más efecto del clickbait y del máarketing que de lo que en realidad está pasando y pasará.
Mi respuesta entonces es proponer un análisis crítico que implique imaginar escenarios más matizados. Para esto, mirar a la historia de la tecnología se vuelve una de las mejores estrategias para empezar a dar luces sobre los potenciales devenires y posibilidades que traerán las IAs generativas.
Sobre la resistencia a la tecnología
La resistencia a una nueva tecnología es esperable, muy esperable. Históricamente, cada vez que surge un invento con potencial ha sido así. Por ejemplo, líderes religiosos del siglo XV temieron que la imprenta volvería holgazanes a los monjes copistas y, peor aún, temían que al imprimir y no copiar a mano la iglesia perdería la mediación sobre la palabra de Dios. En efecto, la gran mayoría de copistas perdieron su oficio pero la iglesia no tardó en ver el beneficio de distribuir masivamente la biblia y la resistencia acabó.
Lo que hoy resulta innegable, a pesar de que las autoridades religiosas hayan abrazado el potencial que trajo la imprenta para fines de adoctrinamiento, es que esta representó un avance enorme para el desarrollo y democratización del conocimiento.
Si hacemos un salto tosco en el tiempo y nos movemos a esta era digital, vemos encrucijadas similares. El internet se masificó cuando en 1989 Tim Berners-Lee creó la World Wide Web. Sus intenciones consistían en generar un sistema que facilitara a científicos usar el internet para acceder y difundir información. Eventualmente, el proyecto escaló y manteniendo una lógica de código abierto se convirtió, al menos en principio, en una plataforma abierta y democrática de acceso libre a la información.
Tres décadas después, el internet se distancia cada vez más de aquel que diseñó Berners-Lee. El sistema abierto y demócrático se ha convertido en uno que favorece a intereses lucrativos antes que al acceso libre a información. Las plataformas digitales hoy son mega corporaciones que compiten por nuestra atención y que aprendieron a transformar en capital los contenidos y las interacciones que mantenemos en ellas.
Hoy la web tampoco está tan abierta. El requisito de pago por suscripción para el acceso a ciertos contenidos y herramientas es cada vez más común. A pesar de esto, la difusión y acceso a información es posible y sin duda se ha potenciado, pero al mismo tiempo la desinformación está en preocupante auge.
Este es el escenario en el que emerge Chat GPT, lo que me obliga a asumir tres cosas. La primera es que la plataforma como servicio tiene un potencial que responde, principalmente, a fines lucrativos. Es decir que los potenciales beneficios colectivos de la IAs vendrán en la medida en que puedan ser transformados en enormes beneficios privados. Segundo, y consecuencia de este primer punto, es que todas las narrativas sobre sus potenciales beneficios y amenazas están infladas y son principalmente márketing que busca motivar el uso de las IAs.
Estos dos son mis acuerdos con el ensayo de Luciana, pero en el tercer punto, que desarrollaré a continuación, es en donde propongo explorar una mirada enfocada en las posibilidades antes que en las limitaciones de la escritura generativa de Chat GPT.
Sobre el potencial de los usos y los usuarios
Cualquier tecnología con potencial puede servir para una infinidad de usos, pero quienes tienen más control sobre estas posibilidades son lógicamente sus dueños. Sin embargo, estos últimos dependen de que los usuarios adopten y consuman esta tecnología. Es en este punto en donde surgen posibilidades creativas que no estaban en el guión y que incluso pueden incomodar, aunque sea temporalmente, al status quo.
La historia de las tecnologías de reproducción de música es decidora al respecto. Por ejemplo, cuando Edison produjo el gramófono estaba buscando generar una tecnología que sirva para difundir discursos políticos, no música. A pesar de esto, el gramófono y su sucesor, el tocadiscos, se usaron principalmente para reproducir música. Así, potenciaron la difusión de este arte.
Aunque por un momento, antes de la inminente masificación de estas tecnologías, se temía que la música muera. Este miedo respondía a la idea de que si una máquina era capaz de reemplazar a los músicos intérpretes, es decir músicos tocando en vivo, esto iba a generar una escasez de músicos y, por ende, de música. Evidentemente, no pasó.
Si hacemos de nuevo un salto a la era digital, el internet libre y abierto de Berners-Lee facilitó la generación de sistemas creados para el intercambio de archivos entre pares como Napster o Limewire. Estos servicios que proliferaron a principios de los 2000s pusieron en jaque a la industria musical pero, al mismo tiempo, potenciaron la distribución de música. Es decir, la hicieron mucho más accesible para millones de usuarios alrededor del mundo.
Se podría argumentar que los artistas terminaron siendo también grandes perjudicados en este esquema. Sin embargo, el asunto del pago injusto a músicos por la venta de sus grabaciones ha sido un problema en discusión previo a la priatería digital, en el auge de la piratería e incluso hoy en esta era de dominio del streaming.
Lo afirmo nuevamente, la historia nos demuestra que la tecnología no es garantía de progreso, pero esto no quita que hay suficientes evidencias para pensar que la tecnología puede servir al bien común.
Propongo entonces contemplar que como usuarios tenemos la capacidad de encontrar formas alternativas de adoptar y adaptar tecnologías para potenciar nuestra creatividad. Como usuarios podemos ser, y hemos sido, agentes importantes en hacer que las tecnologías respondan a nuestras necesidades y no únicamente al interés privado.
Sí, estoy consciente de que esta idea puede ser fácilmente tachada de ser demasiado entusiasta, pero hay evidencias suficientes para tener esperanza en la creatividad humana.
El mito de la sustitución y la reproducción como creación
Seguramente para algunos usuarios como yo, las primeras aproximaciones a GPT 3.5 fueron decepcionantes. El tipo de texto que el sistema genera, como bien afirma Luciana, tiende a ser “genérico, sesgado, vacío y falso”.
Para muchos, esto puede ser suficientemente bueno para generar un ensayo mediocre y pasar una clase o para ahorrarnos el suplicio de escribir correos, oficios o cartas tediosas. Nada muy revolucionario, más allá de ahorrarnos el tiempo y recursos que implican las pequeñas tareas. Eso sin considerar su falta de precisión, potenciales problemas de autoría y su tendencia a generar información falsa.
Estos usos de las IAs que son los que más se promocionan me interesan muy poco. Mi enfoque, como mencioné al principio del ensayo, está justamente en la posibilidad de encontrar usos sofisticados e inesperados a Chat GPT.
En su libro “Programados para crear: Cómo está aprendiendo a escribir, pintar y pensar la inteligencia artificial” el matemático Marcus du Sautoy sugiere que las IAs no necesariamente buscan reemplazar la creatividad humana sino “aumentarla”.
Sautoy explica que las IAs pueden asistir antes que reemplazar procesos creativos de todo tipo y así facilitar la generación de ideas innovadoras. Ojo, por principio, las IAs como sistemas de machine learning no pueden reemplazar la creatividad humana porque necesitan alimentarse de contenidos creados por humanos para seguir aprendiendo. Existe, en consecuencia, una evidente dependencia de las IAs con los humanos.
A pesar de esto, la idea de la aumentación resulta difícil de aceptar si consideramos que las IAs generan imágenes, diseños y textos basándose en patrones aprendidos de grandes conjuntos de datos. Las IAs aprenden y generan a partir de ubicar y reproducir patrones. Dicho de otra manera, son sistemas de reproducción que crean bajo los parámetros de lo ya existente y lo que más se repite. ¿Podríamos entonces esperar algo más que resultados genéricos de las IAs?
Las máquinas de reproducción, aunque no son directamente creativas, han traído cambios significativos en nuestros procesos creativos. Ya hablé de la imprenta, pero la fotografía y el cine también fueron posibles por tecnologías de reproducción: cámaras que captan y reproducen imágenes fijas o en movimiento.
Sin embargo, reproducir en términos corrientes implica copiar y copiar es técnicamente la antítesis de crear. Pero ¿es realmente adecuado pensar de esta manera? Definitivamente no. Si lo hacemos no podríamos considerar al cine y a la fotografía medios de expresión artística. De nuevo, el desarrollo tecnológico en la música puede ayudar a entender mejor las posibilidades de la reproducción y de la agencia humana.
Como estilo musical, el hip hop se desarrolló en gran medida por el uso de máquinas de reproducción. En determinado momento los DJs empezaron a usar los tocadiscos como instrumentos musicales antes que como meros reproductores de grabaciones.
Técnicas como el scratching, el procesamiento artificial de sonido y el sampling básicamente permiten crear tomando como materia prima grabaciones preexistentes (valga la redundancia). Negar el carácter innovador de estas técnicas hoy resulta absurdo. Sin embargo, claro que al principio hubo resistencia.
Incluso antes del hip hop, en la década de los 70 otros estilos afroestadounidenses como la música disco y el R&B empezaron a incorporar beats electrónicos en lugar de percusionistas tocando baterías reales. Críticos musicales importantes como Nelson George reaccionaron argumentando que estas tecnologías matarían el espíritu de la música negra.
Curiosamente, los beats artificiales pasaron a ser un componente importantísimo de los estilos afros que han emergido desde entonces. Por ejemplo, J Dilla, productor de hip hop conocido por sus beats creados con el sampler Akai MPC 3000, ha pasado a ser reconocido como uno de los percusionistas más innovadores de los últimos tiempos. Evidentemente, su estilo pudo darse por las posibilidades técnicas únicas de los samplers.
Estos ejemplos demuestran que la reproducción, en efecto, puede potenciar la innovación. Sin embargo, esta innovación no es mera consecuencia de la tecnología. La innovación es el resultado de una simbiosis entre tecnología e inventiva humana.
Escrituras CON IAs
El título de este ensayo pudo ser “Yo sí quiero leer textos producidos por IAs”, pero intencionalmente decidí utilizar “con” en lugar de “por”. Evidentemente, mi enfoque apunta a la posibilidad de generar textos coproducidos con estos sistemas. Es decir, me interesa la búsqueda de técnicas de escritura asistidas por las IAs y no simplemente delegadas a las IAs.
Incluso antes del GPT 3.5, hubo varios casos de literatura producida con IAs. Por ejemplo, en 2016, investigadores del Kimagure Artificial Intelligence Writer Project escribieron una novela, la dividieron en pequeños fragmentos y, posteriormente desarrollaron una inteligencia artificial programada para articular y estructurar la historia tomando sus propias decisiones.
El resultado fue “The Day a Computer Writes a Novel” que incluso estuvo nominada al premio Hoshi Shinichi, tal vez el primer premio a la literatura que acepta textos escritos tanto por humanos como por IAs.
Desde entonces han aparecido otros ejemplos de literatura producida con IA cuya calidad literaria y coherencia no son necesariamente óptimas, pero de los que podemos asumir que hay un interesante trabajo en proceso. De hecho, detrás de esta suerte de experimentos no está el engañar a los lectores. Casi siempre, las motivaciones son las de es de decodificar el funcionamiento de nuestra creatividad literaria.
Recientemente leí por primera vez un ensayo, o una suerte de ensayo, escrito con IA (que evidentemente no era un alumno queriendo verme la cara, claro). El texto es una colaboración entre el escritor Jorge Carrión, Taller Estampa y Chat GPT-2 y 3 y se titula, “Los campos electromagnéticos. Teoría y práctica de la escritura artificial”.
Tal vez el título les resulta familiar y es porque intencionalmente se plantean replicar la técnica de escritura automática usada por André Bretón y Philippe Soupault en “Los campos magnéticos» publicado hace poco más de 100 años. En este caso, Carrión junto a artistas e ingenieros de Taller Estampa decidieron educar a GPT-2 y dialogar con GPT-3 para producir un ejercicio de “escritura especulativa” y a ratos “surreal”.
Es decir, en lugar de ser dos interlocutores humanos escribiendo desde la espontaneidad como en “Los campos magnéticos”, en “Los campos electromagnéticos” el ejercicio buscó generar un diálogo fluido, libre y sin censura entre un interlocutor humano, Carrión y otros artificiales, los GPTs.
Además, el texto tiene una introducción y un epílogo escrito por Carrión en donde propone sofisticadas perspectivas teóricas y metodológicas para aproximarse a las IAs. Tal vez la más importante y provocadora de estas es la predicción de que poco a poco nos estamos convirtiendo en editores y correctores de texto. Idea a la que no puedo evitar relacionar con el cine y la fotografía, prácticas que se ejecutan con aparatos mecánicos y que se resuelven y articulan en la edición.
Finalmente, a pesar de que Carrión en efecto se asume como un tecno-entusiasta y que no oculta en ningún momento su curiosidad por las IAs, es muy consciente del contexto corporativo que controla estas tecnologías. Me permito entonces citar una de sus reflexiones finales a manera de cierre para este ensayo.
El libro de Breton y Soupault acaba con este verso: «Una esfera que lo destruye todo». En el surrealismo original había un impulso revolucionario. Y la voluntad de derrocar para renacer. Su origen estaba en la teoría de Sigmund Freud y en el rechazo a la ideología burguesa. GPT, en cambio, es una tecnología que proviene de Elon Musk. Pese a su uso libre y su voluntad de desarrollar inteligencias artificiales que sean amables con la humanidad, se inscribe en un contexto de tecno-optimismo corporativo, de aceleración de la transición algorítmica y de imperialismo digital. Hay que intervenirlo, hackearlo, distorsionarlo.