¿Por qué creé un LLM personal basado en mi propio contenido?

Todos dicen que la mejor IA es la más capaz. Usa el modelo más grande, escribe mejores indicaciones y no interfieras. Creo que eso es al revés.

El problema del aplanamiento

Cuando se utiliza un Máster de Derecho (LLM) fronterizo, se proyecta el resultado hacia el centro de internet. Escribo con una voz específica, una que me llevó años desarrollar en ensayos, vídeos y publicaciones en redes sociales. Cuando introduje mis borradores en GPT-4 y Claude sin contexto, los resultados fueron limpios pero planos. Esto no es anecdótico. Una investigación publicada en PNAS en 2025 reveló que los LLM producen resultados sistemáticamente homogeneizados, y que cada pieza adicional generada por IA aporta menos diversidad única al conjunto de trabajos que una escrita por humanos. Otro estudio revisado por pares reveló que los modelos optimizados para la instrucción se entrenan en un estilo particular, con muchos sustantivos y una alta densidad informativa, que limita activamente su capacidad para imitar otros registros de escritura. El modelo no está fallando. Está haciendo exactamente lo que fue diseñado para hacer: servir a todos, no a ti. pnas

La respuesta obvia es que se trata de un problema de motivación. Si se le da más contexto, se escriben mejores instrucciones y los resultados mejoran. Es cierto, y lo intenté. Mejorar las indicaciones ayuda. Pero un estudio de arXiv de 2025 puso a prueba precisamente esta suposición y descubrió que, incluso con pocas indicaciones, los estudiantes de maestría en derecho (LLM) aún tienen dificultades para escribir de forma informal y con matices en blogs y foros, que es precisamente el registro donde se encuentra la mayor parte del contenido personal. En algún momento, se dedica más esfuerzo a enseñar al modelo quién se es que al ahorrarse su uso. Ese es un flujo de trabajo defectuoso. arxiv

Cinco años de reflexión, finalmente útiles

Un modelo optimizado con base en tu propio trabajo conoce tu historial intelectual, no solo tu último mensaje. Llevo cinco años escribiendo: ensayos, transcripciones, notas, borradores. Eso no es solo contenido. Es un registro de cómo ha evolucionado mi pensamiento, a qué recurro constantemente, sobre qué he cambiado de opinión. Optimizar un modelo con base en un corpus personal es una técnica consolidada. Un caso documentado del ámbito académico alcanzó una puntuación de similitud de coseno de 0,8 entre el resultado del modelo optimizado y el estilo de escritura del investigador original, lo que demuestra que un modelo puede aprender no solo vocabulario, sino también patrones estructurales y estilísticos de un conjunto de datos específico. Hizo que mi propio archivo fuera útil de una manera que la búsqueda nunca podría. blog.gopenai

Algunos señalarán que la generación aumentada por recuperación funciona igual sin necesidad de ajustes. Se crea una canalización RAG sobre las notas y se deja que el modelo la consulte. Esto supone una parte del camino. Pero, como confirman tanto AWS como análisis técnicos independientes, la RAG y el ajuste resuelven problemas diferentes: la RAG recupera la información existente, mientras que el ajuste modifica el comportamiento generativo del modelo en cuanto a tono, ritmo y estructura. Son problemas diferentes y requieren soluciones distintas. Una combinación de ambos suele ser la clave del éxito. kairntech

Cómo empecé a sonar como todos los demás

Cuanto más escribes con un modelo genérico, más empiezas a escribir como tal. Lo noté durante unos dieciocho meses. Mis borradores se volvieron más fluidos. Más estructurados. Menos sorprendente. Esto está documentado. Un estudio de la Universidad de Cornell, publicado en abril de 2025, descubrió que cuando las personas usaban un asistente de escritura con IA, su escritura convergía, y las distintas voces culturales e individuales se volvían más similares. El investigador principal lo describió como uno de los primeros estudios en demostrar que el uso de IA en la escritura podía generar estereotipos culturales y homogeneización lingüística. Otro estudio reveló que los profesores calificaron los ensayos asistidos por IA como más fluidos y bien estructurados, pero con un tono más fluido y una perspectiva más original. Los diseñadores ya conocen este patrón: te conviertes en las herramientas que usas. news.cornell

La respuesta fácil es que se trata de un problema de disciplina. Escribe tu primer borrador sin IA, mantén la intención y la deriva se detiene. Quizás. Pero el problema estructural radica en que una herramienta genérica no tiene ningún interés en preservar tu voz; tiene todos los incentivos para suavizarla. Un artículo de 'New Yorker' de junio de 2025 lo expresó claramente: los grandes modelos lingüísticos están diseñados para identificar patrones dentro de extensos conjuntos de datos, produciendo resultados que tienden al consenso, y esa tendencia moldea a los humanos que los usan con el tiempo, no solo los resultados. Construir un modelo entrenado con tu voz cambia la estructura de incentivos de la propia herramienta. Dejas de luchar contra la corriente. newyorker

Lo que A.R. Rahman entendió sobre la síntesis

A.R. Rahman no se convirtió en el sonido del cine indio aprendiendo orquestación occidental y deteniéndose ahí. Construyó un estudio de grabación en su casa de Chennai, se formó en composición MIDI cuando otros aún trabajaban con orquestas en vivo y fusionó la música clásica carnática, la música devocional sufí y el pop occidental en una gramática que nadie más pudo replicar porque nadie más había vivido la misma combinación de influencias. Las herramientas que utilizó estaban al alcance de todos. La síntesis fue completamente suya. Un máster genérico te da las herramientas. Un modelo personal te da la síntesis.

La objeción que vale la pena tomar en serio

La verdadera objeción es la siguiente: ajustar un corpus personal pequeño corre el riesgo de amplificar tus debilidades, no solo tus fortalezas. Si tu escritura presenta puntos ciegos o tics estructurales, un modelo personal también los aprende. El resultado es una herramienta que se asemeja mucho a ti, incluyendo las partes que podrían necesitar un editor. Esta es una limitación documentada; los modelos ajustados conllevan un mayor riesgo de reforzar patrones presentes en los datos de entrenamiento y no presentan referencias que los cuestionen. docs.aws.amazon

Es cierto. Pero se equivoca en el caso práctico. Un modelo personal gestiona la voz y la continuidad. No reemplaza el desafío editorial; este aún debe venir de afuera. Un músico que practica con su propio estilo no evita las críticas. Se asegura de que estas recaigan en algo genuinamente suyo.

¿Qué pasa si no lo haces?

Las herramientas que importan en la próxima década serán aquellas que te conozcan lo suficiente como para ser realmente útiles, no solo genéricamente capaces. Si sigues externalizando tu voz a un modelo entrenado con el pensamiento de todos los demás, no te estás mejorando a ti mismo; estás cediendo lentamente tu singularidad. Quienes construyan infraestructura personal de IA ahora serán dueños de su influencia intelectual; el resto pasará los próximos diez años sonando como los demás. news.cornell

El problema del aplanamiento

Cinco años de reflexión, finalmente útiles

Cómo empecé a sonar como todos los demás

Lo que A.R. Rahman entendió sobre la síntesis

La objeción que vale la pena tomar en serio

¿Qué pasa si no lo haces?

El problema del aplanamiento

Cinco años de reflexión, finalmente útiles

Cómo empecé a sonar como todos los demás

Lo que A.R. Rahman entendió sobre la síntesis

La objeción que vale la pena tomar en serio

¿Qué pasa si no lo haces?

¿Trabajamos juntos?

Más sobre Tecnología

You Are Not the User

Superintelligence Is a Control Problem

One billion tokens later

¿Por qué creé un LLM personal basado en mi propio contenido?

El problema del aplanamiento

Cinco años de reflexión, finalmente útiles

Cómo empecé a sonar como todos los demás

Lo que A.R. Rahman entendió sobre la síntesis

La objeción que vale la pena tomar en serio

¿Qué pasa si no lo haces?

¿Trabajamos juntos?

Más sobre Tecnología

You Are Not the User

Superintelligence Is a Control Problem

One billion tokens later

Mantente al día

Mantente al día