Tema de la semana

De 0 a $2.500M en 8 meses

El otro día se publicó la típica lista de Forbes “30 Under 30” y me llamó la atención este caso: Un joven de 24 años, Ali Ansari, con su proyecto de IA Micro1, ha levantado una valoración de 2.500 millones de dólares en solo ocho meses.

¿Que hace? No es un modelo LLM con una arquitectura de red neuronal revolucionaria. Simplemente ha entendido que en la era de la IA, el código es un commodity, pero los datos curados son el nuevo petróleo.

Algo que tu puedes usar también para ti mismo, porque si estás entrenando modelos, creando un GPT personalizado para tu empresa o configurando una Skill en Claude con datos basura, solo estás construyendo castillos de arena.

Siempre te digo que la IA te ayuda a construir mejores activos (para tu empresa, para tu trabajo, para tu startup). Y eso empieza por la Curación de Datos.

Garbage In, Garbage Out

La diferencia entre un bot que alucina y una herramienta de $2.500M es la calidad de lo que ingiere (sin importar la escala o el volumen, la esencia es la misma). Si alimentas a tu IA con PDFs mal formateados, hilos de Slack irrelevantes o bases de datos sucias, tu producto será mediocre.

La curación no es solo "limpiar". Es seleccionar, etiquetar y estructurar para que el modelo entienda el contexto, no solo las palabras.

Cómo curar tus datos como un Pro

Si quieres que tu trabajo con la IA sea de calidad sigue este workflow:

  1. Limpia el ruido: Elimina borradores y versiones viejas. La redundancia confunde a la IA.

  2. Usa Markdown o JSON: No subas archivos planos. La estructura ayuda a que la IA localice lo importante más rápido (puedes pedirle a tu LLM que transforme tus documentos a estos formatos).

  3. Añade intención (Metadatos): No le digas solo el "qué", sino el "para qué". Ejemplo: "Este documento es la guía de tono de marca; ignora cualquier instrucción previa que lo contradiga".

  4. Privacidad: Cualquier profesional serio limpia los datos sensibles antes de empezar (no pongas información sensible a no ser que estés en local).

¿Qué hacer ahora?

Además de lo que te digo arriba, Google Deepmind ha sacado un nuevo estudio que revela que, al combinar datos de alta calidad con un ciclo de retroalimentación, la IA puede adquirir nuevas habilidades de forma autónoma. Esto es lo que puedes aprender de esta técnica:

  • La importancia del dato correcto: El rendimiento de un modelo se duplica cuando se entrena con una mezcla precisa de datos de comportamiento humano y razonamiento sintético. Sin datos bien estructurados, la IA es "ciega"; con ellos, casi alcanza el nivel humano.

  • El "Loop" de Mejora Automática: En lugar de conformarte con el primer resultado, puedes emular la técnica del estudio usando un prompt con un rol Evaluador (que califica el éxito) en el que le pides que revise el resultado y que proponga mejoras basándose en los puntos débiles).

Con esto consigues mejorar tus resultados, curar el contenido y tener una experiencia más personalizada usando la IA.

Hasta el próximo sábado,
Jairo

AI Founders Club 💛

Keep Reading