Tus datos valen más de lo que crees, y están peor de lo que crees
Todo el mundo quiere IA. Casi nadie quiere mirar el estado real de sus datos, que es justo lo que decide si la IA va a funcionar.
Hay una conversación que se repite. Una empresa quiere usar IA para algo concreto, nos enseña la idea, y suena bien. Luego pedimos ver los datos con los que se supone que va a funcionar, y se hace el silencio. Resulta que los datos están en cinco sitios distintos, con formatos que no casan y campos que cada persona rellena a su manera.
La IA aprende de lo que le das. Si le das un archivo donde el mismo cliente aparece tres veces escrito de tres formas, no esperes magia. Lo que hace es repetir tu desorden a gran escala. La parte aburrida de tener los datos limpios y en un sitio es la que decide si lo demás vale algo.
Lo curioso es que casi ninguna empresa sabe el estado real de sus datos hasta que los mira de cerca. Se asume que están bien porque el negocio funciona. Y el negocio funciona porque hay personas tapando los huecos a mano, cuadrando cosas que el sistema da mal, recordando excepciones que no están escritas en ningún lado.
Esos datos imperfectos valen mucho dinero, aunque no lo parezca. Años de pedidos y de incidencias resueltas son justo lo que haría útil a una IA específica para tu negocio, algo que tu competencia no tiene. El problema es que ese valor está enterrado bajo el desorden.
Antes de pensar en modelos, vale la pena hacer algo menos glamuroso: juntar los datos en un sitio y ponerse de acuerdo en cómo se llama cada cosa. Y arreglar los errores más gordos antes de seguir. No es emocionante y nadie lo presume en una demo, pero es el trabajo que hace que todo lo demás sea posible.
Cada vez que alguien me pide IA, antes de hablar de modelos pregunto otra cosa: '¿puedo ver tus datos?'. La cara que ponen suele decirme cuánto camino queda antes de la parte divertida.
