El verdadero costo de los datos de baja calidad en la era de la inteligencia artificial

Publicado por Emprendimiento en

Más del 80% de los proyectos de IA no alcanzan la fase de producción o no generan el retorno esperado debido a problemas con los datos. Falta de auditoría, uso de datos desactualizados y ausencia de gestión son algunos de los errores más frecuentes en los proyectos de IA.

Los desafíos que enfrentan los proyectos de inteligencia artificial van más allá de la mera implementación tecnológica, adentrándose en el intrincado mundo de la calidad y gestión de los datos. Mientras la tasa de adopción de la IA en las empresas globales ha crecido significativamente, pasando del 55% en 2023 al 78% en 2024, según datos de McKinsey, el éxito de estas iniciativas sigue siendo un problema. De hecho, BCG señala que un 74% de las empresas aún no logran un retorno de inversión claro con sus proyectos de IA, lo que subraya una brecha crucial entre la promesa y la realidad.

La situación es aún más compleja, ya que la mala calidad de los datos tiene un impacto tangible y cuantificable. Un informe reciente del MIT y Gartner revela que un alarmante 95% de los proyectos piloto de IA generativa fracasan en generar rendimientos medibles. Esta cifra es un claro indicativo de que el problema no es la capacidad de la tecnología para crear, sino la base defectuosa con la que se entrena. Las organizaciones están invirtiendo en infraestructura y talento, pero el costo de la mala gestión de los datos se convierte en un lastre financiero importante. Se estima que la limpieza, el etiquetado y el almacenamiento de datos pueden representar hasta el 30% del costo total de un proyecto de IA, y la mala calidad de la información inevitablemente infla este gasto, llevando a muchas iniciativas a ser abandonadas antes de alcanzar la fase de producción.

Los fallos de la IA impulsados por datos defectuosos no son hipotéticos, sino que se manifiestan en ejemplos reales que han tenido un impacto significativo.

El costo de los datos de mala calidad es un factor que muchas organizaciones subestiman. Se ha estimado que las empresas pierden anualmente cerca del 15% de sus ingresos debido a este problema, lo que subraya el impacto financiero directo. Este costo no solo se manifiesta en la pérdida de oportunidades de negocio, sino también en un aumento significativo de los gastos operativos. El tiempo que los empleados dedican a corregir información errónea es considerable, y se calcula que la limpieza, el etiquetado y la preparación de los datos pueden representar entre el 15% y el 35% del presupuesto total de un proyecto de IA. Esta cifra se infla aún más cuando los datos son de mala calidad, convirtiéndose en un cuello de botella que retrasa la implementación y aumenta los costos.

Un caso notorio fue el de Zillow Offers, que cerró en 2021 tras sufrir pérdidas masivas. La compañía no logró valorar con precisión las viviendas debido a los algoritmos defectuosos de su modelo de valoración de propiedades, que se alimentaba de datos de mercado incompletos y desactualizados. Este es un recordatorio contundente de que, sin datos precisos que reflejen la realidad del mercado, incluso los modelos más sofisticados están condenados al fracaso.

Además, la falta de una gestión de datos sólida y la inversión insuficiente en la capacitación de los empleados contribuyen a agravar el problema. Los datos de una encuesta reciente de Qlik muestran que el 81% de las empresas aún tienen dificultades con la calidad de los datos para la IA. Se espera que, para las empresas con ingresos superiores a los 5 mil millones de dólares, esta deficiencia pueda desencadenar una crisis importante. Este escenario subraya la urgencia de que las compañías no solo se concentren en la tecnología, sino que también inviertan en la cultura de los datos, asegurándose de que el personal tenga las habilidades para interpretar y validar la información que alimenta a estos sistemas.

El fracaso de los proyectos no es solo un problema de números, sino también de credibilidad y confianza. La desconfianza generada por proyectos de IA que no cumplen sus promesas puede frenar la adopción futura de la tecnología.

Los modelos de IA, especialmente los generativos, son especialmente vulnerables a los datos sesgados o erróneos, lo que puede llevar a resultados inaceptables, como la propagación de información falsa o la toma de decisiones injustas. La inversión en talento especializado para gestionar estos desafíos es otro factor de costo crucial. Un equipo de datos puede costar millones de dólares anualmente, y la falta de profesionales calificados agrava el problema, pues las empresas a menudo se ven obligadas a aceptar recomendaciones de los algoritmos sin la validación humana necesaria. El camino hacia la IA exitosa, por tanto, no pasa por una simple adquisición de tecnología, sino por un compromiso profundo con la calidad, la gestión y la formación, pilares esenciales para desbloquear el verdadero potencial de esta revolución tecnológica.

Ver fuente

Categorías: Emprendimiento