Saltar al contenido

Informe: el 75% de los desarrolladores dicen que son responsables de la calidad de los datos

A finding from the 2nd SD Times Data Quality Survey

Resultado de la segunda encuesta de calidad de datos de SD Times

Casi tres cuartas partes de los desarrolladores dicen que son responsables de administrar la calidad de los datos que utilizan en sus aplicaciones, un hallazgo clave de la segunda encuesta de calidad de datos de SD Times, realizada en colaboración con un proveedor de administración de datos. Toronjil en julio.

En la encuesta del año pasado, el número de desarrolladores que asumieron esta responsabilidad fue inferior al 50%, lo que respalda la suposición de que el rol del desarrollador de software se extiende más allá de la escritura de código.

Dado que las empresas incluyen seguridad, pruebas, gobernanza e incluso marketing y finanzas en las primeras etapas del ciclo de vida de la aplicación, los tiempos de entrega cada vez más cortos significan que los desarrolladores están bajo presión de tiempo y la calidad de los datos a menudo sigue siendo un pensamiento «ojalá correcto» para los equipos de desarrollo.

Otras conclusiones clave incluyen que el principal problema que enfrentan los equipos de desarrollo es la inconsistencia de los datos que necesitan usar, seguida de cerca por datos incompletos y datos antiguos / incorrectos. La primera opción del año pasado, las fechas dobles, cayó en cuarto lugar este año. Fechas incorrectas y juegos de caracteres internacionales completan la categoría.

Debido a estos problemas de datos, los encuestados dijeron que pasan alrededor de 10 horas a la semana lidiando con problemas de calidad de datos y dedicando tiempo al desarrollo de nuevas aplicaciones.

A pesar de estos problemas, alrededor del 83% de los encuestados dijo que sus organizaciones conocen los datos o son conscientes de los datos, mientras que solo el resto dice que conocen los datos (15%) y se basan en los datos (alrededor del 2%).

«Los datos son fundamentales para el éxito de las empresas en todo el mundo, y darse cuenta de que un número tan pequeño se considera experto o impulsado por los datos es algo alarmante», dijo David Lyman, editor de SD Times. «Con los avances en la protección de datos y la gobernanza en todo el mundo, debería ser una llamada de atención para que toda la industria vea que las empresas aún no mantienen sus datos».

James Royster, jefe de análisis de Adamas Pharmaceutical y ex director senior de análisis y estrategia de datos de la empresa biofarmacéutica Celgene, dijo que un gran problema para las empresas con sus datos es que grandes cantidades de datos contienen «miles de matices».

Como ejemplo, Royster citó a IQVIA, un proveedor de soluciones de conectividad de datos de atención médica que recopila datos de más de 60,000 farmacias, cada una de las cuales dispensa cientos y miles de medicamentos, sueros y más. También atienden hospitales y consultorios médicos. Entonces, dijo, “hay millones de fuentes potenciales de error”. Y para que las empresas creen estos registros, los desarrolladores necesitan escribir código que reúna esos registros para que una organización los asimile. Y es un proceso continuo. «Cuando cambian el código, actualizan el código, recopilan datos, sea lo que sea, hay un millón de formas en las que las cosas pueden salir mal».

Sin embargo, los problemas de datos no son exclusivos de las grandes organizaciones. Las empresas más pequeñas también tienen problemas con los datos porque no tienen los recursos para recopilar correctamente los datos que necesitan y monitorear los cambios, además de que alguien en la base de datos se comunique con ellos para informarles que algo ha cambiado en sus datos.

Por ejemplo, las empresas más pequeñas pueden utilizar un formulario para recopilar datos para los usuarios, pero muchos usuarios proporcionan datos incorrectos para evitar contactos no deseados. El problema, dijo Royster, es que “nadie lo revisa, ni lo resume, ni aplica ningún tipo de lógica para decir que debería ser. Son solo datos que entran … datos que salen. Y si los datos ingresados ​​son incorrectos, lo que sale es incorrecto «.

Source link