SERVICIOS
Desarrollo de Modelos focalizados en la Interpretabilidad

A diferencia de otras áreas, como la Ingeniería de Software, apenas se han desarrollado metodologías, flujos de trabajo o ciclos de vida para abordar las diferentes fases en la implementación de soluciones basadas en procesos de Inteligencia Artificial. No fue hasta finales de los años 80 cuando surgieron las primeras propuestas a partir de una mezcla de Ingeniería de Software e Inteligencia Artificial, apareciendo el primer enfoque metodológico para el campo de la Minería de Datos, llamado CRISP-DM, que obtuvo un amplio reconocimiento en el mundo académico y en la industria como un estándar de facto para el uso de la Inteligencia Artificial en la toma de decisiones y la resolución práctica de problemas.
CRISP-DM es uno de los sistemas más comunes para la minería y análisis de datos aplicado en muchas empresas. Consta de seis fases iterativas: Comprensión del negocio, donde el objetivo y la meta del negocio se construyen en torno al proyecto; comprensión de datos, que implica adquisición y exploración de datos; Preparación de datos donde se eliminan y transforman los datos; Modelización donde se aplican modelos estadísticos o de aprendizaje automático a los datos; Evaluación en la que se determina el rendimiento del modelo y su adecuación a los objetivos y metas empresariales establecidos; Implementación en la que el modelo se coloca en un entorno de producción para generar información. Basado en datos, CRISP-DM puede cambiar de fase en función de los resultados y garantiza que el proceso de Ciencia de Datos sea coherente para alcanzar los objetivos de una empresa.
Muchas de las ampliaciones posteriores a lo largo de los años se han realizado para adaptarse a propósitos diversos en diferentes contextos que van desde Big Data hasta ciberseguridad, incluyendo fintech, por nombrar algunos. Con el tiempo, el uso conjunto de la Inteligencia Artificial con estadística, análisis de datos e informática, con un enfoque orientado al análisis de Big Data, ha dado lugar a un campo interdisciplinar que generalmente se denomina Ciencia de Datos (Data Science). Esto, junto con la aparición de plataformas de computación en la nube disponibles para las empresas, que les permiten lanzar rápidamente proyectos basados en Ciencia de Datos, ha llevado al desarrollo de nuevos enfoques metodológicos más avanzados que CRISP-DM, promovidos por grandes empresas tecnológicas, como el propuesto por AWS (Amazon Web Services) o el TDSP (Team Data Science Process) de Microsoft o el flujo de trabajo diseñado por Google. Más allá de las propuestas de grandes empresas, se han propuesto varios enfoques en forma de marcos reconocidos en el sector, como CRISP-DM, CRISP-Machine Learning(Q), OSEMN, LADM, DDM, AGILE DATA SCIENCE o SEMMA. Por otro lado, existen enfoques ampliamente reconocidos desde la perspectiva académica, como los trabajos de AAKASH TANDEL, JOHN THOMAS, AAKANKSHA JOSHI y PHILIP GUO, en forma de flujos de trabajo bien definidos. Finalmente, existen otros trabajos científicos de aplicación también de interés.
Todas las propuestas existentes, tanto del ámbito empresarial como del ámbito académico, reconocidas, que cuentan con un diseño y definición suficientes para considerarlas marcos válidos, y que se usan o pueden utilizarse en la práctica para abordar proyectos reales, han sido detalladamente analizadas por AuditAI, y en base a las mismas, se ha desarrollado una metodología propia que recoge lo mejor de cada una de las existentes, supliendo las deficiencias que esas tienen.
La metodología de desarrollo de AuditAI se ha realizado con un enfoque basado en datos, siguiendo la filosofía del modelo estándar abierto para la Minería de Datos CRISP-DM, junto con el enfoque metodológico de Analítica Ágil y PMBOK en la parte de planificación de una implementación adaptada a necesidades empresariales reales, y siguiendo el estándar de mantenimiento OSA-CBM (Arquitectura de Sistema Abierto para Mantenimiento Basado en Condiciones), y utilizando para el desarrollo de modelos algorítmicos los flujos de trabajo de Ciencia de Datos utilizados por AWS Machine Learning Lens, Microsoft y Google, así como otras buenas prácticas que los profesional es de la Ciencia de Datos llevan años desarrollando en forma de estándares como el Proceso Estándar Interindustrial para Minería de Datos y OSEMN.Se estructura en seis dominios compuestos por diferentes procesos, 39 en total, que permiten abordar un Ciclo de Vida completo para el desarrollo de modelos de IA bajo un enfoque de Ciencia de Datos adecuado para este tipo de problemas.