Inteligencia Artificial e Inocuidad Alimentaria
El año 2023 ha sido para la inteligencia artificial (IA) lo que 1993 fue para Internet: el año en que estuvo disponible para las masas. Si bien el debate público sobre el impacto de la IA en la sociedad apenas ha comenzado, uno de sus aspectos más fascinantes es su potencial para generar predicciones elaboradas basadas en un análisis de inmensos volúmenes de datos.
Durante los últimos años, investigadores y reguladores han intentado aplicar esta capacidad a la inocuidad alimentaria. La FDA ha incluido el análisis de datos en parte de su Plan de Nueva Era de Seguridad Alimentaria Más Inteligente, una iniciativa que la agencia lanzó en 2020 que busca reducir la cantidad de enfermedades transmitidas por los alimentos aprovechando la tecnología para crear un sistema alimentario más seguro, más digital y más fácilmente rastreable.
COMPARTIR DATOS EN EL CAMPO
Las organizaciones de inocuidad alimentaria también se han sumado al movimiento de la IA. Una plataforma en línea desarrollada por la Western Growers Association, una organización comercial que comprende a más de 2200 agricultores, tiene como objetivo permitir a los usuarios compartir datos sobre inocuidad alimentaria. Esta red, llamada GreenLink, comenzó en 2021 en asociación con Creme Global, una empresa de análisis de datos con sede en Irlanda, y seis miembros participantes y ha crecido enormemente, llegando a 140 productores y 6 millones de puntos de datos. “Nuestro objetivo es capturar y analizar datos de inocuidad alimentaria de campo para que cada operación pueda verlos individualmente y compararlos con datos agregados de otras operaciones”, dice De Ann Davis, PhD, vicepresidente senior de ciencia de la Western Growers Association.
La plataforma GreenLink planea utilizar modelos tanto descriptivos como predictivos para el análisis. “Por ejemplo, si una prueba de agua arroja un nivel alto de E. coli, nos gustaría poder utilizar análisis descriptivos para explicar qué es lo que probablemente está causando eso, y análisis predictivos para comprender [si] se espera que ese valor sea alto en ese período del año”, dice el Dr. Davis. Sin embargo, no se ha implementado el uso de análisis predictivo; Los conjuntos de datos de GreenLink aún no son lo suficientemente consistentes como para empezar a hacer predicciones. “Eso no significa que dentro de seis meses no podamos hacerlo”, añade.
Este nivel insuficiente de coherencia tiene que ver con la libertad que el proyecto deja a los participantes para decidir qué datos compartir, por ejemplo, ubicación del campo, resultados de pruebas de agua o patógenos, o actividad de las aves. Esta flexibilidad tiene como objetivo alentar a los miembros a compartir información que normalmente se trata como confidencial.
El desafío de recopilar datos no públicos es un aspecto de la IA en el que el factor humano está muy presente. Cuando los datos confidenciales de la empresa son esenciales para desarrollar herramientas de inteligencia artificial, compartirlos no es un acto espontáneo realizado por el algoritmo; más bien, es una decisión empresarial que se toma para medir el riesgo frente a la recompensa.
El Dr. Davis dice que éste es el problema del huevo y la gallina: “La gente quiere saber qué se les va a ofrecer antes de profundizar en los datos, pero no se puede ofrecer nada si no se les proporciona datos primero. Por lo tanto, también es una cuestión de equilibrar el valor que obtienen con la cantidad de datos que ingresan”.
POR QUÉ LA INDUSTRIA AGRÍCOLA ESTÁ MADURA PARA LA IA
De hecho, los productores pueden mostrarse receptivos a la idea de compartir datos. Matt Stasiewicz, PhD, profesor asociado de inocuidad alimentaria aplicada en la Universidad de Illinois Urbana-Champaign, dice: “Si bien la industria de productos agrícolas está bien controlada, todavía estamos viendo brotes. Sin embargo, ninguna empresa observará suficientes eventos de contaminación para comprender realmente qué está generando ese riesgo. La gente está empezando a darse cuenta de que compartir datos entre empresas puede ser la forma de encontrar respuestas a esas preguntas”.
El Dr. Stasiewicz es uno de los líderes del sitio de su universidad para el Instituto de IA para Sistemas Alimentarios (AIFS), un consorcio formado por seis universidades y el USDA. Uno de los objetivos del grupo es crear una base de datos impulsada por IA basada en información recopilada de proyectos de investigación públicos, con un enfoque específico en datos de pruebas microbiológicas de campos en crecimiento: “El simple hecho de saber que una prueba fue positiva o negativa no es realmente predictivo”. dice el Dr. Stasiewicz. “Es mucho más útil descubrir qué más de esa muestra podría ayudar a predecir el resultado, como cómo se tomó la muestra, su tamaño, el método de ensayo o el tamaño del campo. Eso se puede combinar con datos disponibles públicamente, como patrones climáticos, la presencia de aves migratorias o un patrón de viento específico que puede estar arrastrando polvo desde algún otro lugar”.
APRENDIZAJE FEDERADO
Lograr que los productores e investigadores compartan datos puede ser un desafío, un desafío con el que el Dr. Stasiewicz ciertamente está familiarizado. “Nadie va a compartir conmigo, como académico, un montón de datos”, dice. “Incluso si no está claro cuál es el riesgo, si no se puede definir un beneficio, no vale la pena hacerlo. Si queremos mostrar un camino para compartir información sobre inocuidad alimentaria de una manera no competitiva y sin riesgos, necesitamos encontrar una manera de proporcionar más valor que el análisis estándar de causa raíz”.
Una forma de reducir el riesgo percibido de compartir datos es eliminar la información de identificación personal: “No necesariamente necesitamos el nombre de una empresa, la ubicación de las instalaciones y una fecha de muestra. Lo que necesitamos son relaciones: saber, por ejemplo, que dos muestras proceden de la misma instalación”, afirma el Dr. Stasiewicz.
Otro método sería no exigir el intercambio de datos en primer lugar. Este enfoque se llama aprendizaje federado. Bas van der Velden, PhD, jefe de ciencia de datos en Wageningen Food Safety Research (WFSR), una organización de investigación con sede en Utrecht, Países Bajos, dice: “En el modelo tradicional, se recopilan datos en un lugar centralizado y se los utiliza para entrenar el algoritmo. En el aprendizaje federado, es el algoritmo el que va a las estaciones de datos (que pueden ser una computadora, un teléfono inteligente o un servidor) pero, en lugar de regresar con los datos, simplemente recupera el modelo optimizado. Los datos nunca abandonan su ubicación original”.
A través de este modelo, WFSR y otras empresas asociadas e instituciones de investigación están contribuyendo a un proyecto financiado por la UE llamado Extreme Food Risk Analytics (EFRA). El objetivo de la organización es desarrollar herramientas de prevención de riesgos alimentarios basadas en inteligencia artificial utilizando lo que llama “minería de datos extrema”.
El Dr. van der Velden explica que la siguiente fase del proyecto será llevar este modelo a un entorno real de producción de alimentos trabajando con un gran productor avícola europeo como estudio de caso. “Planeamos aplicar el enfoque de aprendizaje federado para entrenar la herramienta de IA con todo tipo de datos internos y externos. Un posible caso de uso podría ser un sistema de alerta temprana que indique que hay un patrón indicativo de peligro microbiológico a corto o largo plazo”, afirma.
Otro aspecto crucial de la inocuidad alimentaria en el que está trabajando WFSR, y del que normalmente carece el aprendizaje automático, es un concepto llamado “explicabilidad”, añade el Dr. van der Velden. “Si simplemente le dice a un agricultor que no coseche o que no riegue hoy porque el algoritmo así lo dice, probablemente no tendrá una adaptación exitosa. La IA explicable explica por qué una determinada acción es importante en un lenguaje adaptado a cada usuario, ya sean formuladores de políticas, agricultores, investigadores o ciudadanos promedio”, añade.
INFORMACIÓN DE CONEXIÓN
Un tipo de IA que hace un uso masivo de la información pública es un modelo desarrollado por Agroknow, una empresa de análisis y datos con sede en Atenas, Grecia. La empresa utiliza tecnología de inteligencia artificial para recopilar datos públicos sobre seguridad alimentaria, como retiradas de productos, rechazos fronterizos o inspecciones de instalaciones, y combinarlos con la información interna de las empresas alimentarias. “Parte de nuestro trabajo consiste en descubrir anuncios ocultos en los sitios web de autoridades públicas de todo el mundo y traducirlos al inglés”, afirma Nikos Manouselis, director general de Agroknow. “Cuando el municipio de Atenas inspecciona un establecimiento alimentario de la región y descubre un problema, lo anuncia en griego en su sitio web. De la misma manera, la FDA publica sus anuncios más importantes en una o dos páginas, pero también hay otras páginas que nadie mira”.
Una vez que se extraen todos estos datos públicos, Agroknow utiliza IA para conectar piezas de información que, aunque aparentemente no están relacionadas, probablemente se refieren al mismo evento: “Puede haber un artículo de noticias sobre cinco personas que se enfermaron de Salmonella después de consumir un producto de pollo”. En Creta, y un anuncio público sobre la retirada del mismo producto, zona y días, donde se especifica el serotipo. El algoritmo los relacionaría y proporcionaría una descripción completa del evento, asignando una puntuación de confiabilidad”, dice Manouselis.
Cuando todos estos datos se analizan y armonizan con el uso de la IA, se les da a las empresas de alimentos una idea precisa de los riesgos actuales en la cadena de suministro. Cuando se agregan sus datos internos, como resultados de inspecciones, auditorías y pruebas de laboratorio, el panorama está completo.
Manouselis dice que esta información se puede utilizar para evaluar el riesgo relacionado con los ingredientes o los proveedores casi en tiempo real. “Si hay un aumento en la contaminación por óxido de etileno en las semillas de sésamo y es uno de mis ingredientes, sabré que tengo que realizar más pruebas. Si uno de mis proveedores u otros proveedores en la misma área estuvo involucrados en incidentes de fraude o inocuidad alimentaria, me abasteceré de una región diferente”.
Sin embargo, el uso más interesante e impactante de este modelo es anticipar tendencias para asignar mejor los recursos de prueba y auditoría, lo cual es especialmente importante para las grandes empresas de alimentos con extensas cadenas de suministro. “Cuando estábamos en plena crisis del óxido de etileno, todo el mundo hacía muchas más pruebas”. En algún momento, nuestros modelos de pronóstico mostraron que el riesgo estaba disminuyendo. Para nuestros clientes, eso fue una señal de que podían comenzar a realizar menos pruebas para el tratamiento con óxido de etileno y redirigir recursos a otras áreas”.
En este momento, la puntuación de precisión del modelo de pronóstico típico de Agroknow oscila entre el 80% y el 95%. Pero para Manouselis, incluso un nivel más bajo podría ser útil: “No lo vamos a mantener encerrado hasta que llegue al 100%. Preferimos ponerlo en manos de nuestros clientes y dejar que ellos decidan si les resulta útil o no; muy a menudo nos dicen que incluso el 40% les bastaría para tomar mejores decisiones”.
Manouselis advierte que una parte importante para hacer que las herramientas de IA sean útiles y accesibles es desmitificarlas: “La IA no es magia negra; es un modelo científico”, dice. “Lo entrenas con datos, te devuelve resultados; validas estos resultados y mejoras el modelo con más datos. Es un ciclo constante”.
By Andrea Tolu