Clustering de recetas culinarias generadas por Giuseppe
Tesis
Publication date
2020Metadata
Show full item record
Cómo citar
Pérez Rojas, Jorge
Cómo citar
Clustering de recetas culinarias generadas por Giuseppe
Author
Professor Advisor
Abstract
The Not Company es una empresa de Foodtech chilena cuya misión fundamental es utilizar solo ingredientes vegetales para reproducir productos alimenticios que comúnmente utilizan ingredientes animales. El ciclo de desarrollo de un producto nuevo comienza con el sistema de Inteligencia Artificial de NotCo: Giuseppe. Giuseppe genera miles de combinaciones de ingredientes vegetales (en este contexto, las fórmulas) que buscan reproducir el sabor, textura, aroma y retro gusto de un alimento en particular. Posteriormente, el equipo de Machine Learning de la empresa selecciona un pequeño subconjunto de fórmulas, las que finalmente son entregadas al equipo de Chefs, quienes las analizan y cocinan, para dar con aquella fórmula que reproduce más fielmente el producto objetivo.
El presente documento detalla el desarrollo de un algoritmo que apoya un nuevo proceso de selección de fórmulas. El algoritmo desarrollado encuentra automáticamente familias de fórmulas con perfiles sensoriales similares, y que en consecuencia, comparten un conjunto de ingredientes en común. Para lograr esto, representamos cada fórmula por un vector numérico de características moleculares las cuales buscan reproducir indirectamente el perfil sensorial1 de la fórmula. Posteriormente, reducimos la dimensión de los vectores utilizando el algoritmo de reducción de dimensionalidad UMAP y luego utilizamos el algoritmo de clustering HDBSCAN para identificar, en el espacio reducido, las familias de fórmulas con perfiles sensoriales equivalentes.
Para validar con los Chefs si efectivamente los clusters obtenidos corresponden a fórmulas con perfiles sensoriales similares, utilizamos la técnica de validación de clusters con expertos propuesta en el trabajo de Hatzivassiloglou y McKeown. Aplicamos la metodología de validación sobre 5 alimentos distintos, cárnicos y no cárnicos. El algoritmo desarrollado obtuvo un puntaje F1 promedio de 0,55, este número aumenta a 0,64 si solo consideramos los alimentos no cárnicos. Encapsulamos el algoritmo en una herramienta de línea de comando la cual, dado un conjunto de fórmulas, retorna las k fórmulas con perfiles sensoriales distintos pero más similares al producto objetivo en cuestión. Adicionalmente, para cada una de las k familias de fórmulas sensorialmente equivalentes asociadas entregamos las m mejores fórmulas.
Las fórmulas seleccionadas por la herramienta de línea de comando son subidas a una herramienta web interna de la empresa en la cual los Chefs pueden participar activamente del proceso de selección de fórmulas, a través de la exploración de las familias de fórmulas seleccionadas.
La solución desarrollada es de carácter exploratoria, considera el conjunto completo de fórmulas y su resultado permite involucrar completamente a los Chefs en el proceso de selección de fórmulas. El resultado obtenido por la solución desarrollada en el proceso de validación con expertos entrega evidencia de que el vector de características moleculares puede ser utilizado para representar las fórmulas y encontrar aquellas con perfiles sensoriales similares.
General note
Memoria para optar al título de Ingeniero Civil en Computación
Identifier
URI: https://repositorio.uchile.cl/handle/2250/176767
Collections
The following license files are associated with this item: