Clustering de recetas culinarias generadas por Giuseppe
Professor Advisor
dc.contributor.advisor
Pérez Rojas, Jorge
Author
dc.contributor.author
Moreno Cortez, Juan Andrés
Associate professor
dc.contributor.other
Bergel, Alexandre
Associate professor
dc.contributor.other
Pichara Baksai, Karim
Associate professor
dc.contributor.other
Saavedra Rondo, José
Admission date
dc.date.accessioned
2020-09-11T02:55:23Z
Available date
dc.date.available
2020-09-11T02:55:23Z
Publication date
dc.date.issued
2020
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/176767
General note
dc.description
Memoria para optar al título de Ingeniero Civil en Computación
es_ES
Abstract
dc.description.abstract
The Not Company es una empresa de Foodtech chilena cuya misión fundamental es utilizar solo ingredientes vegetales para reproducir productos alimenticios que comúnmente utilizan ingredientes animales. El ciclo de desarrollo de un producto nuevo comienza con el sistema de Inteligencia Artificial de NotCo: Giuseppe. Giuseppe genera miles de combinaciones de ingredientes vegetales (en este contexto, las fórmulas) que buscan reproducir el sabor, textura, aroma y retro gusto de un alimento en particular. Posteriormente, el equipo de Machine Learning de la empresa selecciona un pequeño subconjunto de fórmulas, las que finalmente son entregadas al equipo de Chefs, quienes las analizan y cocinan, para dar con aquella fórmula que reproduce más fielmente el producto objetivo.
El presente documento detalla el desarrollo de un algoritmo que apoya un nuevo proceso de selección de fórmulas. El algoritmo desarrollado encuentra automáticamente familias de fórmulas con perfiles sensoriales similares, y que en consecuencia, comparten un conjunto de ingredientes en común. Para lograr esto, representamos cada fórmula por un vector numérico de características moleculares las cuales buscan reproducir indirectamente el perfil sensorial1 de la fórmula. Posteriormente, reducimos la dimensión de los vectores utilizando el algoritmo de reducción de dimensionalidad UMAP y luego utilizamos el algoritmo de clustering HDBSCAN para identificar, en el espacio reducido, las familias de fórmulas con perfiles sensoriales equivalentes.
Para validar con los Chefs si efectivamente los clusters obtenidos corresponden a fórmulas con perfiles sensoriales similares, utilizamos la técnica de validación de clusters con expertos propuesta en el trabajo de Hatzivassiloglou y McKeown. Aplicamos la metodología de validación sobre 5 alimentos distintos, cárnicos y no cárnicos. El algoritmo desarrollado obtuvo un puntaje F1 promedio de 0,55, este número aumenta a 0,64 si solo consideramos los alimentos no cárnicos. Encapsulamos el algoritmo en una herramienta de línea de comando la cual, dado un conjunto de fórmulas, retorna las k fórmulas con perfiles sensoriales distintos pero más similares al producto objetivo en cuestión. Adicionalmente, para cada una de las k familias de fórmulas sensorialmente equivalentes asociadas entregamos las m mejores fórmulas.
Las fórmulas seleccionadas por la herramienta de línea de comando son subidas a una herramienta web interna de la empresa en la cual los Chefs pueden participar activamente del proceso de selección de fórmulas, a través de la exploración de las familias de fórmulas seleccionadas.
La solución desarrollada es de carácter exploratoria, considera el conjunto completo de fórmulas y su resultado permite involucrar completamente a los Chefs en el proceso de selección de fórmulas. El resultado obtenido por la solución desarrollada en el proceso de validación con expertos entrega evidencia de que el vector de características moleculares puede ser utilizado para representar las fórmulas y encontrar aquellas con perfiles sensoriales similares.