¿Realmente funciona estimar calorías con una foto? La ciencia detrás de Tabeku

A menudo recibimos preguntas que mezclan asombro y escepticismo lógico. Muchos usuarios, acostumbrados a las aplicaciones de nutrición del pasado, nos plantean una duda muy válida:

“¿Cómo puede una app saber cuántas calorías y gramos de macros tiene mi comida con solo mirarla mediante una fotografía?”

Después de años teniendo que buscar alimentos manualmente y pesarlos gramo a gramo todos los días, es comprensible que una función de estimación visual parezca magia o una exageración publicitaria.

Pero lo que opera cada vez que pulsas el botón de la cámara no tiene nada que ver con la magia. Se trata de una conjunción tecnológica de redes neuronales de visión por ordenador (Computer Vision) operando junto con modelos de lenguaje masivos (LLMs).

A continuación, vamos a desglosar exactamente cómo funciona este proceso desde que tomas la foto hasta que obtienes tus macronutrientes.

Los 3 pilares que posibilitan la revolución visual de Tabeku

Hacer que la cámara entienda la nutrición es uno de los hitos tecnológicos recientes más útiles. Nuestro sistema combina varias capas de inteligencia artificial capaces de analizar datos complejos en microsegundos:

1. Detección y análisis visual de ingredientes (Computer Vision)

El primer paso es identificar los componentes del plato. Sin embargo, el sistema no se conforma con clasificar simplemente “carne” o “pan”. Las redes neuronales están entrenadas con millones de imágenes para detectar texturas, densidades y estados de cocción.

Por ejemplo, analizando el tamaño de los poros de la miga y el tono del horneado, puede diferenciar una esponjosa rebanada de brioche rica en mantequilla de un denso pan integral de centeno. Además, la IA examina los reflejos y el brillo visual de los alimentos para descubrir la presencia de aceites de cocción añadidos. Puede determinar si una patata está asada al natural, salteada o profundamente frita, ajustando drásticamente el impacto calórico estimado.

2. Inferencias de volumetría 3D y perspectiva

Localizar un trozo de salmón en una foto es solo la mitad de la ecuación; determinar cuánto pesa es el verdadero desafío. Una simple imagen en 2D no basta para saber la profundidad de un alimento.

Calculando la perspectiva geométrica y utilizando referencias visuales universales (como el tamaño estándar de los cubiertos, el diámetro habitual de un plato o el ángulo de la cámara), los algoritmos infieren el volumen tridimensional de las porciones.

El sistema entiende el concepto de densidad nutricional: sabe que un bol lleno de hojas de espinaca ocupa un gran volumen visual pero posee una bajísima cantidad de calorías, mientras que apenas una cucharada grande de mantequilla de cacahuete, ocupando una fracción de ese espacio visual, representa un valor calórico diez veces mayor.

3. Contexto humano a través de Modelos de Lenguaje (LLM)

Los algoritmos de visión por ordenador son excelentes reconociendo píxeles, pero carecen de sentido común humano. Por eso, los datos visuales detectados se pasan por un modelo de lenguaje masivo (LLM), que aporta un contexto situacional y cultural profundo.

Imagina que haces una foto a un clásico recipiente de cartón de comida para llevar que contiene fideos orientales. La IA visual detectará “fideos, carne, vegetales”. Pero el LLM razona un paso más allá:

“Este es un envase típico de un restaurante comercial de comida rápida oriental. Los fideos presentan un aspecto glaseado oscuro que sugiere un aderezo generoso con salsas a base de soja dulce y azúcares, cocinado en un wok con abundante aceite vegetal.”

De esta forma, la aplicación añade automáticamente a la estimación estructural aquellos ingredientes “invisibles” (grasas ocultas, endulzantes, reducciones de salsas) que esconden la mayoría de las calorías de origen comercial y que son la principal causa de estancamiento en la pérdida de grasa de las personas.

El factor clave: El aprendizaje iterativo constante

Lo que hace verdaderamente potente a Tabeku frente a una base de datos estática es su capacidad de aprendizaje iterativo.

Si alguna vez la IA interpreta que tu plato de puré de patata es en realidad hummus (un error posible dada la similitud visual), tú puedes intervenir y corregir a la aplicación diciendo “No, es puré de patatas”.

El modelo asimila esta corrección en tiempo real interactuando contigo de forma conversacional, actualiza los macronutrientes del registro actual y utiliza estos puntos de datos de feedback para afinar su precisión a nivel global a lo largo del tiempo.

El objetivo final: Constancia sin fricción

Ningún algoritmo visual será perfecto al 100%, del mismo modo que el propio etiquetado nutricional comercial tiene márgenes de error permitidos por la ley de hasta un 20%. Exigir perfección matemática a un plato de comida es un enfoque biológicamente erróneo.

La verdadera meta de la IA de Tabeku es reducir a cero la fricción logística del registro diario. Al eliminar el proceso aburrido, lento y burocrático de contar calorías o buscar códigos de barras, evitas la fatiga mental. Y cuando el proceso te resulta fácil y no interfiere con tu vida social, multiplicas radicalmente tus probabilidades de mantener hábitos nutricionales efectivos para siempre.