Please use this identifier to cite or link to this item: https://repository.hneu.edu.ua/handle/123456789/38398
Title: Використання CNN для багатокласової класифікації та класифікації з багатьма мітками зображень їжі
Authors: Мінухін С. В.
Шапошник М. В.
Keywords: CNN
класифікація з багатьма мітками зображень їжі
Issue Date: 2025
Citation: Мінухін С. В. Використання CNN для багатокласової класифікації та класифікації з багатьма мітками зображень їжі / С. В. Мінухін, М. В. Шапошник // Інформаційно-комунікаційні технології та кібербезпека (IКTK-2025) : матеріали Міжнародної науково-технічної конференції, 04 – 05 грудня 2025 р. - Харків, ХНУРЕ, 2025. - С. 96-100.
Abstract: The article analyzes the problem of the "information bottleneck" in hybrid modular generative architectures for the image-to-recipe generation task. The analysis focuses on the theoretical flaws of a "naïve" modular approach, which, due to the high intra-class variability of the food domain, fails to provide the generative component with sufficient details, leading to the generation of template-based, non-relevant recipes. To solve this problem, an advanced architecture is proposed that implements the "Explicit Semantic Supervision" method. This approach is based on combining multiclass classification (CNN-1, identifying the dish class) and multilabel classification (CNN-2, identifying ingredients), implemented via parallel "heads" with different loss functions (CCE and BCE). The analysis confirms that this dual-component approach, which acts as an ensemble method, provides the generative component with visually-grounded details (class + ingredients) and allows for the generation of relevant descriptions, thus overcoming the bottleneck.
URI: https://repository.hneu.edu.ua/handle/123456789/38398
Appears in Collections:Статті (ІС)

Files in This Item:
File Description SizeFormat 
19-Minukhin_-Sektsiia-1.pdf382,76 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.