Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://repository.hneu.edu.ua/handle/123456789/11963
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.authorGorokhovatskyi O. V.-
dc.contributor.authorГороховатский А. В.-
dc.contributor.authorГороховатський О. В.-
dc.date.accessioned2016-05-27T07:48:01Z-
dc.date.available2016-05-27T07:48:01Z-
dc.date.issued2015-
dc.identifier.citationGorokhovatskyi O. Classification of text and graphic regions on a fragment of document image / O. Gorokhovatskyi // Electrotechnic and Computer Systems. – 2014. – № 13 (89) – P. 120-124en_US
dc.identifier.urihttp://www.repository.hneu.edu.ua/jspui/handle/123456789/11963-
dc.description.abstractThe goal of this paper is to develop a method for the classification of region of document image as graphic or text content type. As an input of the method segment (rectangular region of an image) containing a homogeneous content – text or graphic object – is used. Region analysis is performed on the assumption that it is a text region, projection partition allows to split this region into objects of smaller size. Construction of the narrative function characterizing areas of the image sub-elements is proposed. Feature size distribution for the next processing step is used for training and classification using support vector machines. Solving of the binary classification problem in general case of linear inseparability, based on a radial basis function as a kernel, is considered.Selection of the optimal parameters for the training is performed by trying out all possible combinations of the parameters with fixed value range and step, and further selection of a single combination that minimizes training error. Using the proposed approach allows to classify text area with a probability of 0.9859, graphics region – with a probability of about 0.9451. An investigation of the drawbacks and limitations of the proposed method was performed, areas of its applications were discovered. Scientific results of the paper can be used in automatic document image processing, analysis and pattern recognitionen_US
dc.description.abstractЦелью статьи является разработка метода классификации графической и текстовой области изображения документа. В качестве исходной информации имеется сегмент (прямоугольная область изображения), содержащая однородный контент – текст либо графический объект. Анализ области выполняется в предположении, что она является текстовой, производится проекционное разбиение рассматриваемой области на более мелкие объекты. Предложено построение описательной функции, характеризующей размеры объектов на изображении. Функция распределения размеров на следующем этапе обработки используется для обучения и классификации с помощью машины опорных векторов. Рассмотрено решение задачи бинарной классификации в общем случае линейной неразделимости с использованием радиальной базисной функции в качестве ядра. Подбор оптимальных параметров для обучения выполнен с помощью перебора всех комбинаций параметров при фиксированных диапазонах значений и шаге с последующим выбором той из них, которая позволяет минимизировать ошибку обучения. Использование предложенного подхода позволяет выполнять классификацию текстовой области с вероятностью, равной 0.9859, графической – с вероятностью около 0.9451. Проведено исследование недостатков и ограничений предложенного метода, определены области его применения. Полученные результаты могут быть использованы при автоматической обработке изображений документов, их анализе и распознаванииen_US
dc.description.abstractМетою статті є розробка методу класифікації графічної і текстової області зображення документа. В якості вихідної інформації використовується сегмент (прямокутна область зображення), що містить однорідний контент - текст або графічний об'єкт. Аналіз області виконується в припущенні, що вона є текстовою, виконується проекційне розбиття області, що аналізується, на об'єкти меншого розміру. Запропоновано побудову описової функції, що характеризує розподіл розмірів об'єктів на зображенні області. Функція розподілу розмірів на наступному етапі обробки використовується для навчання та класифікації за допомогою машини опорних векторів. Розглянуто рішення задачі бінарної класифікації в загальному випадку лінійної нероздільності з використанням радіальної базисної функції в якості ядра. Підбір оптимальних параметрів для навчання виконано за допомогою перебору всіх комбінацій параметрів при фіксованих діапазонах значень і кроці з подальшим вибором тієї з них, яка дозволяє мінімізувати помилку навчання. Використання запропонованого підходу дозволяє виконувати класифікацію текстової області з імовірністю, що дорівнює 0.9859, графічної – з вірогідністю близько 0.9451. Проведено дослідження недоліків і обмежень запропонованого методу, визначено області його застосування. Отримані результати можуть бути використані при автоматичній обробці зображень документів, їх аналізі та розпізнаванніen_US
dc.language.isoenen_US
dc.subjectimage classificationen_US
dc.subjectdocument regionen_US
dc.subjectthresholden_US
dc.subjectdecompositionen_US
dc.subjecttext regionen_US
dc.subjectgraphic regionen_US
dc.subjectareas distributionen_US
dc.subjectsupport vector machineen_US
dc.subjectклассификация изображенияen_US
dc.subjectобласть документаen_US
dc.subjectпорогen_US
dc.subjectразбиениеen_US
dc.subjectтекстовая областьen_US
dc.subjectграфическая областьen_US
dc.subjectраспределение площадейen_US
dc.subjectмашина опорных векторовen_US
dc.subjectкласифікація зображенняen_US
dc.subjectобласть документуen_US
dc.subjectпорігen_US
dc.subjectдекомпозиціяen_US
dc.subjectтекстова областьen_US
dc.subjectграфічна областьen_US
dc.subjectрозподілення площen_US
dc.subjectмашина опорних векторівen_US
dc.titleClassification of text and graphic regions on a fragment of document imageen_US
dc.title.alternativeКЛАССИФИКАЦИЯ ТЕКСТОВЫХ И ГРАФИЧЕСКИХ ОБЛАСТЕЙ НА ФРАГМЕНТЕ ИЗОБРАЖЕНИЯ ДОКУМЕНТАen_US
dc.title.alternativeКЛАСИФІКАЦІЯ ТЕКСТОВИХ ТА ГРАФІЧНИХ ОБЛАСТЕЙ НА ФРАГМЕНТІ ЗОБРАЖЕННЯ ДОКУМЕНТАen_US
dc.typeArticleen_US
dc.subject.udc004.932.7en_US
Располагается в коллекциях:Статті (ІКТ)

Файлы этого ресурса:
Файл Описание РазмерФормат 
Gorokhovatskyi.pdf411,88 kBAdobe PDFЭскиз
Просмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.