СТРУКТУРНЫЙ ПОДХОД К КЛАССИФИКАЦИИ БУКВ В ИЗОБРАЖЕНИЯХ
Аннотация и ключевые слова
Аннотация (русский):
В работе предлагается математическая модель понятия графемы, основные цели которой — сформулировать строгое определение понятия «графема» и выделить общую структуру изображений одинаковых символов. Построение графемы основано на непрерывном скелетном подходе, который подразумевает построение скелета бинарного изображения символа с последующей его регуляризацией. Также в работе производится применение построенной модели для задачи распознавания текста на цифровом изображении. Для этой цели из модели выделяются признаки, основанные на положениях вершин в модели графемы, и на этих признаках обучается классификатор. Он определяет, к какому классу относится графема, выделенная из бинарного изображения одного символа. Рассматривается также метод обработки входного изображения с текстом для более качественного выделения символов, строк и слов. Проведенные эксперименты показывают работоспособность предлагаемой модели графемы. Алгоритм классификации показывает сравнимые с современными методами распознавания текста результаты.

Ключевые слова:
оптическое распознавание символов, цифровое изображение текста, цифровой шрифт, графема, математическая модель, медиальное представление, агрегированный скелетный граф
Список литературы

1. Felix Hausdorff. Grundzüge der mengenlehre. – 1914.

2. Hochreiter, S. Lstm can solve hard long time lag problems / Sepp Hochreiter, Jürgen Schmidhuber // Advances in neural information processing systems. – 1997. – P. 473–479.

3. Ito, K. Gaussian filter for nonlinear filtering problems / Kazufumi Ito // Proceedings of the 39th IEEE Conference on Decision and Control (Cat. No. 00CH37187) / IEEE. – Vol. 2. – 2000. – P. 1218–1223.

4. Kam, H. T. Random decision forests / Ho Tin Kam // Proceedings of the 3rd International Conference on Document Analysis and Recognition, Montreal, QC. – 1995.

5. Kimura, F. Handwritten numerical recognition based on multiple algorithms / Fumitaka Kimura, Malayappan Shridhar // Pattern recognition. – 1991. – Vol. 24, no. 10. – P. 969–983.

6. Orieux, F. Bayesian estimation of regularization and point spread function parameters for wiener– hunt deconvolution / François Orieux, JeanFrançois Giovannelli, Thomas Rodet // JOSA A. – 2010. – Vol. 27, no. 7. – P. 1593–1607.

7. Otsu, N. A threshold selection method from graylevel histograms / N. Otsu // IEEE Trans. Sys., Man., Cyber. – 1979.

8. ParaType. Цифровые шрифты. – ParaType. – 2008.

9. Takahashi, H. A neural net ocr using geometrical and zonal pattern features / Hiroyasu Takahashi // Proc. 1st Intl. Conf. on Document Analysis and Recognition. – 1991. – P. 821–828.

10. Tesseract. – https://github.com/tesseract-ocr/tesseract.

11. A. Lipkina, L. Mestetskiy. Grapheme approach to recognizing letters based on medial representation / A. Lipkina, L. Mestetskiy. – 2019. – 01. – P. 351– 358.

12. О. В. Осетрова. СЕМИОТИКА ШРИФТА. – Вестник Воронежского государственного университета. Серия: Филология. Журналистика. – 2006.

13. Yujian, L. A normalized levenshtein distance metric / Li Yujian, Liu Bo // IEEE transactions on pattern analysis and machine intelligence. – 2007. – Vol. 29, no. 6. – P. 1091–1095.

14. Л.М. Местецкий. Непрерывная морфология бинарных изображений: фигуры, скелеты, циркуляры. – М.: ФИЗМАТЛИТ. – 2009.

Войти или Создать
* Забыли пароль?