RULES FOR THE FORMATION OF COMPLEX LINKS FROM UNSTRUCTURED TEXT
Abstract and keywords
Abstract (English):
V stat'e rassmatrivayutsya pravila dlya izvlecheniya slozhnyh smyslovyh svyazey iz neobrabotannogo teksta. Dannye pravila pozvolyayut izvlech' poleznuyu informaciyu s vnutrennimi predlozheniyami. Dannyy vid svyazey harakterizuetsya tem, chto on imeet glavnoe podlezhaschee, kotoroe ssylaetsya na vnutrennee predlozhenie cherez glagol. V rabote privoditsya metodologiya postroeniya grafa zavisimostey dlya predlozheniya.

Keywords:
Grammaticheskiy razbor, izvlechenie smyslovoy informacii, ontologii, nestrukturirovannyy tekst, graf zavisimostey.
Text

I. Введение

Большинство сложных смысловых связей в тексте характеризуются явными или неявными зависимостями между частями предложения. Такие связи описываются графом зависимостей. Для формирования правил извлечения будем использовать методологию [1]:

  1. Обращение к описаниям зависимостей из необработанного текста и выбор тех, которые соответствуют структуре данного типа комплексных связей.
  2. Формирование условий, основанных на том, найдена ли метка зависимости (или очередность меток) в множестве ребер в графе зависимостей.
  3. Формирование действий, основанных на решениях о том, какие вершины нужно извлечь в виде составляющих.
  4. Установление предпосылок и следствий для формирования правила извлечения.

Рассмотрим выполнение этих шагов к каждой сложной связи с внутренними предложениями.

References

1. Software – The Stanford Natural Language Processing Group. –Rezhim dostupa: http://nlp.stanford.edu/software/. – Zagl. s ekrana.

2. Sokolov, E. G. Primenenie LSA/LSI metodov dlya izvlecheniya dannyh iz nestrukturirovannogo teksta / E. G. Sokolov, M. M. Sharnin // Trudy Mezhdunarodnoy nauchnoy konferencii po fiziko-tehnicheskoy informatike CPT2018. – Car'grad, 2018. – S. 59-63.

3. Metody avtomaticheskoy klassifikacii tekstov po funkcional'nym stilyam / L.M. Ermakova, M.A. Abashev, R.V. Nikitin, R.I. Ushakov // Vestnik Permskogo universiteta. Seriya: Matematika. Mehanika. Informatika. – 2014. – № 4 (27). – S. 78-83.

4. Bogatyrev, M. Yu. Izvlechenie faktov iz tekstov estestvennogo yazyka s primeneniem konceptual'nyh grafovyh modeley / M.Yu. Bogatyrev // Izvestiya Tul'skogo gosudarstvennogo universiteta. Tehnicheskie nauki. – 2016. – № 7-1. – S. 198-208.

5. Stulov, N. Patent landscapes & new technology trends in iot: extracting and visualizing data patterns / N. Stulov // Otkrytye semanticheskie tehnologii proektirovaniya intellektual'nyh sistem. – 2018. – T. 2, № 8. – S. 293-297.

6. Metod avtomatizirovannogo izvlecheniya adresov iz nestrukturirovannyh tekstov / A. V. Komarova, A. A. Menschikov, A. V. Polev, Yu. A. Gatchin // International Journal of Open Information Technologies. – 2017. – T. 5, № 11. – S. 21-27.

7. Freitag, D. Boosted wrapper induction : In Proceedings of 17th National Conference on Artificial Intelligence / D.Freitag, N.Kushmerick. – 2000. – Pp.577-583

8. Kauchak, D. Sources of success for boosted wrapper induction / D. Kauchak, J.Smarr, C. Elkan // The Journal of Machine Learning Research. – 2004. – T. 5. – Pp. 499-527.

9. Kushmerick, N. Wrapper induction for information extraction / N. Kushmerick, D. S. Weld, R.Doorenbos // Proceedings of the International Joint Conference on Artificial Intelligence (IJCAI’97). – 1997. – Pp.729-737.

10. Muslea, I. STALKER: Learning extraction rules for semistructured, web-based information sources. / I.Muslea, S. Minton, C. Knoblock // AAAI Workshop on AI and Information Integration. – 1998. – Pp.74-81.

Login or Create
* Forgot password?