Томский журнал лингвистических и антропологических исследований
RU EN






Сегодня: 31.01.2026
Главная Выпуски журнала 2025 Год Выпуск №2 Морфологический гессер как инструмент анализа полевых данных: опыт работы с науканским языком
  • Главная
  • Текущий выпуск
  • Выпуски журнала
    • 2025 Год
      • Выпуск №1
      • Выпуск №2
      • Выпуск №3
      • Выпуск №4
    • 2024 Год
      • Выпуск №1
      • Выпуск №2
      • Выпуск №3
      • Выпуск №4
    • 2023 Год
      • Выпуск №1
      • Выпуск №2
      • Выпуск №3
      • Выпуск №4
    • 2022 Год
      • Выпуск №1
      • Выпуск №2
      • Выпуск №3
      • Выпуск №4
    • 2021 Год
      • Выпуск №1
      • Выпуск №2
      • Выпуск №3
      • Выпуск №4
    • 2020 Год
      • Выпуск №1
      • Выпуск №2
      • Выпуск №3
      • Выпуск №4
    • 2019 Год
      • Выпуск №1
      • Выпуск №2
      • Выпуск №3
      • Выпуск №4
    • 2018 Год
      • Выпуск №1
      • Выпуск №2
      • Выпуск №3
      • Выпуск №4
    • 2017 Год
      • Выпуск №1
      • Выпуск №2
      • Выпуск №3
      • Выпуск №4
    • 2016 Год
      • Выпуск №1
      • Выпуск №2
      • Выпуск №3
      • Выпуск №4
    • 2015 Год
      • Выпуск №1
      • Выпуск №2
      • Выпуск №3
      • Выпуск №4
    • 2014 Год
      • Выпуск №1
      • Выпуск №2
      • Выпуск №3
      • Выпуск №4
    • 2013 Год
      • Выпуск №1
      • Выпуск №2
  • Поиск
  • Рейтинг
  • Новости
  • Редакционная коллегия
  • Правила для авторов
  • Порядок рецензирования
  • Читателям
  • Публикационная Этика Издания
  • Контактная информация
  • Разместить статью
  • Оформить подписку
  • Служебный вход
vestnik.tspu.ru
praxema.tspu.ru
ling.tspu.ru
npo.tspu.ru
edujournal.tspu.ru

EBSCO

European reference index for the humanities and the social sciences (erih plus)

Поиск по автору
- Не выбрано -
  • - Не выбрано -
Яндекс.Метрика

Морфологический гессер как инструмент анализа полевых данных: опыт работы с науканским языком

Будянская Е.М., Бузанов А.О., Жорник Д.О., Пихтин А.А.

DOI: 10.23951/2307-6119-2025-2-9-19

Информация об авторе:

Будянская Елена Михайловна, Младший научный сотрудник. Институт языкознания РАН. Большой Кисловский пер., 1, стр. 1, Москва, 125009. E-mail: budyanskaya.lena@gmail.com; ORCID ID: 0000-0002-6306-6280; SPIN-код: 7314-4254; Scopus Author ID: 57223128144. Бузанов Антон Олегович, Младший научный сотрудник. Институт языкознания РАН. Большой Кисловский пер., 1, стр. 1, Москва, 125009. Младший научный сотрудник. Высшая школа экономики. Покровский бульвар, 11, Москва, 109028. E-mail: anton.buzanov.00@gmail.com; ORCID ID: 0000-0002-3069-1223; SPIN-код: 5993-1550; Scopus Author ID: 57424562500. Жорник Дарья Олеговна, Научный сотрудник. Институт языкознания РАН. Большой Кисловский пер., 1, стр. 1, Москва, 125009. E-mail: daria.zhornik@yandex.ru; ORCID ID: 0000-0002-6463-2547; SPIN-код: 4302-5986; Researcher ID: V-6283-2018: Scopus Author ID: 57203316879. Пихтин Андрей Андреевич, Младший научный сотрудник. Институт языкознания РАН. Большой Кисловский пер., 1, стр. 1, Москва, 125009. Младший научный сотрудник. Высшая школа экономики. Покровский бульвар, 11, Москва, 109028. E-mail: p_nafanyka@gmail.com

Представлено описание разработки и оценки двух инструментов автоматического морфологического анализа для науканского языка (юпикские эскимосские эскимосско-алеутские): морфологического анализатора со словарем и морфологического гессера без словаря. Оба инструмента реализованы с использованием двухуровневого подхода к моделированию морфологии на основе конечных автоматов. Подробно рассматриваются особенности морфологии науканского языка, влияющие на разработку автоматических инструментов анализа, включая богатое словоизменение и словообразование, омонимию морфологических показателей и сложные морфонологические процессы. На материале корпуса устных текстов, записанных в 2022–2023 гг., проводится оценка эффективности работы обоих инструментов. Особое внимание уделяется проблеме сверхгенерации при работе морфологического гессера и способам ее решения через разделение анализа по частям речи. Результаты исследования показывают, что при работе с полевыми данными использование гессера может быть более эффективным, несмотря на известные ограничения.

Ключевые слова: науканский язык, морфологический анализатор, документация языков, автоматическая обработка языка

Библиография:

1. Меновщиков Г.А. Язык науканских эскимосов. Л.: Наука, 1975. 512 с.

2. Головко Е.В., Добриева Е.А., Джейкобсон С., Краусс М. Словарь языка науканских эскимосов / ред. С. Джейкобсон. Фэрбенкс: Центр изучения коренных языков Аляски, 2004. 369 с.

3. Вахтин Н.Б. Морфология глагольного словоизменения в юпикских (эскимосских) языках / Российская академия наук, Институт лингвистических исследований. СПб.: Нестор, 2007. 123 c.

4. Kanuparthi N., Inumella A., Sharma D.M. Hindi Derivational Morphological Analyzer // Proceedings of the Twelfth Meeting of the Special Interest Group on Computational Morphology and Phonology. Montreal: Association for Computational Linguistics, 2012. P. 10–16.

5. Kessikbayeva G., Cicekli I. Rule Based Morphological Analyzer of Kazakh Language // Proceedings of the 2014 Joint Meeting of SIGMORPHON and SIGFSM. Baltimore: Association for Computational Linguistics, 2014. P. 46–54.

6. Khalifa S., Hassan S., Habash N. A Morphological Analyzer for Gulf Arabic Verbs // Proceedings of the Third Arabic Natural Language Processing Workshop. Valencia: Association for Computational Linguistics, 2017. P. 35–45.

7. Forbes C., Nicolai G., Silfverberg M. An FST morphological analyzer for the Gitksan language // Proceedings of the 18th SIGMORPHON Workshop on Computational Research in Phonetics, Phonology, and Morphology. Online: Association for Computational Linguistics, 2021. P. 188–197.

8. Merzhevich T., Ferraz Gerardi F. Introducing YakuToolkit. Yakut Treebank and Morphological Analyzer // Proceedings of the 1st Annual Meeting of the ELRA/ISCA Special Interest Group on Under-Resourced Languages. Marseille: European Language Resources Association, 2022. P. 185–188.

9. Koskenniemi K. Two-level Morphology. A General Computational Model for Word-Form Recognition and Production. Helsinki: University of Helsinki, Department of General Linguistics, 1983.

10. Karttunen L. KIMMO: A General Morphological Processor // Texas Linguistics Forum. 1983. Vol. 22. P. 217–228.

11. Antworth E.L. PC-KIMMO: a two-level processor for morphological analysis. Dallas: Summer Institute of Linguistics, 1990.

12. Ritchie G.D., Russell G. J., Black A. W., Pulman S. G. Computational Morphology. Practical Mechanisms for the English Lexicon. Cambridge: The MIT Press, 1991.

13. Swanson D., Howell N. Lexd: A finite-state lexicon compiler for non-suffixational morphologies // Multilingual Facilitation. 2021. P. 133–146.

14. Karttunen L., Beesley K. R. Two-level rule compiler. Palo Alto: Xerox Corporation, Palo Alto Research Center, 1992.

15. Lindén K., Axelson E., Hardwick S., Pirinen T.A., Silfverberg M. HFST – framework for compiling and applying morphologies // Systems and Frameworks for Computational Morphology: Second International Workshop, SFCM 2011. Berlin: Springer, 2011. P. 67–85.

16. Chen E., Schwartz L. A morphological analyzer for St. Lawrence island / Central Siberian yupik // Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). 2018.

budyanskaya_elena_mikhailovna_9_19_2_48_2025.pdf ( 572.99 kB ) budyanskaya_elena_mikhailovna_9_19_2_48_2025.zip ( 447.05 kB )

Выпуск: 2, 2025

Серия выпуска: Выпуск № 2

Рубрика: ЛИНГВИСТИКА

Страницы: 9 — 19

Скачиваний: 536

Для цитирования:


2026 Томский журнал лингвистических и антропологических исследований

Разработка и поддержка: Лаборатория сетевых проектов ТГПУ