Осетинский национальный корпус

На данном ресурсе находится письменный корпус осетинского литературного языка объёмом около 12 млн. словоупотреблений. Корпус создан в период с 2011 по 2014 гг. при финансовой поддержке Программы фундаментальных исследований Президиума РАН «Корпусная лингвистика» (рук. А. П. Выдрин) и гранта РФФИ № 11-06-00512a (рук. М. А. Даниэль). В корпус входят письменные тексты на иронском (литературном) диалекте осетинского языка.

Состав корпуса

Около двух третей всего объема корпуса составляет литературный журнал «Мах дуг» («Наша эпоха»), выпуски 1996–2014 гг. Журнал «Мах дуг» является основным журналом на литературном осетинском языке и специализируется на издании произведений (поэзия и проза) современных писателей, а также литературной критики.

Остальные тексты представляют собой интернет-газету «Спутник» (выпуски с апреля 2015 года), художественные произведения современных осетинских писателей 1990–2014 гг. (поэзия и проза), а также произведения отдельных наиболее известных осетинских писателей 20 века — Измаила Айларова, Шамиля Джикаева, Азамата Кайтукова, Арсена Коцоева, Музафера Дзасохова и др. В состав корпуса включено также наиболее полное издание Нартовского эпоса (Нартовские сказания. Эпос осетинского народа. Книги 1–6. Владикавказ: СОИГСИ, 2003–2011) и номера литературного журнала «Ногдзау» («Пионер») за 2010–2013. Полный список произведений, вошедших в Осетинский национальный корпус, находится здесь.

Характеристики корпуса

Все тексты, вошедшие в корпус, имеют автоматическую разметку (грамматические категории и полексемный перевод) на русском и английском языках. Доля разобранного материала после автоматической разметки составляет примерно 90%. Для корпуса адаптирована поисковая система Восточноармянского национального корпуса (EANC), позволяющая искать материал по лексеме, словоформе, а также по отдельным грамматическим характеристикам. Во избежание нарушения авторских прав доступ к цельным текстам не предоставляется. Возможности выдачи ограничены контекстом из 7 предложений.

Благодарности

Мы благодарны журналу «Мах дуг», «Ногдзау» и издательству «ИР», а также лично Ахсару Магометовичу Кодзати (главному редактору журнала «Мах дуг»), Казбеку Георгиевичу Мамукаеву (редактору отдела поэзии и драматургии журнала «Мах дуг»), Ириде Ахсаровне Кодзати (верстальщику журнала «Мах дуг»), Козыревой Жанне Григорьевне (директору издательства «ИР») и Тотразу Аврамовичу Кокаеву (главному редактору издательства «ИР») за предоставление электронных версий своих публикаций. Мы признательны М. В. Дарчиевой и И. М. Мириковой за сканирование отдельных текстов, вошедших в корпус.

Создатели корпуса

Корпус создан в равном объеме О. И. Беляевым и А. П. Выдриным. Система автоматического морфологического анализа UniParser разработана Т. А. Архангельским. Отдельные тексты, вошедшие в корпус, отсканированы М. В. Дарчиевой и И. М. Мириковой. В настоящий момент поддержкой и развитием корпуса занимается А. П. Выдрин.

Контакты

Любые замечания и предложения просьба отправлять по адресу ossetic.studies@gmail.com .

Объявление

Создатели корпуса будут рады включить в корпус новые опубликованные тексты разной тематики на литературном осетинском языке. Тексты принимаются адресу ossetic.studies@gmail.com в любом текстовом формате (doc, docx, rtf, txt, odt). Во избежание нарушения авторских прав доступ к цельным текстам предоставляться не будет.