О корпусе

 

Национальный корпус коми языка -  это электронная справочно-информационная система на основе аннотированного корпуса текстов литературного коми языка с возможностью поиска языковых единиц по различным параметрам. Он состоит из систематизированной базы текстов на национальном языке и специальных помет к нему, необходимых для филологического анализа этих текстов. Национальный корпус представляет коми язык на определенном этапе (или этапах) его существования и во всём многообразии жанров, стилей и т. п.

Национальный корпус имеет две важные особенности:

1. корпус характеризуется представительностью. Это означает, что корпус содержит по возможности все типы письменных и устных текстов, представленные в данном языке (художественные разных жанров, публицистические, учебные, научные, официально-деловые и др.), и что все эти тексты включены в корпус по возможности максимально. При этом хорошая представительность достигается только при значительном объеме корпуса (десятки и сотни миллионов словоупотреблений).

2. корпус содержит особую дополнительную информацию о свойствах входящих в него текстов (так называемую разметку, или аннотацию). Разметка — главная характеристика корпуса; она отличает корпус от простых коллекций (или «библиотек») коми текстов, широко представленных в интернете.

Цели и задачи Корпуса:

- служить надежным источником фактического материала для составления словарей, грамматик, учебников, справочных пособий;

- обеспечивать возможность проверки лингвистических гипотез на максимально представительном материале;

- выполнять функции справочного пособия для выяснения вопросов о современном словоупотреблении, т.е. служить эффективным помощником для всех, работающих со словом (лингвисты, литературоведы, журналисты, писатели, переводчики, преподаватели коми языка и др.);

-служить базой для компьютерного моделирования речевой деятельности.

Наличие национального корпуса открывает небывалые возможности для науки и образования, поскольку современные компьютерные технологии многократно упрощают и ускоряют процедуры лингвистической обработки больших массивов текстов.

Однако круг пользователей корпуса вовсе не ограничивается профессиональными исследователями языка. Надежные статистические данные о языке определенной эпохи или определенного автора могут интересовать литературоведов, историков и представителей многих других областей гуманитарного знания. Важное значение национальный корпус имеет и для преподавания коми языка в качестве родного или неродного. Таким образом, национальный корпус обращен ко всем, кто в силу профессии, по необходимости или из простой любознательности ищет ответ на вопросы об устройстве и функционировании коми языка, то есть фактически к большинству образованных носителей коми языка и ко всем, изучающим его в качестве родного или неродного.

Национальный корпус языка — это еще и реальный инструмент сохранения всего письменного наследия коми народа в виде цифровых копий, передачи будущим поколениям культуры народа.