Национальный корпус русского языка
Материал из Википедии — свободной энциклопедии
Национа́льный ко́рпус ру́сского языка́ — общедоступный для поиска корпус русских текстов. Открыт 29 апреля 2004 в Интернете по адресу http://ruscorpora.ru.
Работы по созданию Корпуса начались в 2001 году группой лингвистов из Москвы, Петербурга, Воронежа и других городов.
В Корпус входят как письменные тексты (художественные, мемуары, публицистика, научная, религиозная литература, повседневная печатная продукция), так и записи устных текстов (публичной речи и частных бесед). Объём корпуса на март 2006 года составил 120 млн словоупотреблений.
Тексты снабжены морфологической и семантической разметкой.
[править] Литература
- Национальный корпус русского языка: 2003-2005. Сборник статей. М.: Индрик, 2005. ISBN 5857593581