| CARVIEW |
Национальный корпус русского языка — представительная коллекция текстов
на русском языке
общим объемом более 2 млрд слов,
оснащенная лингвистической разметкой и инструментами поиска
Поиск по корпусам
Новости
Показать всеВ корпусах с автоматической синтаксической разметкой (Основной, Центральные и Региональные СМИ, «От 2 до 15» и Русская классика) теперь можно увидеть синтаксическое дерево предложения. Оно открывается по специальному значку для всех предложений в поисковой выдаче. Для каждого слова в предложении на картинке указана лемма и часть речи, а синтаксические связи между ними отображены в виде направленных стрелок с названием связи. Изображение дерева можно скачать в виде картинки.

В Диалектном корпусе теперь доступны такие инструменты, как «Статистика», «Частотность», частотные словари, n-граммы, поиск с регулярными выражениями, парадигмы в Портрете слова. В частности, можно увидеть в таблице, в каком облике встретились падежные формы слова заяц и как коррелирует окончание типа за ягодам с разделением говоров на окающие и акающие.

Поэтический корпус пополнен произведениями трех поэтов второй половины ХХ века с особым фокусом на бардовскую поэзию — Владимира Высоцкого, Новеллы Матвеевой и Владимира Уфлянда. Общий объем пополнения — 177 тыс. словоупотреблений или 36 тысяч стихотворных строк.
Тексты, доступные в корпусе ранее, снабжены автоматической нейросетевой морфологической разметкой (лемматизация и грамматика) с частичной ручной коррекцией, исправлено множество ошибок в разметке. По умолчанию эти разборы доступны в поиске наравне с разборами, основанными на грамматическом словаре.