ruscorpora.ru Open in urlscan Pro
83.149.250.241 Public Scan

Back to summary

Submitted URL:
http://ruscorpora.ru/
Effective URL:
https://ruscorpora.ru/
Submission: On December 21 via api (December 21st 2023, 7:57:42 am UTC) from US — Scanned from DE

Form analysis
2 forms found in the DOM

GET /explore

<form action="/explore" aria-label="Основной корпус" id="main-search-to-explore" method="get" role="search">
  <div class="ld-search__form-wr">
    <div class="ld-search__form-input"><input data-complex-query-message="Поддерживаются только слова и фразы" name="req" placeholder="Введите слово или фразу" required="" size="50" type="text" value=""></div>
    <div class="ld-search__form-btn"><input type="submit" value="Обзор возможностей"></div>
  </div>
</form>

POST /switch-language

<form action="/switch-language" hidden="" id="set-land-form" method="post"><input name="csrfmiddlewaretoken" type="hidden" value="Ns6RmonuLsZF78bvaEpFf06qVij9WgsPOETTaIj6w0Rqm0esMCTr2ZsloGkRoZVp"><input name="language" type="hidden" value="en">
</form>

Text Content

Перейти к основному контенту
 * 
 * Меню
 * ENG
 * Войти
 * 

 * ENG
 * Войти

О корпусе
 * О проекте
 * Вопросы и ответы
 * Состав и структура
 * Виды разметки
 * Руководство пользователя

 * Основные публикации
 * Участники проекта
 * Проекты-спутники
 * Другие корпуса

Данные
 * Статистика корпуса
 * Частоты словосочетаний
 * Устойчивые обороты

 * Графики по годам
 * Скачиваемые корпуса

Контакты
 * Как ссылаться на корпус
 * Условия использования
 * Сообщить об ошибке

 * Электронный адрес
 * Юридический и почтовый адрес


НАЦИОНАЛЬНЫЙ КОРПУС РУССКОГО ЯЗЫКА — ПРЕДСТАВИТЕЛЬНАЯ КОЛЛЕКЦИЯ ТЕКСТОВ НА
РУССКОМ ЯЗЫКЕ ОБЩИМ ОБЪЕМОМ БОЛЕЕ 2 МЛРД СЛОВ, ОСНАЩЕННАЯ ЛИНГВИСТИЧЕСКОЙ
РАЗМЕТКОЙ И ИНСТРУМЕНТАМИ ПОИСКА

 * 
 * 
 * 

Подробнее о Корпусе




ПОИСК ПО КОРПУСАМ

 * Основной (374 млн)
 * Газетные2 (788 млн)
   * Центральные СМИ(765 млн)
   * Региональные СМИ(23 млн)
 * Синтаксический (1,5 млн)
 * Социальные сети (157 млн)

 * Устный (13 млн)
 * Акцентологический (134 млн)
 * Мультимедийный (5,8 млн)
 * МультиПАРКи2 (458 тыс)
   * Русский(229 тыс)
   * Англо-русский(229 тыс)

 * Параллельные26 (176 млн)
   * Английский(45 млн)
   * Армянский(1,6 млн)
   * Башкирский(550 тыс)
   * Белорусский(10 млн)
   * Болгарский(5,2 млн)
   * Бурятский(401 тыс)
   * Испанский(5,4 млн)
   * Итальянский(4,9 млн)
   * Китайский(4,4 млн)
   * Корейский(73 тыс)
   * Латышский(4,4 млн)
   * Литовский(702 тыс)
   * Немецкий(31 млн)
   * Польский(6,4 млн)
   * Португальский(987 тыс)
   * Румынский(903 тыс)
   * Сербский(1,9 млн)
   * Словенский(2 млн)
   * Украинский(9,4 млн)
   * Финский(3,7 млн)
   * Французский(7,6 млн)
   * Хинди(122 тыс)
   * Чешский(4 млн)
   * Шведский(16 млн)
   * Эстонский(2,2 млн)
   * Многоязычный(5 млн)
 * Диалектный (599 тыс)
 * Обучающий (13 млн)
 * От 2 до 15 (4,4 млн)

 * Поэтический (13 млн)
 * Русская классика β (17 млн)
 * Исторические5 (14 млн)
   * Древнерусский(807 тыс)
   * Эпиграфика(5 тыс)
   * Берестяные грамоты(23 тыс)
   * Старорусский(8,8 млн)
   * Церковнославянский(5,3 млн)
 * Панхронический (383 млн)

все корпуса47

Состав и структура

Статистика корпуса

Руководство пользователя

Портрет слова

Частотный словарь

НКРЯ в школе


НОВОСТИ

15.12.2023

В преддверии Нового года мы хотим сделать подарок пользователям и пригласить вас
в Музей Корпуса, реконструирующий интерфейс НКРЯ образца 2003 года!

Национальный корпус русского языка тогда включал 20 млн слов. Был доступен
простой поиск (поиск форм) и расширенный (лексико-грамматический) поиск примеров
по корпусу. В создании Национального корпуса русского языка принимала участие
большая группа лингвистов из Москвы, Санкт-Петербурга и других научных центров
России.

Одним из вдохновителей и создателей корпуса был Илья Сегалович (1964 — 2013),
сооснователь и директор по технологиям Яндекса. Илья сам разработал
первоначальный простой интерфейс Корпуса, при помощи которого теперь можно
искать уже по современному составу Основного корпуса НКРЯ.

09.12.2023

В предстоящее воскресенье, 10 декабря, с 10:00 до 18:00 по московскому времени
на наших серверах будут проводиться технические работы.

Из-за этого возможны кратковременные перебои в работе сайта, которые продлятся
не более 1 часа.

04.12.2023

С сегодняшнего дня задать подкорпус в корпусе Региональных СМИ можно, указав
интервалы с точностью до дня. Например, можно исследовать употребление слова
милиция.

Кроме того, в Региональном корпусе были усовершенствованы графики распределения
результатов поиска. Единицей измерения по умолчанию теперь является месяц.
Переключаться между днями, месяцами и годами на графиках можно в выдаче, обзоре
возможностей, сравнении запросов и портрете слова.



04.12.2023

Пополнены коллекции устной речи в Акцентологическом и Устном корпусах. Добавлены
записи текстов устной научной и политической речи, теле- и радиопублицистики,
устных монологов-воспоминаний, повседневной диалогической речи. Объем Устного
корпуса составляет 14 млн словоупотреблений, общий объем Акцентологического
корпуса, вместе с наивной поэзией, - 134,8 млн словоупотреблений.

Параллельный корпус пополнился на 3 млн слов. Новые тексты появились в
английской, испанской, немецкой, португальской, французской и чешской языковых
парах. В частности, англо-русский корпус пополнился коллекцией расшифровок
публичных лекций TED Talks, а португальско-русский вырос почти вдвое и теперь
включает еще и тексты, созданные в португалоязычной Африке.

В корпусе Социальные сети автоматически размечены жанры для всего массива
текстов. Пользователь может выбрать один или несколько жанров из списка.
Выделено несколько новых жанров, например, подпись к фото.
Поля в информации о тексте, значения которых сгенерированы НейроКРЯ, помечены
специальным значком. Если вы заметили неточность или ошибку, сообщайте нам,
используя кнопку “Сообщить об ошибке” в том же окне.

Показать все
 * Контакты
 * Условия использования
 * Политика конфиденциальности

 * Как ссылаться на корпус
 * Сообщение об ошибке
 * Вопросы и ответы

© Национальный корпус русского языка, 2003–2023
 * 
 *

ruscorpora.ru Open in urlscan Pro 83.149.250.241 Public Scan

Form analysis 2 forms found in the DOM

GET /explore

POST /switch-language

Text Content

ruscorpora.ru Open in urlscan Pro
83.149.250.241 Public Scan

Form analysis
2 forms found in the DOM