![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Владимир Даль в исследованиях Яндекса и филологов

Недавно в ноябре 2016 Яндекс предпринял попытку подсчитать использование старорусских слов из словаря по запросам в разных регионах страны:
Русский язык в словаре Даля и поиске Яндекса
29 ноября 2016. По данным поиска Яндекса
«В словаре Даля, одном из самых знаменитых и распространенных, примерно 200 тыс. слов. Притом что 150 лет назад он был издан как словарь «живого русского языка», принято считать, что он содержит множество устаревших слов. Компания «Яндекс» решила сравнить поисковые запросы своих пользователей со словарем Даля и выяснить, насколько актуально издание и бывшие в обиходе в России полтора века назад слова сегодня.
Словарь Даля не является нормативным * — то есть его далеко не всегда можно использовать для ответа на вопросы «как пишется то или иное слово» или «что значит то или иное слово».Зато он представляет собой уникальный справочник по живому разговорному языку XIX века, который можно читать не как словарь, а просто подряд. Поисковые запросы содержат в том числе и разговорную лексику, так что сравнив слова из словаря со словами из запросов, можно увидеть, какие изменения произошли за 150 лет.
Количество слов в словаре Даля обычно оценивается приблизительно — около 200 тысяч. Это те слова, которые Даль называл «красными», для которых дано толкование. Эти слова организованы в гнёзда — немногим более 40 тысяч гнёзд и, соответственно, гнездовых слов.
С начала ноября 2015-го по конец октября 2016 года пользователи ввели примерно 70 млрд. запросов в поисковике «Яндекса». После их упорядочивания компания получила свыше 285 млн разных слов, что почти в 1,5 тыс. раз больше, чем у Даля. Далее был использован Национальный корпус русского языка — в основном собрание русскоязычных текстов в электронной форме за XX-XXI века.
«Пересечений оказалось всего около 750 тыс. Можно сказать, что это слова, которые употребляются в современных текстах разных жанров — от художественной литературы до деловых документов». Сопоставив все данные, «Яндекс» выяснил, что почти 1/5 (18%) словаря Даля за год ни разу не встречалась в поисковых запросах. Еще примерно 38% слов упоминались в запросах, но отсутствовали в корпусе русского языка, и лишь 44% слов попали в пересечение поиска и корпуса…
Исследование двух других групп слов — «слова из запроса, которые есть и в словаре Даля, и в текстах корпуса (условно "живые")» (44%) и «слова из поиска, которые есть в словаре Даля, но отсутствуют в текстах корпуса (условно "уходящие")» (38%) — оказалось несколько затруднительным.

Чтобы точнее определить, какая часть словаря Даля до сих пор жива, в компании оценили долю омонимии, а также посчитали, сколько слов люди искали с целью узнать их значение.

Глазеть в прогаль
Также на основании поисковых запросов компания проанализировала, какие слова из словаря Даля чаще используют в разных регионах, чем в целом по России. Но и здесь главными «действующими лицами» оказались омонимы.
«Больше половины (57%) этих слов — омонимы, то есть сейчас употребляются в значении, отличном от указанного в словаре. Чаще всего омонимами оказываются фамилии и топонимы — названия населенных пунктов, рек, районов. Например, слово "даровушка" в словаре объяснено как "дарун, дарунок, дарунчик (м.), дареное животное: щенок, жеребенок и пр.", а сейчас его ищут практически только в Кировской области, потому что так называется одна из рек»
«Вряд ли можно назвать живым слово, которое есть в письменных текстах, но встречается в запросах всего несколько раз в год, или слово, которое вводят в поиск только для того, чтобы узнать значение», — задаются риторическим вопросом авторы исследования…Полностью на https://yandex.ru/company/researches/2016/ya_dahl
и http://rus.rus4all.ru/analytics/20161129/727941114.html
Кратко:
Результаты исследования Яндекса:
*****
«Как показали последние филологические исследования (см. Дейкина 1993) в словаре Даля действительно имеется немало слов (около 14 тыс.) которые являются его новообразованиями.» стр. 17
http://www.ruslang.ru/doc/voprosy/voprosy2001-3.pdf
Диссертация, Дейкина Александра Юрьевна, от 1993 года полностью по ссылке
http://dlib.rsl.ru/viewer/01000797906#?page=17
Слова придуманные В. Далем: «доброгатство», «полновесие», «мертвизна», «лапистость», «лапчатость», «уровенность», «лежевестность», «равнообразие», «головомытие», «народообычье» (этнография), «противосилие» (антагонизм), «куцохвощенье» (англизирование), «противовосстание» (контреволюция) и другие…



*****
На исследование Яндекса 14.12.2016 дала ответ филолог «Не заглядывая вдаль…»
Прокомментировать исследование «Яндекса» мы попросили доцента Гуманитарного института Новосибирского государственного университета кандидата филологических наук Оксану Михайловну Исаченко:

«Оксана Исаченко:
— Аналитики компании «Яндекс» сделали много шуму из ничего. Вот уж действительно — «сенсация на ровном месте». Никакого «открытия века» всё-таки не получилось, и не могло. Дело в том, что нет никаких реальных предпосылок к тому, чтобы сравнивать лексикон сегодняшнего дня со словником пусть и «уникального справочника», пышно названного автором «Толковым словарем живого великорусского языка». Исходная посылка в качестве обоснования исследования: «Словарь Даля прославился как словарь именно живого, повседневного языка, на котором говорили в России в середине XIX века» — в корне неверна.
Никто не спорит с тем, что словарь В.И. Даля уникальный. Но уникальность в том, что создан он не профессиональным лексикографом, а любителем. По большому счету этот словарь — грандиозный памятник любительской лингвистике, как принято сейчас называть, используя эвфемизм А.А. Зализняка, труды дилетантов в этой области. <...>
Помимо слов, фразеологизмов, пословиц и поговорок Владимир Иванович в течение всей жизни собирал народные песни, сказки и лубочные картины. Понятно, что каждый «экспонат», попавший в коллекцию, дорог и ценен собирателю. Тогда как при составлении словаря (диалектного в первую очередь), необходима тщательная проверка значения слова, его употребительности, подтвержденной контекстом, причем не одним. То есть требуется кропотливая работа с диалектоносителями — информантами (не путать с «информаторами»). <...>
Что получилось из этой гремучей смеси интересов и убеждений? Словарь, в котором есть всё, что на тот момент было распространено или встречалось в речевом обиходе. В.И. Даль считает это своей заслугой. Неслучайно в «Напутном слове» к своему детищу он не без гордости и самодовольства пишет: «Желание собирателя было составить словарь, о котором бы можно было сказать: “Речения письменные, беседные, простонародные; общие, местные и областные; обиходные, научные, промысловые и ремесленные; иноязычные усвоенные и вновь захожие, с переводом (…)”».
И всё же основу словаря составляет диалектная лексика, причем тоже неоднородная — различная по географии распространения. В основном в нем представлены русские диалекты Нижегородской и Оренбургской губерний (среди помет, маркирующих территорию, кстати, есть и «сиб.» — сибирское, но Сибирь огромна, и современные диалектологи не отождествляют, например, томские и новосибирские говоры). Кроме того, в словаре зафиксированы изобретенные, авторские слова, которыми В.И. Даль, будучи пуристом, предлагал заменять хорошо известные и распространенные «чужестранные». Например, к греческому по происхождению слову «горизонт» приведен пространный синонимический ряд: небосклон, кругозор, небозём, небоскат, закат неба; глазоём, зреймо; завесь и многое другое. Однако из этого не следует, что все единицы данного ряда «живые», реально «сосуществующие», например, в разных диалектах русского языка.
Попутно отметим, что синонимические ряды в словаре В.И. Даля зачастую включают условно и приблизительно подобные слова, что в принципе недопустимо для научной и профессиональной лексикографии. Рассмотрим тот же пример — с горизонтом. Даже если исходить из предложенного В.И. Далем толкования ‘окраина земной поверхности, вкруг наблюдателя, где примыкает небо’ (сравните с современной дефиницией: ‘видимая граница (линия кажущегося соприкосновения) неба с земной или водной поверхностью’), обнаруживается неполное соответствие значениям указанных синонимов. Так, в слове «небосклон» отсутствует смысл ‘вкруг наблюдателя’, потому что это ‘часть неба над линией горизонта’, а в слове «кругозор» не актуализировано значение ‘окраина земной поверхности, где примыкает небо’, так как это ‘пространство, которое можно окинуть взором’.
При словах типа небозём, небоскат, глазоём, зреймо в работе Даля отсутствуют пометы, указывающие на диалектный источник. По-видимому, они придуманы самим автором, который из лучших патриотических побуждений занимался созданием «проективного лексикона». С некоторыми оговорками в качестве современной аналогии этой деятельности В.И. Даля можно назвать проект «Дар слова» Михаила Эпштейна. Он тоже изобретает слова, но исключительно для обозначения «лакун» — не названных, но существующих в нашей «картине мира» понятий и явлений. Например, на основе слова «соборность» предлагается создать слово «соворность» для обозначения ‘круговой поруки воровства, системного соучастия в общем беззаконии’. Или придуманная им серия слов с корнем -сн- (сон, спать) для описания психологически непростых отношений человека с физиологическим процессом сна: снолюбие, снолюбчивый, снолюбец — ‘о любви ко снам и сновидениям’ или сновидец — ‘о том, кто придает своим снам провидческое значение, сверяет с ними свою жизнь’.
Бесплодность и бесперспективность усилий по искусственному созданию (и распространению) исконных синонимов для заимствований (в настоящее время «проводником» идеи пуризма является партия ЛДПР, представители которой с завидным упорством составляют словари замен иноязычной лексики, правда пока безуспешно) можно иллюстрировать новейшими примерами в этой области. Так, слова исконные «себяшка» и «самострел» не выдержали конкуренции с англицизмом «селфи», которое быстро вошло в нашу речь, стало привычным.
Следовательно, ни о какой «живости» предъявленного в «Толковом словаре…» В.И. Даля лексикона говорить не приходится. Особенно если учесть, что над своим словарем автор трудился в течение 53 лет — это для лексикографа, претендующего на актуальность словаря (такие сроки оправданы только для исторических словарей), непозволительная роскошь. Уже на момент своего выхода словарь «морально» устарел, а его словник превратился, метафорически говоря, в «неживой» и не соответствующий названию…»
Полностью на http://www.sbras.info/articles/opinion/oksana-isachenko-ne-zaglyadyvaya-vdal
* - выделено разным цветом для наглядности.