harmfulgrumpy: (Default)
[personal profile] harmfulgrumpy
Dal_title1880_2изд.jpg
Недавно в ноябре 2016 Яндекс предпринял попытку подсчитать использование старорусских слов из словаря по запросам в разных регионах страны:
Русский язык в словаре Даля и поиске Яндекса
29 ноября 2016. По данным поиска Яндекса
«В словаре Даля, одном из самых знаменитых и распространенных, примерно 200 тыс. слов. Притом что 150 лет назад он был издан как словарь «живого русского языка», принято считать, что он содержит множество устаревших слов. Компания «Яндекс» решила сравнить поисковые запросы своих пользователей со словарем Даля и выяснить, насколько актуально издание и бывшие в обиходе в России полтора века назад слова сегодня.

Словарь Даля не является нормативным * — то есть его далеко не всегда можно использовать для ответа на вопросы «как пишется то или иное слово» или «что значит то или иное слово».Зато он представляет собой уникальный справочник по живому разговорному языку XIX века, который можно читать не как словарь, а просто подряд. Поисковые запросы содержат в том числе и разговорную лексику, так что сравнив слова из словаря со словами из запросов, можно увидеть, какие изменения произошли за 150 лет.
Количество слов в словаре Даля обычно оценивается приблизительно — около 200 тысяч. Это те слова, которые Даль называл «красными», для которых дано толкование. Эти слова организованы в гнёзда — немногим более 40 тысяч гнёзд и, соответственно, гнездовых слов.
С начала ноября 2015-го по конец октября 2016 года пользователи ввели примерно 70 млрд. запросов в поисковике «Яндекса». После их упорядочивания компания получила свыше 285 млн разных слов, что почти в 1,5 тыс. раз больше, чем у Даля. Далее был использован Национальный корпус русского языка — в основном собрание русскоязычных текстов в электронной форме за XX-XXI века.
«Пересечений оказалось всего около 750 тыс. Можно сказать, что это слова, которые употребляются в современных текстах разных жанров — от художественной литературы до деловых документов».  Сопоставив все данные, «Яндекс» выяснил, что почти 1/5 (18%) словаря Даля за год ни разу не встречалась в поисковых запросах. Еще примерно 38% слов упоминались в запросах, но отсутствовали в корпусе русского языка, и лишь 44% слов попали в пересечение поиска и корпуса…
Исследование двух других групп слов — «слова из запроса, которые есть и в словаре Даля, и в текстах корпуса (условно "живые")» (44%) и «слова из поиска, которые есть в словаре Даля, но отсутствуют в текстах корпуса (условно "уходящие")» (38%) — оказалось несколько затруднительным.



Чтобы точнее определить, какая часть словаря Даля до сих пор жива, в компании оценили долю омонимии, а также посчитали, сколько слов люди искали с целью узнать их значение.

Глазеть в прогаль

Также на основании поисковых запросов компания проанализировала, какие слова из словаря Даля чаще используют в разных регионах, чем в целом по России. Но и здесь главными «действующими лицами» оказались омонимы.

«Больше половины (57%) этих слов — омонимы, то есть сейчас употребляются в значении, отличном от указанного в словаре. Чаще всего омонимами оказываются фамилии и топонимы — названия населенных пунктов, рек, районов. Например, слово "даровушка" в словаре объяснено как "дарун, дарунок, дарунчик (м.), дареное животное: щенок, жеребенок и пр.", а сейчас его ищут практически только в Кировской области, потому что так называется одна из рек»

© Яндекс
Яндекс сравнил поисковые запросы пользователей со словарём Даля

«Вряд ли можно назвать живым слово, которое есть в письменных текстах, но встречается в запросах всего несколько раз в год, или слово, которое вводят в поиск только для того, чтобы узнать значение», — задаются риторическим вопросом авторы исследования…Полностью на https://yandex.ru/company/researches/2016/ya_dahl
и http://rus.rus4all.ru/analytics/20161129/727941114.html

Кратко:

Результаты исследования Яндекса:
* Словарь Даля дает толкование примерно двухсот тысяч слов. Из них почти одна пятая (18 %) за год ни разу не встретилась в поисковых запросах к «Яндексу». Примерно 38 % слов упоминались в запросах, но отсутствовали в корпусе русского языка.
* Примерно треть слов из словаря Даля — 32 % — распространена до сих пор. Еще чуть меньше — 30 % — используются, но крайне мало, треть из них — только при поиске значений. Почти 40 % слов, или полтора тома всего словаря Даля, полностью вышли из употребления.
* Доля глаголов среди этих слов заметно больше, чем в словаре в целом, а доля существительных — меньше. Таким образом, глаголы из словаря Даля устаревают быстрее, чем существительные.
* Около 85 % ушедших слов содержат приставки, в каждом пятом случае — это приставка «по-»; почти треть существительных оканчивается на «-ье» или «-ие» и означает действие по соответствующему глаголу; многие другие существительные заканчиваются на «-чик», «-чица», «-ник», «-ница» и обозначают людей определенных занятий.
*К уходящим из русского языка словам «Яндекс» отнес те, которые встретились в поисковых запросах менее десяти раз в год. Те, которые сравнительно мало встречались в запросах: десятки или, в редких случаях, сотни раз за год, отсутствовали в корпусе, и для которых в интернете не удалось найти примеров употребления. Те, которые искали в первую очередь для того, чтобы узнать значение.

*****

«Как показали последние филологические исследования (см. Дейкина 1993) в словаре  Даля действительно имеется немало слов (около 14 тыс.) которые являются его новообразованиями.»  стр. 17
http://www.ruslang.ru/doc/voprosy/voprosy2001-3.pdf

Диссертация, Дейкина Александра Юрьевна, от 1993 года полностью по ссылке
http://dlib.rsl.ru/viewer/01000797906#?page=17
Слова придуманные В. Далем:  «доброгатство», «полновесие», «мертвизна», «лапистость», «лапчатость», «уровенность», «лежевестность», «равнообразие», «головомытие», «народообычье» (этнография), «противосилие» (антагонизм), «куцохвощенье» (англизирование), «противовосстание» (контреволюция) и другие…




*****

На исследование Яндекса 14.12.2016 дала ответ филолог «Не заглядывая вдаль…»

Прокомментировать исследование «Яндекса» мы попросили доцента Гуманитарного института Новосибирского государственного университета кандидата филологических наук Оксану Михайловну Исаченко:



«Оксана Исаченко:

— Аналитики компании «Яндекс» сделали много шуму из ничего. Вот уж действительно — «сенсация на ровном месте». Никакого «открытия века» всё-таки не получилось, и не могло. Дело в том, что нет никаких реальных предпосылок к тому, чтобы сравнивать лексикон сегодняшнего дня со словником пусть и «уникального справочника», пышно названного автором «Толковым словарем живого великорусского языка». Исходная посылка в качестве обоснования исследования: «Словарь Даля прославился как словарь именно живого, повседневного языка, на котором говорили в России в середине XIX века» — в корне неверна.

Никто не спорит с тем, что словарь В.И. Даля уникальный. Но уникальность в том, что создан он не профессиональным лексикографом, а любителем. По большому счету этот словарь — грандиозный памятник любительской лингвистике, как принято сейчас называть, используя эвфемизм А.А. Зализняка, труды дилетантов в этой области. <...>

Помимо слов, фразеологизмов, пословиц и поговорок Владимир Иванович в течение всей жизни собирал народные песни, сказки и лубочные картины. Понятно, что каждый «экспонат», попавший в коллекцию, дорог и ценен собирателю. Тогда как при составлении словаря (диалектного в первую очередь), необходима тщательная проверка значения слова, его употребительности, подтвержденной контекстом, причем не одним. То есть требуется кропотливая работа с диалектоносителями — информантами (не путать с «информаторами»). <...>

Также важно учесть, что В.И. Даль был «умеренным» пуристом и «неумеренным» славянофилом (отсюда в названии словаря высокопарно-патриотичный эпитет «великорусский» для обозначения «национальности» языка).

Что получилось из этой гремучей смеси интересов и убеждений? Словарь, в котором есть всё, что на тот момент было распространено или встречалось в речевом обиходе. В.И. Даль считает это своей заслугой. Неслучайно в «Напутном слове» к своему детищу он не без гордости и самодовольства пишет: «Желание собирателя было составить словарь, о котором бы можно было сказать: “Речения письменные, беседные, простонародные; общие, местные и областные; обиходные, научные, промысловые и ремесленные; иноязычные усвоенные и вновь захожие, с переводом (…)”».

И всё же основу словаря составляет диалектная лексика, причем тоже неоднородная — различная по географии распространения. В основном в нем представлены русские диалекты Нижегородской и Оренбургской губерний (среди помет, маркирующих территорию, кстати, есть и «сиб.» — сибирское, но Сибирь огромна, и современные диалектологи не отождествляют, например, томские и новосибирские говоры). Кроме того, в словаре зафиксированы изобретенные, авторские слова, которыми В.И. Даль, будучи пуристом, предлагал заменять хорошо известные и распространенные «чужестранные». Например, к греческому по происхождению слову «горизонт» приведен пространный синонимический ряд: небосклон, кругозор, небозём, небоскат, закат неба; глазоём, зреймо; завесь и многое другое. Однако из этого не следует, что все единицы данного ряда «живые», реально «сосуществующие», например, в разных диалектах русского языка.

Попутно отметим, что синонимические ряды в словаре В.И. Даля зачастую включают условно и приблизительно подобные слова, что в принципе недопустимо для научной и профессиональной лексикографии. Рассмотрим тот же пример — с горизонтом. Даже если исходить из предложенного В.И. Далем толкования ‘окраина  земной поверхности, вкруг наблюдателя, где примыкает небо’ (сравните с современной дефиницией: ‘видимая граница (линия кажущегося соприкосновения) неба с земной или водной поверхностью’), обнаруживается неполное соответствие значениям указанных синонимов. Так, в слове «небосклон» отсутствует смысл ‘вкруг наблюдателя’, потому что это ‘часть неба над линией горизонта’, а в слове «кругозор» не актуализировано значение ‘окраина земной поверхности, где примыкает небо’, так как это ‘пространство, которое можно окинуть взором’.

При словах типа небозём, небоскат, глазоём, зреймо в работе Даля отсутствуют пометы, указывающие на диалектный источник. По-видимому, они придуманы самим автором, который из лучших патриотических побуждений занимался созданием «проективного лексикона». С некоторыми оговорками в качестве современной аналогии этой деятельности В.И. Даля можно назвать проект «Дар слова» Михаила Эпштейна. Он тоже изобретает слова, но исключительно для обозначения «лакун» — не названных, но существующих в нашей «картине мира» понятий и явлений. Например, на основе слова «соборность» предлагается создать слово «соворность» для обозначения ‘круговой поруки воровства, системного соучастия в общем беззаконии’. Или придуманная им серия слов с корнем -сн- (сон, спать) для описания психологически непростых отношений человека с физиологическим процессом сна: снолюбие, снолюбчивый, снолюбец — ‘о любви ко снам и сновидениям’ или сновидец — ‘о том, кто придает своим снам провидческое значение, сверяет с ними свою жизнь’.

Бесплодность и бесперспективность усилий по искусственному созданию (и распространению) исконных синонимов для заимствований (в настоящее время «проводником» идеи пуризма является партия ЛДПР, представители которой с завидным упорством составляют словари замен иноязычной лексики, правда пока безуспешно) можно иллюстрировать новейшими примерами в этой области. Так, слова исконные «себяшка» и «самострел» не выдержали конкуренции с англицизмом «селфи», которое быстро вошло в нашу речь, стало привычным.

Своих идеологических мотивов, которые стали «практическим руководством» в лексикографической деятельности, В.И. Даль не скрывает: «Русскому языку, переодетому в “немецкое платье” несвойственных ему категорий и оборотов речи, заимствованных из грамматик и словарей других языков, угрожает опасность захиреть и потерять способность к органическому развитию. Мы начинаем догадываться, что нас завели в трущобу, что надо выбраться из нее поздорову и проложить себе иной путь. Всё, что сделано было доселе, со времен петровских, в духе искажения языка, всё это, как неудачная прививка.., должно усохнуть и отвалиться, дав простор дичку, коему надо вырасти на своем корню, на своих соках...». Поэтому, используя исконные «корнесловы», В.И. Даль охотно изобретал слова и фиксировал их в словаре.
Кроме того, в словаре Даля есть масса других погрешностей, которые не позволяют относиться к нему, как к научному академическому изданию. Прежде всего потому, что в нем, говоря словами знаменитого советского ученого Виктора Владимировича Виноградова, «царит случайность» и — добавим — субъективное отношение автора к «великорусскому языку».

Следовательно, ни о какой «живости» предъявленного в «Толковом словаре…» В.И. Даля лексикона говорить не приходится. Особенно если учесть, что над своим словарем автор трудился в течение 53 лет — это для лексикографа, претендующего на актуальность словаря (такие сроки оправданы только для исторических словарей), непозволительная роскошь. Уже на момент своего выхода словарь «морально» устарел, а его словник превратился, метафорически говоря, в «неживой» и не соответствующий названию…»

Как известно, наиболее динамичной частью языковой системы является лексико-фразеологический уровень. Минимальный шаг, за который значительные изменения в словаре становятся ощутимыми, это поколение, примерно 20—25 лет. Словарь В.И. Даля как минимум пережил шесть поколений носителей языка, как максимум — восемь! О каком сравнении здесь можно говорить? Что с чем сравнивается?
С таким же успехом аналитики могли сравнить конную повозку (телегу, в которую впряжена лошадь) с BMW и обнаружить, что в автомобиле от «прототипа» остались «рожки да ножки», а именно способность ехать, четыре колеса и метрическая единица тягловой мощности — «лошадиная сила». Громко удивиться данному факту и ужаснуться тому, как много мы потеряли: где же ветерок, который бежит за ворот, где свободный обзор во все стороны, где же равномерная тряска на ухабах, где чудная природа вокруг, по «окоёму»? И где утраченная возможность ехать в беспамятстве (по хорошо известной на Руси причине), ведь лошадь вывезет, найдет дорогу домой?
Мы же не сетуем на то, что пишем не на бересте, а на бумаге, зажигаем электричество, а не лучину, печатаем на клавиатуре компьютера, видя текст на экране монитора, и так быстро забыли про печатные машинки, отправляем друг другу электронные или телефонные послания, а не почтовых голубей… Было бы странно, если бы результаты исследования аналитиков «Яндекса» были другими. В таком случае можно было бы всполошиться, а горевать, что мы по дороге растеряли слова В.И. Даля, незачем. Это процесс вполне закономерный и исторически обусловленный.
Вообще, в нашем обществе, а также в профессиональной журналистской среде сформировано неправильное отношение к этому лексикографическому источнику. У такого пиетета перед «Толковым словарем» неясная природа, и, в принципе, разумных оснований он не имеет. «Сверять свою поступь» со словарем В.И. Даля, по поводу и без ссылаться на него («А вот в словаре Даля написано…») современному образованному человеку не пристало.
Профессиональные лингвисты давно об этом пишут, но журналистское сообщество не внемлет. Приведу слова доктора филологических наук Ольги Борисовны Сиротининой (из статьи «От кого зависят судьбы русского языка?»), написанные с укором десять лет назад: «Словарь В.И. Даля <…> превратился в модное для журналистов пособие для поиска нелитературных словечек. Неважно, диалектные они, просторечные или жаргонные — лишь бы нелитературные. Страницы наших даже респектабельных газет конца ХХ века запестрели словечками «намедни», «надысь», «навроде», «супротив», «посередь» и т.д.».
Теперь к этой корпорации «любителей словаря Даля» присоединились аналитики «Яндекса» и потрясли интернет-сообщество результатами своего исследования, выполненного в духе «Россия, которую мы потеряли». Вообще, в лингвистике не принято делать прогнозов. Язык хоть и системен, но его движение и развитие труднопредсказуемо, неслучайно для характеристики его функционирования используют метафору «речевая стихия». В.И. Даль, составляя словарь, описывал современную ему языковую реальность в соответствии со своими представлениями о ней, «не заглядывая вдаль» (как сказал бы Василий Теркин). В позапрошлом веке остались (а в словаре сохранены для нас, далеких потомков): армяки и кафтаны, аршины и версты, алебарды и киверы, клянчи и подкрылыши, кринолины и кокошники, кофешенки и корнеты… Эпоха нынешняя определяется через другой набор слов: омбудсмен, франчайзинг, инсталляция, инстаграм, смайл, фейк, фрик, пранкер, спам, треш, тренд, хит, брекзит, ФСИН, ФСО, сиквел, байопик, хештег, дресс-код… Поэтому современное состояние языка нецелесообразно рассматривать «через призму» В.И. Даля.
Что на самом деле было бы интересно и полезно, так это сравнить лексикон «Грамматического словаря» академика Андрея Анатольевича Зализняка с «лексиконом» пользователя поисковой системой «Яндекс». Ведь именно «академическая» идея А.А. Зализняка, воплощенная в этом словаре, легла в основу «поисковиков» (об этом рассказано в документальном фильме «Яндекс, Гугл и “алгоритм Зализняка”»). Кстати, этот словарь пережил два языковых поколения, был издан в 1977 году, и в 2017-м ему исполнится 40 лет. Есть что сравнивать и над чем подумать…
К публикации текст подготовила Диана Хомякова
Фото  Артёма Поповича  (1)

Полностью на http://www.sbras.info/articles/opinion/oksana-isachenko-ne-zaglyadyvaya-vdal

* - выделено разным цветом для наглядности.
From:
Anonymous( )Anonymous This account has disabled anonymous posting.
OpenID( )OpenID You can comment on this post while signed in with an account from many other sites, once you have confirmed your email address. Sign in using OpenID.
User
Account name:
Password:
If you don't have an account you can create one now.
Subject:
HTML doesn't work in the subject.

Message:

 
Notice: This account is set to log the IP addresses of everyone who comments.
Links will be displayed as unclickable URLs to help prevent spam.

Profile

harmfulgrumpy: (Default)
harmfulgrumpy

July 2017

S M T W T F S
      1
23 45678
9101112131415
16171819202122
23242526272829
3031     

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 20th, 2017 06:28 pm
Powered by Dreamwidth Studios