на главнуюВсе эхи RU.SEMIOTICS
войти ?

Google Books активно эксплуатируется исследователями частотности

От Marinais (2:5020/1955.87) к All

В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)



=============================================================================
* Area : RU.COMPUTERRA
* From : PostRobot, 2:5025/3.167 (03-Mar-12 01:09:56)
* To : All
* Subj : Google Books активно эксплуатируется исследователями частотности
=============================================================================
#Компьюлента. Hовости
__________________________________________________________________

Google Books активно эксплуатируется исследователями частотности
языковых явлений
Опубликовано: 02.03.2012, 17:23

Hа молчаливых книжных страницах идёт яростная борьба: социальные,
технические, политические перемены рождают новые слова и значения,
вытесняя устаревшие.

Международная группа учёных провела анализ частотности употребления
более 10 млн слов английского, испанского и иврита в период с 1800 по
2008 год с помощью проекта Ngram, который основан на материале цифровой
библиотеки Google Books, охватывающей 5 млн книг на семи языках (около
4% всех напечатанных).

Hа конференции Американского физического общества руководитель группы
Джоэл Тененбаум из Бостонского университета (США) -- тот самый,
которого судили за <<нелегальное>> размещение музыки в Интернете, --
рассказал о главном выводе. Исчезновение слов из активного запаса языка
совпадает с началом эпохи современной печати. Эта тенденция усилилась
со стандартизацией методов книгопечатания, а затем -- технологий
компьютерной вёрстки и проверки орфографии. Вместе с опечатками из
тезауруса вылетели менее популярные синонимы. Язык стал более
унифицированным.

Вместе с тем обнаружена тенденция к упрощению лексем. Hапример, в
течение нескольких лет после изобретения рентгена в английском языке
шла борьба между словами <<roentgenogram>>, <<radiogram>> и <<X-ray>>.
Разумеется, победило последнее -- и его конкуренты оказались вне
активного запаса. <<Каждое слово стремится монополизировать значение>>,
-- подчеркнул г-н Тененбаум.

Вот ещё любопытный пример. Примерно до 1939 года в английском языке
Первая мировая война звалась Великой (The Great War). Это обозначение
выпало из оборота, как только стало понятно, что в действительности это
была вовсе не та война, которая, как говорится, должна была положить
конец всем войнам.

Любопытно было бы узнать, происходит ли аналогичный процесс не только
со словами, но и с выражениями.

Следует отметить, что это далеко не единственное исследование,
проведённое за последнее время на материале крупнейшей в мире цифровой
библиотеки, обладающей к тому же возможностью поиска. Так, Цзяньбо Гао
из Государственного университета им. братьев Райт (США) и его коллеги
воспользовались Google Books, дабы сравнить частотность употребления
слов, описывающих природные катаклизмы (землетрясения, ураганы и др.) и
социальные явления (например, войны, безработицу).

Особенно их интересовала математическая величина под названием
экспонента Хёрста, которая описывает вероятность повторения события на
основании исторических данных. Можно сказать, этот параметр позволяет
судить о том, как прошлое влияет на будущее посредством <<памяти>> о
тех или иных событиях.

Так вот, выяснилось, что у языка долгая память на природные катаклизмы
и короткая -- на события общественной жизни. И это, кстати, означает,
что различные смыслы регулируются языком по-разному. С другой стороны,
возможно, дело вовсе не в языке, а во внешних факторах (культурных
запретах, цензуре и т. п.), которые оказывают воздействие на
распространение информации о социальных явлениях.

Подготовлено по материалам ScienceNews и Technology Review.

__________________________________________________________________

Source: http://pda.compulenta.ru/?action=article&id=664749
=============================================================================

... А меж тем, в правилах есть что-то интересное... ;-)

* Origin: 2:5020/1823.2, /1955.87, /5411.3 (2:5020/1955.87)

Ответы на это письмо:

From: Username
Заголовок следующего сообщения в треде может быть длинным и его придется перенести на новую строку

From: Username
Или коротким

FGHI-url этого письма: area://RU.SEMIOTICS?msgid=2:5020/1955.87+11d8ea19