Рейтинг@Mail.ru
Оцифровка книг позволит по-новому изучать историю и культуру - РИА Новости, 17.12.2010
Регистрация пройдена успешно!
Пожалуйста, перейдите по ссылке из письма, отправленного на
Супертег Наука 2021январь
Наука

Оцифровка книг позволит по-новому изучать историю и культуру

© Flickr / HonouОткрытая книга
Открытая книга
Читать ria.ru в
Ученые предложили новую область знаний, названную культуромикой и основанную на данных статистического анализа оцифрованных книг, которая связана с "количественным" изучением истории языка и словесности, а также проявлений того или иного культурного феномена в истории.

МОСКВА, 17 дек - РИА Новости. Ученые предложили новую область знаний, названную культуромикой и основанную на данных статистического анализа оцифрованных книг, которая связана с "количественным" изучением истории языка и словесности, а также проявлений того или иного культурного феномена в истории. Исследователи сообщают об этом в статье, опубликованной в журнале Science.

Cовместная работа ученых Гарвардского университета и специалистов подразделения компании Google, занимающегося оцифровкой и распространением книг в сети, основана на огромном цифровом материале, накопленном интернет-компанией. Google на сегодня оцифровал примерно 15 миллионов книг, что составляет 12% всех когда-либо издававшихся томов.

Этот массив содержит 500 миллиардов слов, прочесть которые не под силу ни одному человеку.

Однако компьютерный статистический анализ позволяет проводить быстрый поиск слов и символов по всей базе данных, благодаря чему можно быстро отслеживать проявления того или иного культурного феномена в ходе истории, который нашел отражение в книгах.

Например, анализ позволил ученым выяснить, что пик популярности актеров приходится на 30 лет - именно в этом возрасте они наиболее часто упоминаются в печати. Писатели восходят на вершину славы на 10 лет позже, имена ученых же часто упоминают лишь в исключительных случаях и, главным образом, уже по достижению ими преклонного возраста. При этом физикам и биологам отводится куда больше внимания, нежели математикам.

Более масштабный анализ позволил ученым оценить историю развития английского языка в ХХ столетии. Согласно выводам команды исследователей, возглавляемой Жаном-Баптистом Мишелем (Jean-Baptiste Michel) из Гарвардского университета, сегодня английский язык содержит порядка миллиона слов. За последние 50 лет его словарный запас вырос почти на 70%, а скорость роста составила примерно 8,5 тысяч слов в год. Впрочем, в настоящее время в разговоре или письме используется лишь половина этого лексикона.

Как показали ученые, свой отпечаток на язык накладывают и внешние факторы, в частности, политические режимы.

Например, упоминания художника Марка Шагала, еврея по национальности, в печатной продукции нацистской Германии 1936-1944 годов не встречаются практически ни разу, тогда как в англоязычных источниках попадаются достаточно часто. Аналогичная ситуация наблюдается в отношении Льва Троцкого в определенный период истории Советского Союза или площади Тяньаньмэнь, где в 1989 году прошли массовые волнения, в китайских источниках.

С помощью этого статистического подхода, как показали ученые, можно проследить влияние внешних факторов на проявление в культуре таких понятий, как феминизм, бог, эволюция, здоровый образ жизни и других, в той или иной степени интересующих каждого члена общества.

"Культуромика расширяет границы возможного до настоящего времени количественного анализа большого количества явлений в социальной сфере и гуманитарных науках. Изучение культурного отпечатка конкретного понятия в истории интересно многим людям, однако мы надеемся, что наш подход будет особенно активно использоваться учеными, изучающими гуманитарные науки и социальные дисциплины", - сказал Эрез Либерман Эйден (Erez Lieberman Aiden), соавтор публикации, слова которого приводит пресс-служба Гарвардского университета.

 
 
 
Лента новостей
0
Сначала новыеСначала старые
loader
Онлайн
Заголовок открываемого материала
Чтобы участвовать в дискуссии,
авторизуйтесь или зарегистрируйтесь
loader
Обсуждения
Заголовок открываемого материала