Аннотация
Технология исследования «big data» (с англ. «большие данные») доказала свою эффективность в разных сферах жизнедеятельности: управлении, медицине, логистике и т.д. Однако в лингвистике она
используется фрагментарно. О применении этой технологии в этимологии и компаративистике (правда, не в автоматизированном виде) нами опубликовано несколько статей. На основе полученных
результатов разработан конструктный подход к этимологизации слов, отличающийся от
традиционного. Его суть: в большинстве языков есть корпус слов, относящихся к ядерной лексике, которые кроме традиционных элементов: корня, аффиксов и флексий – содержат иные структурные компоненты: конструкты, детерминативы, форманты отрицания, совокупность которых можно назвать праморфологией. Цель данной статьи заключается в обосновании и демонстрации возможностей использования технологии «big data» в этимологии и компаративистике, а также в разработке теоретических предпосылок для создания этимологического словаря нового типа, который на основе конструктного подхода будет определять этимологическое значение определенного слова не одного языка, а сразу нескольких. В статье продемонтрировано, как для повышения эффективности этимологического поиска можно использовать ряд техник и методов анализа больших данных, уже сложившихся в ходе исследований в других научных сферах: «Data Mining», «моделирование», «статистика» и др. Данное исследование показывает возможности использования разных методов анализа больших данных в лингвистике.