Аңдатпа
«Big data» зерттеу технологиясы (ағылш. «үлкен деректер») өмірдің әртүрлі салаларында:
менеджментте, медицинада, логистикада және т.б. өзінің тиімділігін дәлелдеді. Алайда, лингвистикада ол фрагментті түрде қолданылады. Бұл технологияны этимология мен салыстыруда қолдану туралы
(автоматтандырылған түрде болмаса да) біз бірнеше мақалалар жарияладық. Алынған нәтижелер негізінде дәстүрлі сөздерден ерекшеленетін сөздерді этимологизациялаудың сындарлы тәсілі жасалды. Оның мәні: көптеген тілдерде ядролық лексикаға қатысты сөздер корпусы бар, олар түбірлер, аффикстер және флексиялар сияқты дәстүрлі элементтерден басқа, конструкциялар, детерминативтер,
теріске шығару форманттарынан тұратын құрылымдық компоненттерден тұрады, олардың жиынтығын праморфология деп атауға болады. Бұл мақаланың мақсаты - этимология мен
салыстымалы тіл білімінде «big data» технологиясын қолдану мүмкіндіктерін негіздеу және көрсету, сонымен қатар конструктивті тәсіл негізінде бір тілдің емес, бірден бірнеше сөздің этимологиялық мағынасын анықтайтын жаңа типтегі этимологиялық сөздікті құрудың теориялық алғышарттарын әзірлеу. Мақалада этимологиялық іздеудің тиімділігін арттыру үшін басқа ғылыми салалардағы зерттеулер барысында қалыптасқан үлкен деректерді талдаудың бірқатар әдістері мен тәсілдерін қалай қолдануға болатындығы көрсетілген: «Data Mining», «модельдеу», «статистика» және т.б. Бұл зерттеу лингвистикада үлкен деректерді талдаудың әртүрлі әдістерін қолдану мүмкіндіктерін көрсетеді.