Архив статей журнала
В статье исследуется возможность применения метода кластеризации текстов для анализа фольклорного материала. С помощью программы Stylo анализируются два корпуса частушек из 239 и 645 текстов, собранных в фольклорной экспедиции ЦТСФ РГГУ в 2021-2023 гг. в Бирском районе Республики Башкортостан. В статье описаны принципы кластеризации текстов на графике метода главных компонент, проанализированы коллокации наиболее частотных слов. Показано, что они отличаются от коллокаций с этими же словами в обыденной речи (в сравнении с основным подкорпусом НКРЯ). Использование Stylo показало, что сформированные кластеры отражают наиболее характерную для определенного количества текстов лексико-синтаксическую структуру. Например, сочетания отрицательной частицы «не» с глаголами в частушечной речи преобладают над сочетаниями с именными формами, более характерными для обыденной речи, сочетания «а+я+глагол» и «а+я+местоимение» преобладают над сочетанием «а+я+служебные части речи», сочетания «на + существительное» или «на + прилагательное /местоимение + существительное» преобладают над сочетанием «на + местоимение», сочетание «в + существительное» преобладает над сочетанием «в + местоимение». Выделенные тенденции показывают свою устойчивость и прослеживаются при анализе корпуса как из 239 текстов, так и из 645. Наглядно показано разделение корпуса из 239 текстов на тексты с формами местоимения «я» и с обращениями. Выделены три распространенных варианта построения обращений в частушках: введение «нереального адресата», описание стереотипной ситуации, вовлечение слушающего.