Задание 1. Простой кластерный анализ.
Для обзора я выбрала несколько новостей о дебюте новой к-поп группы "babymonster" из нескольких источников, таких как: YesAsia, PopCake, K-news
Тексты разделены по двум группы:
1. Информация об участницах, концепте, подготовке к дебюту и работе с агентством.
2. Фанатские теории и споры, сплетни, скандалы вокруг группы.
Я считаю это разделение обоснованным, так как это абсолютно разная информация.
При изменении уровня кластеризации количество групп не меняется. Я думаю, это из-за довольно малого количества текстов и из-за однозначного распределения текстов на группы (смысловое различие одно и то же).

Комментарии
Отправить комментарий