Задание 1. Простой кластерный анализ.

Для обзора я выбрала несколько новостей о дебюте новой к-поп группы "babymonster" из нескольких источников, таких как: YesAsia, PopCake, K-news

Тексты разделены по двум группы:

1. Информация об участницах, концепте, подготовке к дебюту и работе с агентством.

2. Фанатские теории и споры, сплетни, скандалы вокруг группы.

Я считаю это разделение обоснованным, так как это абсолютно разная информация.

 При изменении уровня кластеризации количество групп не меняется. Я думаю, это из-за довольно малого количества текстов и из-за однозначного распределения текстов на группы (смысловое различие одно и то же).



Комментарии

Популярные сообщения из этого блога

ОСНОВЫ МЕДИАЭКОНОМИКИ. ПРАКТИЧЕСКОЕ ЗАДАНИЕ 1.

ОСНОВЫ МЕДИАЭКОНОМИКИ. ПРАКТИЧЕСКОЕ ЗАДАНИЕ 2.

Задание 3.