К основному контенту

практика 5 и 6

 Sentiment-анализ и кластерный анализ

Sentiment - анализ.

Первый текст: 




Второй текст:



                                                                             

Первый текст - Научная статья "Зона 51: что скрывается за мифами о самой секретной базе США". Второй текст - Научная статья "НЛО: как ученые объясняют этот загадочный феномен". 

В первом тексте большинство абзацев имеют позитивную окраску. Но часть все таки окрашена негативно. Это связано с тем, что в тексте присутствуют слова: "секретно", "военная база" итд. - которые окрашены негативно. Хоть в основном сам текст нейтральный. По дисторсии видно, что большая часть абзацев уходит в позитивный аспект.

Второй текст окрашен негативно, позитивного мало, это связано с тем, что в рецензии также упоминаются негативные слова: "ракеты", "летающие объекты", "война" итд. И в самом тексте чувствуется негативный посыл.

Наиболее эмоциональным является первый текст, судя по показателям. На мой взгляд наиболее точной является вторая модель. Там можно увидеть аналитические данные. В первой модели можно разделить блоки на проявление эмоций только визуально.


Кластерный анализ:                                  



Использовались тексты про нло, мифы, зона 51, аномалии.

Хоть все тексты и связаны с нло, мифами и аномалиями, и очень похожи не только по тематике, но и по событиям и структуре, все же тексты под номерами 3,6,8,5,нло и 7,2,4,1, зона 51 - объединились в две группы. 
Первая группа - тексты, где поднимают тему мифологии об НЛО. У второй же группы нет мифологии, там больше новости и интересные факты об Зоне 51 и НЛО.