Recently Published

SLOPE_TYPE
OPERATIONAL_STATUS
CURVATURE_TYPE
COUNTRY
Консенсусное дерево советских авторов (современников Шолохова)
Допустим, в нашем научном поле поставили острый вопрос авторства (например: правда ли автором "Тихого Дона" является Шолохов, а не, скажем, Фадеев?). Одним из методов, способных помочь нам ответить на этот вопрос является иерархическая кластеризация и её визуализация через консенсусные деревья. В домашнем задании предлагалось скачать файл со стилометрическими данными "Тихого Дона" и романов других авторов, современников Шолохова, дабы проверить высказанную выше гипотезу с точки зрения стилометрии.
Hand On Mg3 Wasis
Tugas Hand On Mg3
Project-Data Science Presentations
Complete 5-Slide R Presentation for SwiftKey Capstone
Project-Data Science Capstone
This report presents an exploratory analysis of the three text data sets provided for the SwiftKey Capstone Project: blogs, news, and Twitter. The goal is to understand the basic characteristics of these data sets before building a next-word prediction algorithm. Key findings include: The Twitter data set has the most lines (over 2 million) but the smallest file size The blogs data set contains the longest individual lines (over 40,000 characters) Word "love" appears about 4 times more frequently than "hate" in Twitter data All three data sets show similar patterns in word frequency distributions
Document