Recently Published
Clustering Analysis pada Dataset Facebook Live Sellers in Thailand Menggunakan Metode K-Means, Hierarchical, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering dengan Evaluasi Silhouette Coefficient (Revisi 3)
Analisis Clustering ini bertujuan untuk mengelompokkan pola interaksi pengguna Facebook berdasarkan dataset Facebook Live Sellers in Thailand dari UCI Machine Learning Repository menggunakan beberapa metode clustering, yaitu K-Means, Hierarchical Clustering, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering. Dataset yang digunakan memuat variable informasi aktivitas interaksi pengguna terhadap konten Facebook Live, seperti jumlah reaksi, komentar, bagikan, serta jenis konten. Data diproses melalui tahap preprocessing yang meliputi penghapusan variable yang tidak relevan, transformasi variabel kategorik ke dalam bentuk numerik, serta normalisasi menggunakan standardisasi untuk memastikan keseragaman skala antar variabel. Penentuan jumlah cluster optimal dilakukan menggunakan metode Elbow dan Silhouette, dengan hasil terbaik menunjukkan jumlah cluster optimal sebanyak 9 cluster. Seluruh metode clustering dievaluasi menggunakan Silhouette Coefficient untuk mengukur kualitas pemisahan dan kepadatan cluster. Hasil evaluasi menunjukkan bahwa terdapat perbedaan performa antar metode clustering, di mana metode dengan nilai silhouette tertinggi dipilih sebagai metode terbaik. Selanjutnya, dilakukan Exploratory Data Analysis (EDA) untuk mengidentifikasi karakteristik setiap cluster berdasarkan distribusi data dan nilai rata-rata fitur. Hasil analisis menunjukkan adanya pola pengelompokan data berdasarkan tingkat interaksi pengguna terhadap konten Facebook Live. Analisis ini menunjukkan bahwa pemilihan metode clustering yang tepat dan evaluasi kuantitatif sangat penting dalam menghasilkan segmentasi data yang optimal.
Clustering Analysis pada Dataset Facebook Live Sellers in Thailand Menggunakan Metode K-Means, Hierarchical, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering dengan Evaluasi Silhouette Coefficient (Revisi)
Analisis Clustering ini bertujuan untuk mengelompokkan pola interaksi pengguna Facebook berdasarkan dataset Facebook Live Sellers in Thailand dari UCI Machine Learning Repository menggunakan beberapa metode clustering, yaitu K-Means, Hierarchical Clustering, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering. Dataset yang digunakan memuat variable informasi aktivitas interaksi pengguna terhadap konten Facebook Live, seperti jumlah reaksi, komentar, bagikan, serta jenis konten. Data diproses melalui tahap preprocessing yang meliputi penghapusan variable yang tidak relevan, transformasi variabel kategorik ke dalam bentuk numerik, serta normalisasi menggunakan standardisasi untuk memastikan keseragaman skala antar variabel. Penentuan jumlah cluster optimal dilakukan menggunakan metode Elbow dan Silhouette, dengan hasil terbaik menunjukkan jumlah cluster optimal sebanyak 9 cluster. Seluruh metode clustering dievaluasi menggunakan Silhouette Coefficient untuk mengukur kualitas pemisahan dan kepadatan cluster. Hasil evaluasi menunjukkan bahwa terdapat perbedaan performa antar metode clustering, di mana metode dengan nilai silhouette tertinggi dipilih sebagai metode terbaik. Selanjutnya, dilakukan Exploratory Data Analysis (EDA) untuk mengidentifikasi karakteristik setiap cluster berdasarkan distribusi data dan nilai rata-rata fitur. Hasil analisis menunjukkan adanya pola pengelompokan data berdasarkan tingkat interaksi pengguna terhadap konten Facebook Live. Analisis ini menunjukkan bahwa pemilihan metode clustering yang tepat dan evaluasi kuantitatif sangat penting dalam menghasilkan segmentasi data yang optimal.
Clustering Analysis pada Dataset Facebook Live Sellers in Thailand Menggunakan Metode K-Means, Hierarchical, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering dengan Evaluasi Silhouette Coefficient
Analisis Clustering ini bertujuan untuk mengelompokkan pola interaksi pengguna Facebook berdasarkan dataset Facebook Live Sellers in Thailand dari UCI Machine Learning Repository menggunakan beberapa metode clustering, yaitu K-Means, Hierarchical Clustering, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering. Dataset yang digunakan memuat informasi aktivitas interaksi pengguna terhadap konten Facebook Live, seperti jumlah reaksi, komentar, bagikan, serta jenis konten. Data diproses melalui tahap preprocessing yang meliputi penghapusan variable yang tidak relevan, transformasi variabel kategorik ke dalam bentuk numerik, serta normalisasi menggunakan standardisasi untuk memastikan keseragaman skala antar variabel. Penentuan jumlah cluster optimal dilakukan menggunakan metode Elbow dan Silhouette, dengan hasil terbaik menunjukkan jumlah cluster optimal sebanyak 9 cluster. Seluruh metode clustering dievaluasi menggunakan Silhouette Coefficient untuk mengukur kualitas pemisahan dan kepadatan cluster. Hasil evaluasi menunjukkan bahwa terdapat perbedaan performa antar metode clustering, di mana metode dengan nilai silhouette tertinggi dipilih sebagai metode terbaik. Selanjutnya, dilakukan Exploratory Data Analysis (EDA) untuk mengidentifikasi karakteristik setiap cluster berdasarkan distribusi data dan nilai rata-rata fitur. Hasil analisis menunjukkan adanya pola pengelompokan data berdasarkan tingkat interaksi pengguna terhadap konten Facebook Live. Analisis ini menunjukkan bahwa pemilihan metode clustering yang tepat dan evaluasi kuantitatif sangat penting dalam menghasilkan segmentasi data yang optimal.
Clustering Analysis pada Dataset Travel Reviews Menggunakan Metode K-Means, K-Medians, DBSCAN, Mean Shift, dan Fuzzy C-Means dengan Evaluasi Silhouette Coefficient
Analisis ini bertujuan untuk mengelompokkan data preferensi wisata pengguna berdasarkan dataset Travel Reviews menggunakan beberapa metode clustering, yaitu K-Means, K-Medians, DBSCAN, Mean Shift, dan Fuzzy C-Means. Dataset yang digunakan merupakan data mentah yang diperoleh dari UCI Machine Learning Repository, yang berisi penilaian pengguna terhadap berbagai kategori tempat wisata. Sebelum dilakukan proses clustering, data terlebih dilakukan preprocessing berupa penghapusan fitu yang tidak relevan serta normalisasi menggunakan metode standardisasi untuk memastikan keseragaman skala antar fitur. Penentuan jumlah cluster optimal dilakukan menggunakan metode Elbow dan Silhouette, yang menunjukkan bahwa jumlah cluster terbaik adalah dua. Setiap metode clustering diimplementasikan dan dievaluasi menggunakan Silhouette Coefficient untuk mengukur kualitas pemisahan cluster. Hasil evaluasi menunjukkan adanya perbedaan performa antar metode, di mana metode dengan nilai silhouette tertinggi dipilih sebagai metode terbaik (K-Means). Selain itu, dilakukan Analysis Data Eksploratiion (EDA) pada hasil clustering terbaik untuk mengidentifikasi karakteristik setiap cluster berdasarkan nilai rata-rata fitur. Hasil analisis menunjukkan bahwa terdapat pola pengelompokan pengguna berdasarkan preferensi terhadap kategori wisata tertentu. Analisis ini menegaskan bahwa pemilihan metode clustering yang tepat sangat berpengaruh terhadap kualitas hasil pengelompokan, serta pentingnya evaluasi kuantitatif dalam menentukan metode terbaik.
MODUL 1 MATA KULIAH ANALISIS MULTIVARIAT IMPLEMENTASI PRINCIPAL COMPONENT ANALYSIS (PCA) DAN FACTOR ANALYSIS (FA) PADA DATA SENSOR LINGKUNGAN UNTUK ESTIMASI OKUPANSI RUANGAN
Analisis ini bertujuan untuk mengidentifikasi struktur utama yang memuat variabel-variabel sensor lingkungan dalam dataset Room Occupancy Estimation yang terdapat pada UCI Machine Learning Repository. Dataset tersebut memuat berbagai indikator numerik seperti suhu, kelembapan, intensitas cahaya, kadar karbon dioksida (CO₂), dan tingkat kebisingan yang saling berkorelasi dan berkontribusi dalam estimasi tingkat okupansi ruangan. Principal Component Analysis (PCA) digunakan untuk mereduksi dimensi data dengan mentransformasikan variabel-variabel yang berkorelasi menjadi sejumlah komponen utama yang mampu menjelaskan variasi terbesar dalam data, sedangkan Factor Analysis (FA) digunakan untuk mengidentifikasi faktor laten yang merepresentasikan konstruk lingkungan yang mendasari kelompok variabel yang saling berhubungan.
24031554018_ANDIKA FEBRIANTO_TUGAS ANALISIS MULTIVARIAT WEEK 1
Dokumen ini berisi hasil analisis multivariat terhadap dataset senyawa kecil "SIRTUIN6" menggunakan bahasa pemograman R. Analisis mencakup proses impor data, pembentukan matriks korelasi, matriks variance-covariance, serta perhitungan eigenvalue dan eigenvector sebagai dasar reduksi dimensi (Principal Component Analysis atau PCA). Tujuan analisis adalah untuk memahami hubungan antar descriptor molekul, melihat struktur variasi data, dan mengidentifikasi komponen utama yang paling merepresentasikan informasi dalam dataset. Hasil menunjukkan adanya keterkaitan antar variabel dengan tingkat korelasi rendah hingga sedang, serta dominasi beberapa komponen utama dalam menjelaskan variasi total data.