Recently Published
Clustering Analysis pada Dataset Travel Reviews Menggunakan Metode K-Means, K-Medians, DBSCAN, Mean Shift, dan Fuzzy C-Means dengan Evaluasi Silhouette Coefficient
Analisis ini bertujuan untuk mengelompokkan data preferensi wisata pengguna berdasarkan dataset Travel Reviews menggunakan beberapa metode clustering, yaitu K-Means, K-Medians, DBSCAN, Mean Shift, dan Fuzzy C-Means. Dataset yang digunakan merupakan data mentah yang diperoleh dari UCI Machine Learning Repository, yang berisi penilaian pengguna terhadap berbagai kategori tempat wisata. Sebelum dilakukan proses clustering, data terlebih dilakukan preprocessing berupa penghapusan fitu yang tidak relevan serta normalisasi menggunakan metode standardisasi untuk memastikan keseragaman skala antar fitur. Penentuan jumlah cluster optimal dilakukan menggunakan metode Elbow dan Silhouette, yang menunjukkan bahwa jumlah cluster terbaik adalah dua. Setiap metode clustering diimplementasikan dan dievaluasi menggunakan Silhouette Coefficient untuk mengukur kualitas pemisahan cluster. Hasil evaluasi menunjukkan adanya perbedaan performa antar metode, di mana metode dengan nilai silhouette tertinggi dipilih sebagai metode terbaik (K-Means). Selain itu, dilakukan Analysis Data Eksploratiion (EDA) pada hasil clustering terbaik untuk mengidentifikasi karakteristik setiap cluster berdasarkan nilai rata-rata fitur. Hasil analisis menunjukkan bahwa terdapat pola pengelompokan pengguna berdasarkan preferensi terhadap kategori wisata tertentu. Analisis ini menegaskan bahwa pemilihan metode clustering yang tepat sangat berpengaruh terhadap kualitas hasil pengelompokan, serta pentingnya evaluasi kuantitatif dalam menentukan metode terbaik.
Global Fuel Prices (1924-2024): A Century of Energy Economics
This is for CAP482 (u‿ฺu✿ฺ)
MODUL 3_CLUSTERING
Analisis Clustering Dataset WineQT
Analyzing genes in Autism Savant Language & Mild GSE15402 pub2009 MEV files
This is another project working on in analyzing the Savant Autism patients and use of MEV files I have never worked with but seem similar to the CEL type files but can read in with normal read in functions of read.delim or read.table after skipping rows of meta and reviewing the format in notepad first. No need for bioconductor in this set, but this one shows the array data of TIGR and the actual spot readings, intensities, channels, and saturation levels of channels with quality score, I assume the quality control score is the value that is input in gene reads. This is RNA data of lymphoblastic cell lines or LCLs. I didn't read the published article first but will. The links to gene expression data and published article are in the document.
Analisis Coffee Chain Datasets
Melakukan analisis, visualisasi, dan intepretasi pada R menggunakan koneksi dan pengambilan data dengan MySQL. Disini, saya menggunakan 3 analisis dari dataset tersebut, yaitu hubungan sales dengan profit, profit berdasarkan produk, dan profit berdasarkan market.