RPubs

Clasification Analysis pada Dataset Dry Bean Menggunakan Metode Analisis Diskriminan dan Multinomial Logistic Regression

Analisis klasifikasi ini bertujuan untuk mengklasifikasikan jenis biji kering berdasarkan Dry Bean Dataset dari UCI Machine Learning Repository menggunakan metode Multinomial Logistic Regression dan Discriminant Analysis. Dataset terdiri dari 13.611 observasi dengan tujuh kategori jenis biji kering. Data diproses melalui tahap preprocessing meliputi pengecekan missing value, penghapusan data duplikat, standarisasi variabel numerik, dan identifikasi outlier. Variabel yang digunakan merupakan hasil seleksi variabel, yaitu AspectRatio, ShapeFactor1, ShapeFactor4, Extent, dan Solidity untuk mengurangi multikolinearitas dan memperoleh model yang lebih stabil. Evaluasi model dilakukan melalui pengujian asumsi serta pengukuran performa klasifikasi. Hasil analisis menunjukkan bahwa model akhir mampu memberikan performa yang sangat optimal dengan akurasi sebesar 92,24%, nilai Kappa sebesar 0,9061, dan Pseudo R² McFadden sebesar 0,885. Analisis ini menunjukkan bahwa regresi logistik multinomial efektif digunakan untuk klasifikasi multikelas berdasarkan karakteristik geometris biji kering.

12 days ago

Clasification Analysis pada Dataset Dry Bean Menggunakan Metode Analisis Diskriminan dan Multinomial Logistic Regression

Analisis klasifikasi ini bertujuan untuk mengklasifikasikan jenis biji kering berdasarkan Dry Bean Dataset dari UCI Machine Learning Repository menggunakan metode regresi logistik multinomial. Dataset yang digunakan terdiri dari 13.611 observasi yang merepresentasikan tujuh kategori jenis biji kering, yaitu BARBUNYA, BOMBAY, CALI, DERMASON, HOROZ, SEKER, dan SIRA, dengan karakteristik yang diukur berdasarkan fitur geometris biji. Variabel dependen dalam analisis ini adalah jenis biji (Class), sedangkan variabel independen yang digunakan merupakan hasil seleksi variabel, yaitu AspectRatio, ShapeFactor1, ShapeFactor4, Extent, dan Solidity, yang dipilih untuk merepresentasikan bentuk biji sekaligus mengurangi masalah multikolinearitas. Data diproses melalui tahap preprocessing yang meliputi pengecekan missing value, penghapusan data duplikat, standarisasi variabel numerik, serta identifikasi outlier untuk memastikan kualitas data sebelum pemodelan. Model awal dibentuk menggunakan seluruh variabel prediktor, kemudian dilakukan evaluasi asumsi seperti independensi observasi, multikolinearitas, dan linearitas logit untuk memperoleh model yang lebih stabil dan parsimonious. Hasil pengujian menunjukkan bahwa model akhir dengan penambahan komponen non-linear mampu memberikan performa klasifikasi yang sangat baik, dengan akurasi sebesar 92,24%, nilai Kappa sebesar 0,9061, dan nilai Pseudo R² McFadden sebesar 0,885. Hasil analisis menunjukkan bahwa regresi logistik multinomial mampu mengklasifikasikan jenis dry bean secara akurat berdasarkan karakteristik geometris biji, sehingga metode ini efektif digunakan sebagai model klasifikasi multikelas.

12 days ago

Clasification Analysis pada Dataset Dry Bean Dry Menggunakan Metode Analisis Diskriminan dan Multinomial Logistic Regression

Analisis klasifikasi ini bertujuan untuk mengklasifikasikan jenis biji kering berdasarkan Dry Bean Dataset dari UCI Machine Learning Repository menggunakan metode regresi logistik multinomial. Dataset yang digunakan terdiri dari 13.611 observasi yang merepresentasikan tujuh kategori jenis biji kering, yaitu BARBUNYA, BOMBAY, CALI, DERMASON, HOROZ, SEKER, dan SIRA, dengan karakteristik yang diukur berdasarkan fitur geometris biji. Variabel dependen dalam analisis ini adalah jenis biji (Class), sedangkan variabel independen yang digunakan merupakan hasil seleksi variabel, yaitu AspectRatio, ShapeFactor1, ShapeFactor4, Extent, dan Solidity, yang dipilih untuk merepresentasikan bentuk biji sekaligus mengurangi masalah multikolinearitas. Data diproses melalui tahap preprocessing yang meliputi pemeriksaan missing value, penghapusan data duplikat, standarisasi variabel numerik, serta identifikasi outlier untuk memastikan kualitas data sebelum pemodelan. Model awal dibangun menggunakan seluruh variabel prediktor, kemudian dilakukan evaluasi asumsi seperti independensi observasi, multikolinearitas, dan linearitas logit untuk memperoleh model yang lebih stabil dan parsimonious. Hasil pengujian menunjukkan bahwa model akhir dengan penambahan komponen non-linear mampu memberikan performa klasifikasi yang sangat baik, dengan akurasi sebesar 92,24%, nilai Kappa sebesar 0,9061, dan nilai Pseudo R² McFadden* sebesar 0,885. Hasil analisis menunjukkan bahwa regresi logistik multinomial mampu mengklasifikasikan jenis dry bean secara akurat berdasarkan karakteristik geometris biji, sehingga metode ini efektif digunakan sebagai pendekatan klasifikasi multikelas.

19 days ago

Clustering Analysis pada Dataset Facebook Live Sellers in Thailand Menggunakan Metode K-Means, Hierarchical, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering dengan Evaluasi Silhouette Coefficient (Revisi 3)

Analisis Clustering ini bertujuan untuk mengelompokkan pola interaksi pengguna Facebook berdasarkan dataset Facebook Live Sellers in Thailand dari UCI Machine Learning Repository menggunakan beberapa metode clustering, yaitu K-Means, Hierarchical Clustering, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering. Dataset yang digunakan memuat variable informasi aktivitas interaksi pengguna terhadap konten Facebook Live, seperti jumlah reaksi, komentar, bagikan, serta jenis konten. Data diproses melalui tahap preprocessing yang meliputi penghapusan variable yang tidak relevan, transformasi variabel kategorik ke dalam bentuk numerik, serta normalisasi menggunakan standardisasi untuk memastikan keseragaman skala antar variabel. Penentuan jumlah cluster optimal dilakukan menggunakan metode Elbow dan Silhouette, dengan hasil terbaik menunjukkan jumlah cluster optimal sebanyak 9 cluster. Seluruh metode clustering dievaluasi menggunakan Silhouette Coefficient untuk mengukur kualitas pemisahan dan kepadatan cluster. Hasil evaluasi menunjukkan bahwa terdapat perbedaan performa antar metode clustering, di mana metode dengan nilai silhouette tertinggi dipilih sebagai metode terbaik. Selanjutnya, dilakukan Exploratory Data Analysis (EDA) untuk mengidentifikasi karakteristik setiap cluster berdasarkan distribusi data dan nilai rata-rata fitur. Hasil analisis menunjukkan adanya pola pengelompokan data berdasarkan tingkat interaksi pengguna terhadap konten Facebook Live. Analisis ini menunjukkan bahwa pemilihan metode clustering yang tepat dan evaluasi kuantitatif sangat penting dalam menghasilkan segmentasi data yang optimal.

20 days ago

Clustering Analysis pada Dataset Facebook Live Sellers in Thailand Menggunakan Metode K-Means, Hierarchical, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering dengan Evaluasi Silhouette Coefficient (Revisi)

Analisis Clustering ini bertujuan untuk mengelompokkan pola interaksi pengguna Facebook berdasarkan dataset Facebook Live Sellers in Thailand dari UCI Machine Learning Repository menggunakan beberapa metode clustering, yaitu K-Means, Hierarchical Clustering, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering. Dataset yang digunakan memuat variable informasi aktivitas interaksi pengguna terhadap konten Facebook Live, seperti jumlah reaksi, komentar, bagikan, serta jenis konten. Data diproses melalui tahap preprocessing yang meliputi penghapusan variable yang tidak relevan, transformasi variabel kategorik ke dalam bentuk numerik, serta normalisasi menggunakan standardisasi untuk memastikan keseragaman skala antar variabel. Penentuan jumlah cluster optimal dilakukan menggunakan metode Elbow dan Silhouette, dengan hasil terbaik menunjukkan jumlah cluster optimal sebanyak 9 cluster. Seluruh metode clustering dievaluasi menggunakan Silhouette Coefficient untuk mengukur kualitas pemisahan dan kepadatan cluster. Hasil evaluasi menunjukkan bahwa terdapat perbedaan performa antar metode clustering, di mana metode dengan nilai silhouette tertinggi dipilih sebagai metode terbaik. Selanjutnya, dilakukan Exploratory Data Analysis (EDA) untuk mengidentifikasi karakteristik setiap cluster berdasarkan distribusi data dan nilai rata-rata fitur. Hasil analisis menunjukkan adanya pola pengelompokan data berdasarkan tingkat interaksi pengguna terhadap konten Facebook Live. Analisis ini menunjukkan bahwa pemilihan metode clustering yang tepat dan evaluasi kuantitatif sangat penting dalam menghasilkan segmentasi data yang optimal.

20 days ago

Clustering Analysis pada Dataset Facebook Live Sellers in Thailand Menggunakan Metode K-Means, Hierarchical, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering dengan Evaluasi Silhouette Coefficient

Analisis Clustering ini bertujuan untuk mengelompokkan pola interaksi pengguna Facebook berdasarkan dataset Facebook Live Sellers in Thailand dari UCI Machine Learning Repository menggunakan beberapa metode clustering, yaitu K-Means, Hierarchical Clustering, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering. Dataset yang digunakan memuat informasi aktivitas interaksi pengguna terhadap konten Facebook Live, seperti jumlah reaksi, komentar, bagikan, serta jenis konten. Data diproses melalui tahap preprocessing yang meliputi penghapusan variable yang tidak relevan, transformasi variabel kategorik ke dalam bentuk numerik, serta normalisasi menggunakan standardisasi untuk memastikan keseragaman skala antar variabel. Penentuan jumlah cluster optimal dilakukan menggunakan metode Elbow dan Silhouette, dengan hasil terbaik menunjukkan jumlah cluster optimal sebanyak 9 cluster. Seluruh metode clustering dievaluasi menggunakan Silhouette Coefficient untuk mengukur kualitas pemisahan dan kepadatan cluster. Hasil evaluasi menunjukkan bahwa terdapat perbedaan performa antar metode clustering, di mana metode dengan nilai silhouette tertinggi dipilih sebagai metode terbaik. Selanjutnya, dilakukan Exploratory Data Analysis (EDA) untuk mengidentifikasi karakteristik setiap cluster berdasarkan distribusi data dan nilai rata-rata fitur. Hasil analisis menunjukkan adanya pola pengelompokan data berdasarkan tingkat interaksi pengguna terhadap konten Facebook Live. Analisis ini menunjukkan bahwa pemilihan metode clustering yang tepat dan evaluasi kuantitatif sangat penting dalam menghasilkan segmentasi data yang optimal.

20 days ago

Clustering Analysis pada Dataset Travel Reviews Menggunakan Metode K-Means, K-Medians, DBSCAN, Mean Shift, dan Fuzzy C-Means dengan Evaluasi Silhouette Coefficient

Analisis ini bertujuan untuk mengelompokkan data preferensi wisata pengguna berdasarkan dataset Travel Reviews menggunakan beberapa metode clustering, yaitu K-Means, K-Medians, DBSCAN, Mean Shift, dan Fuzzy C-Means. Dataset yang digunakan merupakan data mentah yang diperoleh dari UCI Machine Learning Repository, yang berisi penilaian pengguna terhadap berbagai kategori tempat wisata. Sebelum dilakukan proses clustering, data terlebih dilakukan preprocessing berupa penghapusan fitu yang tidak relevan serta normalisasi menggunakan metode standardisasi untuk memastikan keseragaman skala antar fitur. Penentuan jumlah cluster optimal dilakukan menggunakan metode Elbow dan Silhouette, yang menunjukkan bahwa jumlah cluster terbaik adalah dua. Setiap metode clustering diimplementasikan dan dievaluasi menggunakan Silhouette Coefficient untuk mengukur kualitas pemisahan cluster. Hasil evaluasi menunjukkan adanya perbedaan performa antar metode, di mana metode dengan nilai silhouette tertinggi dipilih sebagai metode terbaik (K-Means). Selain itu, dilakukan Analysis Data Eksploratiion (EDA) pada hasil clustering terbaik untuk mengidentifikasi karakteristik setiap cluster berdasarkan nilai rata-rata fitur. Hasil analisis menunjukkan bahwa terdapat pola pengelompokan pengguna berdasarkan preferensi terhadap kategori wisata tertentu. Analisis ini menegaskan bahwa pemilihan metode clustering yang tepat sangat berpengaruh terhadap kualitas hasil pengelompokan, serta pentingnya evaluasi kuantitatif dalam menentukan metode terbaik.

about 1 month ago

MODUL 1 MATA KULIAH ANALISIS MULTIVARIAT IMPLEMENTASI PRINCIPAL COMPONENT ANALYSIS (PCA) DAN FACTOR ANALYSIS (FA) PADA DATA SENSOR LINGKUNGAN UNTUK ESTIMASI OKUPANSI RUANGAN

Analisis ini bertujuan untuk mengidentifikasi struktur utama yang memuat variabel-variabel sensor lingkungan dalam dataset Room Occupancy Estimation yang terdapat pada UCI Machine Learning Repository. Dataset tersebut memuat berbagai indikator numerik seperti suhu, kelembapan, intensitas cahaya, kadar karbon dioksida (CO₂), dan tingkat kebisingan yang saling berkorelasi dan berkontribusi dalam estimasi tingkat okupansi ruangan. Principal Component Analysis (PCA) digunakan untuk mereduksi dimensi data dengan mentransformasikan variabel-variabel yang berkorelasi menjadi sejumlah komponen utama yang mampu menjelaskan variasi terbesar dalam data, sedangkan Factor Analysis (FA) digunakan untuk mengidentifikasi faktor laten yang merepresentasikan konstruk lingkungan yang mendasari kelompok variabel yang saling berhubungan.

3 months ago

24031554018_ANDIKA FEBRIANTO_TUGAS ANALISIS MULTIVARIAT WEEK 1

Dokumen ini berisi hasil analisis multivariat terhadap dataset senyawa kecil "SIRTUIN6" menggunakan bahasa pemograman R. Analisis mencakup proses impor data, pembentukan matriks korelasi, matriks variance-covariance, serta perhitungan eigenvalue dan eigenvector sebagai dasar reduksi dimensi (Principal Component Analysis atau PCA). Tujuan analisis adalah untuk memahami hubungan antar descriptor molekul, melihat struktur variasi data, dan mengidentifikasi komponen utama yang paling merepresentasikan informasi dalam dataset. Hasil menunjukkan adanya keterkaitan antar variabel dengan tingkat korelasi rendah hingga sedang, serta dominasi beberapa komponen utama dalam menjelaskan variasi total data.

3 months ago

RPubs

andkfbrnt018

ANDIKA FEBRIANTO

Recently Published

Clasification Analysis pada Dataset Dry Bean Menggunakan Metode Analisis Diskriminan dan Multinomial Logistic Regression

Clasification Analysis pada Dataset Dry Bean Menggunakan Metode Analisis Diskriminan dan Multinomial Logistic Regression

Clasification Analysis pada Dataset Dry Bean Dry Menggunakan Metode Analisis Diskriminan dan Multinomial Logistic Regression

Clustering Analysis pada Dataset Facebook Live Sellers in Thailand Menggunakan Metode K-Means, Hierarchical, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering dengan Evaluasi Silhouette Coefficient (Revisi 3)

Clustering Analysis pada Dataset Facebook Live Sellers in Thailand Menggunakan Metode K-Means, Hierarchical, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering dengan Evaluasi Silhouette Coefficient (Revisi)

Clustering Analysis pada Dataset Facebook Live Sellers in Thailand Menggunakan Metode K-Means, Hierarchical, DBSCAN, Fuzzy C-Means, K-Medians, dan Spectral Clustering dengan Evaluasi Silhouette Coefficient

Clustering Analysis pada Dataset Travel Reviews Menggunakan Metode K-Means, K-Medians, DBSCAN, Mean Shift, dan Fuzzy C-Means dengan Evaluasi Silhouette Coefficient

MODUL 1 MATA KULIAH ANALISIS MULTIVARIAT IMPLEMENTASI PRINCIPAL COMPONENT ANALYSIS (PCA) DAN FACTOR ANALYSIS (FA) PADA DATA SENSOR LINGKUNGAN UNTUK ESTIMASI OKUPANSI RUANGAN

24031554018_ANDIKA FEBRIANTO_TUGAS ANALISIS MULTIVARIAT WEEK 1

Sign In

andkfbrnt018

ANDIKA FEBRIANTO

Recently Published