Recently Published
Document
Testing phase
Document
Η εργασία αυτή αφορά την εφαρμογή τεχνικών συσταδοποίησης σε δεδομένα τιμών αεροπορικών εισιτηρίων, με στόχο την αναγνώριση φυσικών ομάδων μέσα στο dataset. Αρχικά πραγματοποιείται προεπεξεργασία των δεδομένων με επιλογή των αριθμητικών μεταβλητών και κανονικοποίησή τους, ώστε να είναι συγκρίσιμες μεταξύ τους. Στη συνέχεια εφαρμόζεται ιεραρχική συσταδοποίηση με τη μέθοδο Ward και παρουσιάζεται το αντίστοιχο δενδρόγραμμα, το οποίο βοηθά στον εντοπισμό του κατάλληλου αριθμού συστάδων. Παράλληλα χρησιμοποιείται και ο αλγόριθμος K-means για τη δημιουργία clusters, ενώ με τη μέθοδο Elbow γίνεται εκτίμηση του βέλτιστου αριθμού ομάδων. Τέλος, τα αποτελέσματα οπτικοποιούνται γραφικά, επιτρέποντας την καλύτερη κατανόηση της δομής των δεδομένων και την εξαγωγή βασικών συμπερασμάτων σχετικά με τα πρότυπα που εμφανίζονται στις τιμές των εισιτηρίων.