Recently Published
4_DBCA_ChatGPT
4_DBCA_ChatGPT
Εργασία5
Στην παρούσα εργασία πραγματοποιείται μια μελέτη περίπτωσης γραμμικής παλινδρόμησης με χρήση της γλώσσας προγραμματισμού R και του περιβάλλοντος R Markdown. Στόχος της ανάλυσης είναι η διερεύνηση των παραγόντων που επηρεάζουν το ποσό δανείου (loan_amnt) χρησιμοποιώντας δεδομένα από σύνολο δανειοληπτών.
Αρχικά παρουσιάζεται και περιγράφεται το dataset, καθώς και οι βασικές μεταβλητές που χρησιμοποιούνται στην ανάλυση, όπως το εισόδημα του ατόμου (person_income), το ποσοστό του εισοδήματος που σχετίζεται με το δάνειο (loan_percent_income) και το πιστωτικό σκορ (credit_score). Στη συνέχεια δημιουργούνται ενδεικτικά διαγράμματα (scatterplots και boxplots) για την οπτική διερεύνηση των σχέσεων μεταξύ των μεταβλητών.
Έπειτα κατασκευάζονται μοντέλα γραμμικής παλινδρόμησης, αρχικά με μία ανεξάρτητη μεταβλητή και στη συνέχεια με περισσότερες μεταβλητές. Για κάθε μοντέλο παρουσιάζονται τα αποτελέσματα, καθώς και σχετικά διαγράμματα.
Τέλος, εξετάζεται η επίδραση της προσθήκης ή αφαίρεσης ανεξάρτητων μεταβλητών στο μοντέλο μέσω της ανάλυσης των συσχετίσεων, του SSE (Sum of Squared Errors) και του συντελεστή προσδιορισμού R², με στόχο την αξιολόγηση και τη σύγκριση της απόδοσης των μοντέλων.
Ketidakpastian Estimasi
Simulasi ini mengeksplorasi pengaruh ukuran sampel, variabilitas data, dan pengetahuan standar deviasi populasi terhadap lebar interval kepercayaan 95%. Hasilnya menunjukkan bahwa sampel yang lebih besar menghasilkan estimasi yang lebih presisi, sementara variabilitas yang tinggi memperbesar ketidakpastian. Perbedaan antara penggunaan distribusi Z dan t juga terlihat, terutama pada sampel kecil. Eksplorasi ini menegaskan pentingnya memahami karakteristik data dalam menghasilkan estimasi yang akurat.