PISA 2018 fen bilimleri puanlarının değerlendirilmesinde eğitsel veri madenciliğinin kullanımı
Abstract
Bu çalışma, PISA 2018 fen bilimleri puanlarının; anne-baba eğitim durumu, fen öğrenmek için haftalık harcanan zaman, okulda bilgi iletişim teknolojileri (BİT) kullanımı ve öğrenci algılanan BİT yeterliği değişkenlerinden yararlanılarak veri madenciliği algoritmalarından olan karar ağaçları ile değerlendirilmesini amaçlamaktadır. Ayrıca veri madenciliği analiz programı Rapid Miner ile 6890 öğrenciden oluşan Türkiye örneklemi kullanılarak fen bilimleri puanı bağımlı değişkeninin bağımsız değişkenler ile arasındaki ilişkiye K-nn, naive bayes ve random forest algoritmaları kullanılarak bakılmıştır. Veri analizi öncesinde fen puanı sonuçlarının normal dağılımı bozulmayacak şekilde kayıp veri temizliği yapılmış, analiz 6001 veri üzerinden gerçekleştirilmiştir. Anne-baba eğitim durumunun fen puanı başarısında anlamlı bir farka sahip olmadığı, fen öğrenmek için haftalık harcanan zaman ve okulda BİT kullanımının fen puanı başarısında pozitif bir etkiye sahip olduğu, algılanan BİT yeterliğinin ise fen puanı başarısı ile arasında negatif bir ilişki tespit edilmiştir. Seçilen bağımsız değişkenlerin öğrenci fen başarı durumunu tahmin oranı K-nn algoritmasında %77, naive bayes algoritmasında %55.06, random forest algoritmasında ise %62.22 olarak saptanmıştır This study is based on PISA 2018 science scores; it aims to evaluate the educational status of parents, the time spent for science learning, the use of ICT at school, and the perceived ICT proficiency variables, with data mining algorithms. Data mining analysis programs Rapid Miner with 6890 students of relations between Turkey sample science with variable K-nn, evaluating their naive Bayes and research methods with random forest algorithms and decision methods were evaluated. When the data analysis science score was tested normal, normal test results were given, the analysis was performed with 6001. There was a significant difference in the success of the science score of the parents' education status, the time spent to learn science and the ICT use score at school had a negative relationship with science achievement. The rate of predicting student science achievement of selected independent variables was 77% in K-nn algorithm, 55.06% in naive bayes algorithm and 62.22% in random forest algorithm