Educational Data Mining (EDM) is an important tool in the field of classification of educational data that helps researchers and education planners analyse and model available educational data for specific needs such as developing educational strategies. Trends International Mathematics and Science Study (TIMSS) which is a notable study in educational area was used in this research. EDM methodology was applied to the results of TIMSS 2015 that presents data culled from eighth grade students from Turkey. The main purposes are to find the algorithms that are most appropriate for classifying the successes of students, especially in science subjects, and ascertaining the factors that lead to this success. It was found that logistic regression and support vector machines – poly kernel are the most suitable algorithms. A diverse set of features obtained by feature selection methods are “Computer Tablet Shared”, “Extra Lessons Last 12 Month”, “Extra Lessons How Many Month”, “How Far in Education Do You Expect to Go”, “Home Educational Resources”, and “Student Confident in Science” and these features are the most effective features in science success.
Keywords: classification algorithms, educational data mining, eighth grade, science success, TIMSS 2015.
ÖzCovid-19 virüsü hayatımıza girdiği Aralık 2019'dan bu yana etkinliğini kaybetmeden tüm dünyayı etkilemeye devam etmektedir. Dünya sağlık örgütünün önerileri, ülkelerin kendi bünyelerinde aldıkları tedbirler ve aşı çalışmaları virüsün üstesinden gelmek için büyük önem arz etmektedir. Bu bağlamda birçok bilimsel çalışma virüsün geleceği için değerli bilgiler ortaya koymuştur. Çalışmada Türkiye Covid-19 günlük hasta sayısındaki değişimin sınıflandırılmasına yönelik tahminler destek vektör makinesi ve k-en yakın komşu algoritmaları ile yapılmıştır. Günlük hasta sayısının sınıflandırılmasının tahmininde etkin rol oynayan öznitelikler 'pozitif çıkma oranı', 'filyasyon oranı', 'işyerleri hareketliliği' ve 'parklardaki hareketlilik' olarak belirlenmiştir. Bu etkin öznitelikler yardımıyla yapılan günlük hasta sayısının sınıflandırılması tahmininde de k-en yakın komşu algoritmasının (%84.7) en başarılı algoritma olduğu gözlemlenmiştir.
Günlük hasta sayısı, Google topluluk hareket raporları, Negatif binom regresyon analizi. Özet: Dünyayı etkisi altına alan yeni tip koronavirüs (Covid-19) salgınından dolayı sosyal mesafe ve hareketliliğin azaltılması en önemli tedbirler olarak uygulanmaktadır. Dünya genelinde daha az hareketliliğin daha düşük Covid-19 vaka ve hasta sayıları ile ilişkili olduğunu göstermektedir. Özellikle ülkemizde Covid-19 vaka ve hasta sayılarında; kısmen ya da tam kapanmalar ile düşüş, kademeli ya da tam normalleşme adımları ile de artış gözlemlenmiştir. Bu çalışmada, Türkiye Covid-19 günlük hasta sayısı ile Türkiye Google topluluk hareket raporları arasındaki ilişkinin ortaya konulması amaçlanmıştır. Betimleyici ve ilişki arayıcı türde gerçekleştirilmiş olan araştırma da Türkiye'de ilk Covid-19 hastasının görüldüğü 11 Mart 2020 ile 11 Mart 2021 tarihleri arasındaki bir yıllık verilerden yararlanılmıştır. Araştırmadan elde edilen verilerin değerlendirilmesinde, betimsel istatistikler ve negatif binom regresyon analizi kullanılmıştır. Analiz sonuçlarına göre insan hareketliliğin artması hasta sayısının artmasına neden olduğu gibi konutlardaki hareketliliğinde yine hasta sayısına pozitif etki yaptığı bulunmuştur.
ÖzBorsa İstanbul 100 (BIST-100) endeksi, diğer büyük dünya endeksleri ile birlikte finans piyasalarının küreselleşme değişiminin bir parçası olmuştur. Endeksler arasındaki ilişkinin analizi yatırımcılara büyük avantajlar sağlayacaktır. Bu durumdan yola çıkarak çeşitli makine öğrenmesi algoritmaları ile büyük dünya endeksleri ve bazı makroekonomik göstergeler kullanılarak BIST-100 endeksinin değişim yönünün (artış-azalış) sınıflandırılması amaçlanmıştır. Bu amaç doğrultusunda BIST-100 endeksinin değişim yönünün sınıflandırmasında etkin rol oynayan değişkenler belirlenmiş ve belirlenen bu değişkenler yardımıyla sınıflandırma başarılarında değişim olup olmadığı incelenmiştir. Tüm değişkenler ile yapılan sınıflandırmada lojistik regresyonun %70,6; öznitelik seçimi ile yapılan sınıflandırmada da Destek Vektör Makinesi PUK çekirdeği algoritmasının %71,9 daha doğru sınıflandırma başarısı gösterdiği belirlenmiştir. Böylelikle daha az sayıda değişken ile daha yüksek sınıflandırma başarısı elde edilmiştir.
COVID-19 pandemisi ortaya çıktığından beri, enfekte olmuş bireylerin sayısını ve COVID-19 salgınının ölüm oranını tahmin etmek için dünya çapında birçok epidemiyolojik model geliştirilmiştir. CoVID-19 üzerinde makine öğrenimi teknikleri kullanılarak geliştirilmiş birkaç model bulunmaktadır. Ancak öznitelik seçimini ayrıntılı olarak ele alan çalışmalar oldukça sınırlıdır. Bu nedenle, bu çalışmanın amacı (i) çeşitli özelliklerin bağımsız ve etkileşimli etkilerini araştırmak ve (ii) COVID-19 salgınının ölüm oranını sınıflandırmak için önemli olan algoritmaları bulmaktır. Lojistik regresyon ve karar ağacının (C4.5, Random Forests ve REPTree) en uygun algoritmalar olduğu bulunmuştur. Öznitelik seçme yöntemleriyle elde edilen çeşitli öznitelikler, binde yeni test sayısı, milyonda yeni vaka, milyonda hastane hasta sayısı ve milyonda haftalık hastane kabulüdür. Bu çalışmanın önemi, birkaç özellik ile yüksek oranda sınıflandırma elde edilmiş olmasıdır. Bu çalışma, sınıflandırmada sadece en ilgili özelliklerin dikkate alınması gerektiğini ve sınıflandırmada tüm değişkenlerin kullanılmasının gerekli olmadığını göstermiştir.
Amaç: Bu çalışmanın amacı, elde edilen verileri farklı makine öğrenmesi algoritmaları yardımıyla
sınıflandırmaktır.
Gereç ve Yöntemler: Psikiyatri polikliniğine gelen anksiyete, depresyon ve stres şikâyetlerinden dolayı
psikolojik tedavi almak isteyen 195 hastaya mutluluk, yaşam doyumu ve umutsuzluk ölçekleri ve kişisel
bilgi formu uygulanmıştır. Bu sınıflandırmada bağımlı değişken olarak mutluluk seçilmiş ve bu değişkeni
etkileyen faktörler eğitim, test ve çapraz doğrulama gibi farklı yöntemlerle belirlenmiştir.
Bulgular: k=10 değeri için karar ağacı algoritmaları arasında en başarılı sınıflandırma sonucunu KARF
(0,9180) vermiştir. Bu sonucu RMSE (0,2810), ROC alanı (0,9760) ve MCC (0,8400) kriterleri
desteklemektedir. Ayrıca çalışmaya katılan bireylerin mutlu ya da mutsuz olma düzeylerini en çok
etkileyen değişkenler sırasıyla yaşam doyumu, yaş ve sıkıntılarla baş etme becerisi olarak bulunmuştur.
Sonuç: Sonuç olarak, elde edilen bulgular doğrultusunda insanların yaşam alanlarının başta anksiyete,
depresyon ve strese bağlı rahatsızlıklarının tedavisinde özellikle yaşam alanlarının olumlu etkilerinin
yanı sıra çevresel ve sosyal faktörlerin etkilerinin de bulunduğu tespit edilmiştir.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.