Veri madenciliği; istatistik, veri tabam teknolojisi, makine öğrenimi, örüntii tanıma, yapay zeka ve görselleştirmenin rol oynadığı disiplinler arası bir yaklaşımdır. Modelleme, veri madenciliğinin çok önemli bir aşamasıdır. Modelleme tekniklerinden biri de birliktelik kurallarıdır. Birliktelik kuralları, bir koşul kümesi ile kısmi bir sonuca ulaşma ile ilgilidir. Sürecin sonunda en iyi kuralların bir tablosu oluşmaktadır. Algoritmalar, kuralların bulunması için bir türetim ve test yöntemi kullanmaktadırlar. Birliktelik kural algoritmaları, görselleştirme teknikleri yolu ile ortaya çıkarılan birlikteliklerin, otomatik olarak bulunmasını sağlarlar. Apriori algoritması, birliktelik kuralları türetmek için kullanılan temel algoritmalardan biridir. Bu çalışmada DİE 2002 III. dönem hanehalkı işgücü anketi sonuçlan kullanılmıştır.Bu verilere Apriori algoritması uygulanmasıyla elde edilen sonuçlar açıklanmaya çalışılmıştır.
Yapay zekâ
bilgisayarların insanların düşünce sistemlerini taklit ederek karmaşık
problemlere çözüm üretebilme yeteneklerine verilen addır. Makine öğrenmesi ise
yapay zekânın önemli bir alt dalıdır. Makine öğrenmesi, çeşitli görevlerin
öğrenilmesi, mantıksal ve ikili çıkarımlar yoluyla otomatik hesaplama
yöntemlerini kapsayan bir süreç olarak ele alınabilir. R yazılımı pek çok
istatistiksel hesaplamanın yanı sıra makine öğrenmesi algoritmasında ki
başarısıyla da ön plana çıkmaktadır. Bu çalışmada R yazılımının sınıflandırma
amacıyla kullandığı çeşitli makine öğrenmesi algoritmalarının performansları
karşılaştırılmıştır. Bu amaçla, UCI Makine Öğrenme Havuzundan, elde edilen
gerçek verilere çeşitli makine öğrenme algoritmaları uygulanmış ve
sınıflandırma algoritmaları birkaç kriter kullanılarak karşılaştırılmıştır.
Hesaplanan kriterlerden olan; kesinlik, doğruluk, duyarlılık ve F ölçütü
hareketle, sınıflandırma tekniklerinin kıyaslanması yapılmıştır. Yapılan
karşılaştırmalar sonucunda, üç kriterde en iyi sınıflandırmayı yapan Lojistik
Regrasyon algoritmasının diğer algoritmalara göre daha başarılı olduğu görülmüştür.
Tüm ölçütlerden en iyi ikinci performansı gösteren algoritma Navie Bayes
algoritması olmuştur.
Bu çalışmada, suçluların farklı değişkenlere bağlı olarak betimlenmesi amaçlanmaktadır. Amaç doğrultusunda, Uludağ Üniversitesi Bilimsel Araştırma projeleri kapsamında, Bursa Emniyet Müdürlüğünden suçlu veri tabanından yararlanılmıştır. İlgili veri tabanı içerisinden, ağır suç işleyen bireylerin profilleri oluşturulmaya çalışılmıştır. Ağır suç işleyen bireylere ilişkin yapılan betimlemede, bu bireylere ilişkin bir takım değişkenlerden hareketle, CHAID algoritması sonucunda elde edilen karar ağacından yararlanılmıştır. CHAID (Chi-squared Automatic Interaction Detector; Ki-kare Otomatik Etkileşim Dedektörii), optimal bölünmelerin teşhisi için ki-kare istatistiğini kullanan bir yöntemdir. CHAID, böliimlendirme amaçlı kullanılan etkili bir istatistiksel tekniktir. Yapılan bir ön analiz sonucunda, bireyin ağır suç işlemsinde en fazla etkili olan bağımsız değişkenlerin sırasıyla; olay saati, doğum yeri, meslek, sabıka durumu ve yaş değişkenleri olduğu anlaşılmıştır.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.