Topaloğlu, Üyesi FatihAkdağ, Emre2025-10-232025-10-232025https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=P3dtmmHrq-mzEcmCLi1CqZS0Jslr2JgYlawuo-JX0vsfiVZXL_V8AqAgIfRO9BNKhttps://hdl.handle.net/20.500.12899/1332Lisansüstü Eğitim Enstitüsü, Enformatik Ana Bilim DalıZararlı yazılımlar, bilgisayar sistemlerine zarar vermek, veri çalmak veya sistemleri kullanılamaz hale getirmek amacıyla tasarlanmış yazılımlardır. Günümüzde zararlı yazılımların tespiti ve önlenmesi, siber güvenlik alanında büyük bir önem taşımaktadır. Bu tez çalışmasında, makine öğrenmesi tabanlı algoritmalar ile zararlı yazılımların tespiti ve analizi gerçekleştirilmiştir. Tez çalışmasında, orijinal KDD99 veri setinin %10'luk bir alt kümesi olan KDD-cup-99 veri seti kullanıldı. Veri kümesi 42 özellik ve 494.020 kayıt içerir. Hedef özellik, normal ve anormal bağlantı türleri olarak sınıflandırılabilen bağlantı türünü belirtir. Ancak anormal bağlantılar ayrıca Probe, Hizmet Reddi (DOS), R2L (Kök 2 Yerel) ve U2R (Kullanıcı 2 Kök) olmak üzere dört tür siber saldırıya ayrılabilir. Saldırı tespitinde lojistik regresyon algoritması, ensemble algoritması, yapay sinir ağları, destek vektör makineleri ve k-en yakın komşu algoritmaları olmak üzere beş farklı makine öğrenme algoritması çalıştırılmış ve sonuçları karşılaştırılmıştır. Yapay Sinir Ağları (ANN) modeli % 97,61 doğruluk oranı ile en iyi performansı sergilemiştir. Elde edilen sonuçlar, makine öğrenmesi yöntemlerinin zararlı yazılım tespitinde yüksek doğruluk oranlarına sahip olduğunu göstermektedir. Bu bulgular, siber güvenlik alanında daha etkili tespit ve önleme stratejilerinin geliştirilmesine katkı sağlayacaktır. ANAHTAR KELİMELER: Makine Öğrenmesi, Zararlı Yazılımlar, SınıflandırmaMalware is software designed to damage computer systems, steal data or render systems unusable. Today, detecting and preventing malware is of great importance in the field of cyber security. In this thesis study, malware detection and analysis was carried out with machine learning-based algorithms. In the thesis study, the KDD-cup-99 dataset, which is a 10% subset of the original KDD99 dataset, was used. The dataset contains 42 features and 494,020 records. The target feature specifies the connection type, which can be classified into normal and abnormal connection types. But abnormal connections can also be divided into four types of cyberattacks namely Probe, Denial of Service (DOS), R2L (Root 2 Local) and U2R (User 2 Root). Five different machine learning algorithms, including logistic regression algorithm, ensemble algorithm, artificial neural networks, support vector machines and k-nearest neighbor algorithms, were run in attack detection and their results were compared. Artificial Neural Networks (ANN) model showed the best performance with an accuracy rate of 97.61%. The results obtained show that machine learning methods have high accuracy rates in malware detection. These findings will contribute to the development of more effective detection and prevention strategies in the field of cybersecurity. KEYWORDS: Machine Learning, Malware, Classificationtrinfo:eu-repo/semantics/openAccessBilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolComputer Engineering and Computer Science and ControlMakine öğrenmesi yöntemleri kullanılarak zararlı yazılımların tespitiDetection of malware using machine learning methodsYüksek Lisans163924114