Makine öğrenmesi yöntemleri kullanılarak zararlı yazılımların tespiti

Küçük Resim Yok

Tarih

2025

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Malatya Turgut Özal Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Zararlı yazılımlar, bilgisayar sistemlerine zarar vermek, veri çalmak veya sistemleri kullanılamaz hale getirmek amacıyla tasarlanmış yazılımlardır. Günümüzde zararlı yazılımların tespiti ve önlenmesi, siber güvenlik alanında büyük bir önem taşımaktadır. Bu tez çalışmasında, makine öğrenmesi tabanlı algoritmalar ile zararlı yazılımların tespiti ve analizi gerçekleştirilmiştir. Tez çalışmasında, orijinal KDD99 veri setinin %10'luk bir alt kümesi olan KDD-cup-99 veri seti kullanıldı. Veri kümesi 42 özellik ve 494.020 kayıt içerir. Hedef özellik, normal ve anormal bağlantı türleri olarak sınıflandırılabilen bağlantı türünü belirtir. Ancak anormal bağlantılar ayrıca Probe, Hizmet Reddi (DOS), R2L (Kök 2 Yerel) ve U2R (Kullanıcı 2 Kök) olmak üzere dört tür siber saldırıya ayrılabilir. Saldırı tespitinde lojistik regresyon algoritması, ensemble algoritması, yapay sinir ağları, destek vektör makineleri ve k-en yakın komşu algoritmaları olmak üzere beş farklı makine öğrenme algoritması çalıştırılmış ve sonuçları karşılaştırılmıştır. Yapay Sinir Ağları (ANN) modeli % 97,61 doğruluk oranı ile en iyi performansı sergilemiştir. Elde edilen sonuçlar, makine öğrenmesi yöntemlerinin zararlı yazılım tespitinde yüksek doğruluk oranlarına sahip olduğunu göstermektedir. Bu bulgular, siber güvenlik alanında daha etkili tespit ve önleme stratejilerinin geliştirilmesine katkı sağlayacaktır. ANAHTAR KELİMELER: Makine Öğrenmesi, Zararlı Yazılımlar, Sınıflandırma
Malware is software designed to damage computer systems, steal data or render systems unusable. Today, detecting and preventing malware is of great importance in the field of cyber security. In this thesis study, malware detection and analysis was carried out with machine learning-based algorithms. In the thesis study, the KDD-cup-99 dataset, which is a 10% subset of the original KDD99 dataset, was used. The dataset contains 42 features and 494,020 records. The target feature specifies the connection type, which can be classified into normal and abnormal connection types. But abnormal connections can also be divided into four types of cyberattacks namely Probe, Denial of Service (DOS), R2L (Root 2 Local) and U2R (User 2 Root). Five different machine learning algorithms, including logistic regression algorithm, ensemble algorithm, artificial neural networks, support vector machines and k-nearest neighbor algorithms, were run in attack detection and their results were compared. Artificial Neural Networks (ANN) model showed the best performance with an accuracy rate of 97.61%. The results obtained show that machine learning methods have high accuracy rates in malware detection. These findings will contribute to the development of more effective detection and prevention strategies in the field of cybersecurity. KEYWORDS: Machine Learning, Malware, Classification

Açıklama

Lisansüstü Eğitim Enstitüsü, Enformatik Ana Bilim Dalı

Anahtar Kelimeler

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye