CatSumm: Spektral Çizge Bölmeleme ve Düğüm Merkeziliklerine Dayalı Çıkarıcı Metin Özetleme
Künye
UÇKAN, T., Cengiz, H. A. R. K., & KARCİ, A. CatSumm: Spektral Çizge Bölmeleme ve Düğüm Merkeziliklerine Dayalı Çıkarıcı Metin Özetleme. Bitlis Eren Üniversitesi Fen Bilimleri Dergisi, 10(4), 1349-1365.Özet
In this paper, we introduce CatSumm (Cengiz, Ali, Taner Summarization), a novel method for multi-document
document summarisation. The suggested method forms a summarization according to three main steps:
Representation of input texts, the main stages of the CatSumm model, and sentence scoring. A Text Processing
software, is introduced and used to protect the semantic loyalty between word groups at stage of representation of
input texts. Spectral Sentence Clustering (SSC), one of the main stages of the CatSumm model, is the
summarization process obtained from the proportional values of the sub graphs obtained after spectral graph
segmentation. Obtaining super edges is another of the main stages of the method, with the assumption that
sentences with weak values below a threshold value calculated by the standard deviation (SD) cannot be included
in the summary. Using the different node centrality methods of the CatSumm approach, it forms the sentence rating
phase of the recommended summarising approach, determining the significant nodes and hence significant nodes.
Finally, the result of the CatSumm method for the purpose of text summarisation within the in the research was
measured ROUGE metrics on the Document Understanding Conference (DUC-2004, DUC-2002) datasets. The
presented model produced 44.073%, 53.657%, and 56.513% summary success scores for abstracts of 100, 200 and
400 words, respectively Bu çalışmada, çok belgeli metin özetleme için yeni bir yöntemi CatSumm (Cengiz, Ali, Taner Özetleme)
tanıtılmaktadır. Önerilen yöntem, üç ana adıma göre bir özet oluşturmaktadır: Giriş metinlerinin temsili, CatSumm
modelinin ana aşamaları ve cümle puanlama. Girilen metinlerin gösterimi aşamasında kelime grupları arasındaki
anlamsal bağlılığı korumak için bir Metin İşleme yazılımı tanıtılmış ve kullanılmıştır. CatSumm modelinin ana
aşamalarından biri olan Spektral Cümle Kümeleme (SCK), spektral çizge bölmeleme sonrasında elde edilen alt
çizgelerin oransal değerlerinden elde edilen özetleme işlemidir. Standart sapma ile hesaplanan bir eşik değerinin
altında kalan cümlelerin özete dahil edilemeyeceği varsayımıyla, yöntemin ana aşamalarından bir diğeri de süper
kenarların elde edilmesidir. Son olarak, araştırma kapsamında metin özetleme amacıyla CatSumm yönteminin
sonucu, Belge Anlama Konferansı (DUC-2004, DUC-2002) veri setleri üzerinde ROUGE metrikleri ile
ölçülmüştür. Sunulan model 100, 200 ve 400 kelimelik özetler için sırasıyla %44.073, %53.657, %56.513 özet
başarı puanı üretmektedir.
Cilt
10Sayı
4Bağlantı
https://dergipark.org.tr/tr/pub/bitlisfen/issue/67737/949052https://hdl.handle.net/20.500.12899/1121