Data clustering, as a cornerstone technique in machine learning and data mining, plays a pivotal role in partitioning unlabeled datasets into distinct clusters based on inherent similarities. This study proposes the Intuitionistic Fuzzy Any Relation Clustering Algorithm (IF-ARCA) algorithm, a novel hybrid method that integrates the intuitionistic fuzzy C-means (IFCM) algorithm with the Any Relation Clustering Algorithm (ARCA). The IF-ARCA algorithm employs intuitionistic fuzzy similarity matrices (IFSM) constructed using cosine similarity and fuzzy metrics, alongside dissimilarity and hesitation matrices, to enhance clustering precision. To address the inherent challenges of computational complexity and manual parameter tuning in traditional methods, the algorithm incorporates Differential Evolution (DE) optimization for automatic parameter adjustment, significantly improving performance in high-dimensional datasets. Experimental validation on UCI benchmark datasets demonstrates the superior efficacy of IF-ARCA in terms of clustering accuracy and scalability. The effectiveness of the proposed algorithm is rigorously evaluated using metrics such as F1 score, accuracy, precision, and recall, highlighting its potential for handling complex and ambiguous data.
Keywords: Intuitionistic fuzzy C-means, differential evolution, similarity matrices, data clusteringVeri kümeleme, makine öğrenimi ve veri madenciliğinin temel tekniklerinden biri olarak, etiketlenmemiş veri kümelerini içsel benzerliklerine göre farklı kümelere ayırmada kritik bir rol oynar. Bu çalışma, sezgisel bulanık C-means (IFCM) algoritması ile Any Relation Clustering Algorithm (ARCA) yönteminin entegrasyonunu içeren yeni bir melez yöntem olan Sezgisel Bulanık Herhangi-İlişki Kümeleme Algoritması’nı (IF-ARCA) önermektedir. IF-ARCA, kosinüs benzerliği ve bulanık ölçütlerle oluşturulan sezgisel bulanık benzerlik matrislerinin (IFSM) yanı sıra ayrışma ve tereddüt matrislerini kullanarak kümeleme hassasiyetini artırır. Geleneksel yöntemlerdeki yüksek hesaplama karmaşıklığı ve manuel parametre ayarlama zorluklarını gidermek amacıyla algoritma, parametreleri otomatik olarak ayarlayan Diferansiyel Evrim (DE) optimizasyonunu içerir; bu sayede yüksek boyutlu veri kümelerinde performansı önemli ölçüde iyileştirir. UCI benchmark veri kümeleri üzerindeki deneysel doğrulamalar, IF-ARCA’nın kümeleme doğruluğu ve ölçeklenebilirlik açısından üstün etkinliğini göstermektedir. Önerilen algoritmanın başarısı, F1 skoru, doğruluk, keskinlik (precision) ve geri çağırma (recall) gibi ölçütlerle titizlikle değerlendirilmiş olup, karmaşık ve belirsiz verileri işleme potansiyelini vurgulamaktadır.
Anahtar Kelimeler: Sezgisel bulanık C-ortalamalar, diferansiyel evrim, benzerlik matrisleri, veri kümeleme