Kümeleme algoritmalarının CPU ve GPU performanslarının analizi

Thumbnail Image

Date

2022

Authors

Manav, Melek Güler

Journal Title

Journal ISSN

Volume Title

Publisher

Bursa Uludağ Üniversitesi

Abstract

Teknolojinin ilerlemesi, teknolojideki rekabeti her geçen gün artırmaktadır. Teknolojide ilerleme artarken müşterileri ve kullanıcıları memnun etmek güçleşmektedir. Çeşitli teknolojik aygıtlar sebebiyle üretilen veri miktarı artmakta bu da firmaların eldeki verileri analiz etmeleri için farklı metotlara yönelmelerine sebebiyet vermektedir. Günümüz dünyasında verilerin analiz edilmesi ve yorumlanması çok önemli olduğundan bu işlemi elle yapmak yerine makinelere yaptırma gereği ve ihtiyacı doğmuştur. Eldeki verilerin etiketlerinin bilinmediği durumlarda bunları analiz edebilmek adına kümeleme algoritmalarından yararlanılmaktadır. Kümeleme algoritmaları verileri gruplara ayırmaktadır ve bu sayede verilerin analiz edilmesi, yorumlanması kolay hale getirilmektedir. Bu tez çalışmasında, mevcutta kullanılan beş farklı kümeleme algoritmasının CPU ve GPU üzerindeki performansları araştırılmış ve bunları tespit etmeye yönelik deneysel çalışmalar gerçekleştirilmiştir. Kümeleme algoritmalarının performanslarını ölçebilmek adına yapılan deneysel çalışmalarda e-postalardan oluşan Enron veri kümesi kullanılmıştır. Çalışmada kümeleme algoritmaları olarak; model bazlı Cobweb, yoğunluk bazlı Dbscan, grid bazlı Clique, bölümlemeli K-Means, hiyerarşik olarak ise Birch algoritmaları seçilmiştir. Deneysel çalışmalar için gerekli ortam Python dilinde Google Colab üzerinde gerçekleştirilmiştir. Deneysel çalışma sonuçları grafikler ve tablolar ile ifade edilerek analiz sonuçları sunulmuştur.
The advancement of technology increases the competition in technology area day by day. As technology advances, it becomes more difficult to satisfy customers and users. The amount of data produced with the help of various technological devices is increasing, which causes companies to turn to different methods to analyze the data at hand. Since the analysis and interpretation of data is very important in today's world, the need and need to have this process done by machines has arisen instead of doing it manually. In cases where the labels of the available data are not known, clustering algorithms can be used to analyze them. With the help of clustering algorithms, the data can be grouped and made easier to analyze and interpret on this occasion. In this thesis, the performances of five different clustering algorithms currently used on CPU and GPU were investigated and experimental studies were carried out to detect them. In order to measure the performance of clustering algorithms, a dataset consisting of e-mails that name is Enron was used in experimental studies. As clustering algorithms in the study; model based Cobweb, density based Dbscan, grid based Clique, segmented K-Means, hierarchical Birch were selected. The necessary environment for the experimental studies was carried out on Google Colab in Python language. Experimental study results are expressed with graphs and tables, and analysis results are presented.

Description

Keywords

GPU, CPU, Makine öğrenmesi, Kümeleme algoritmaları, Machine learning, Classification algorithms

Citation

Manav, M. G. (2022). Kümeleme algoritmalarının CPU ve GPU performanslarının analizi. Yayınlanmamış yüksek lisans tezi. Bursa Uludağ Üniversitesi Fen Bilimleri Enstitüsü.

6

Views

92

Downloads

Search on Google Scholar