İnternet arama motoru kullanıcı verilerinin analizinde simülasyon ve olasılıksal yöntemlerin uygulanması

dc.contributor.advisorÖzmutlu, Seda
dc.contributor.authorBüyük, Buket
dc.contributor.departmentUludağ Üniversitesi/Fen Bilimleri Enstitüsü/Endüstri Mühendisliği Anabilim Dalı.tr_TR
dc.date.accessioned2020-01-02T07:19:12Z
dc.date.available2020-01-02T07:19:12Z
dc.date.issued2009
dc.description.abstractAkıllı bir arama motoru geliştirmenin en önemli adımlarından biri yeni konu tanımlanmasıdır. Yeni konu tanımlanması kullanıcının tek bir oturum sırasında bir konudan diğerine geçerken ki konu değişiminin belirlenmesidir. Bu çalışmada arama motoru kullanıcı oturumlarındaki konu değişikliklerini tespit ve tahmin etmek amaçlanmıştır. Bunun içinde Şartlı Olasılık Yaklaşımı ve Monte Carlo Simülasyonu olmak üzere iki farklı yaklaşım Excite ve FAST arama motorlarından alınan veri setlerinde kullanılmıştır. Bu yaklaşımlarda veri setindeki her bir sorgu için ‘konu değişikliği var’ ve ‘konu değişikliği yok’ diye atamalar yapılmaktadır. Atamaları yapmak içinse sorgunun zaman aralığı ve arama yapısı olmak üzere iki adet istatistiksel özelliği kullanılmaktadır. Yaklaşımlar tarafından yapılan atamalar uzman kişi tarafından yapılan atamalarla karşılaştırılmıştır. Daha sonra yaklaşımların performans ölçütleri hesaplanmış ve incelenmiştir. Şartlı Olasılık yaklaşımı ve Monte-Carlo Simülasyonu yeni konu tanımlaması için yeterli ve tutarlı sonuçlar sağlamıştır.tr_TR
dc.description.abstractOne of the main elements in developing a personalized intelligent search engine is new topic identification. New topic identification is discovering when the user has switched from one topic to another during a single search session. In this study, it is aimed to estimate and determine new topic identification. For this reason, two different approaches, Conditional Probabilitity and Monte Carlo Simulation are used in Excite and FAST search engine query logs. Due to application of mentioned methods for automatic new topic identification, each query is assigned as “topic shift” or as “topic continuation”. This assignment relies on the statistical characteristics of the queries, such as the time interval between consecutive queries and the search pattern of the consecutive queries. Results of human expert and methods are compared and performance measures are calculated. Conditional Probability Approach and Monte Carlo Simulation Method provided acceptable and adequate results.en_US
dc.format.extentVIII, 76 sayfatr_TR
dc.identifier.citationBüyük, B. (2009). İnternet arama motoru kullanıcı verilerinin analizinde simülasyon ve olasılıksal yöntemlerin uygulanması. Yayınlanmamış yüksek lisans tezi. Uludağ Üniversitesi Fen Bilimleri Enstitüsü.tr_TR
dc.identifier.urihttp://hdl.handle.net/11452/4874
dc.language.isotrtr_TR
dc.publisherUludağ Üniversitesitr_TR
dc.relation.publicationcategoryTeztr_TR
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectArama motoru kullanıcı davranışlarının incelenmesitr_TR
dc.subjectYeni konu tanımlanmasıtr_TR
dc.subjectŞartlı olasılıktr_TR
dc.subjectMonte carlo simülasyonutr_TR
dc.subjectInvestigating of search engine user behaviorsen_US
dc.subjectAutomatic new topic identificationen_US
dc.subjectConditional probabilityen_US
dc.subjectMonte carlo simulationen_US
dc.titleİnternet arama motoru kullanıcı verilerinin analizinde simülasyon ve olasılıksal yöntemlerin uygulanmasıtr_TR
dc.title.alternativeUsing of simulation and probabilistics methods in internet search engine user data log analysisen_US
dc.typemasterThesisen_US

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
246411.pdf
Size:
3.6 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: