Arama motorları kullanıcı oturumlarındaki konu değişikliklerinin tespit ve tahmin yöntemleri
Files
Date
2005
Authors
Çavdur, Fatih
Journal Title
Journal ISSN
Volume Title
Publisher
Uludağ Üniversitesi
Abstract
İnternet’in çok hızlı büyümesiyle birlikte, bu geniş veritabanında, İnternet kullanıcılarının aradıkları bilgilere ulaşım sorunu ortaya çıkmış ve bu sorunu ortadan kaldırmak amacıyla, arama motoru denilen sistemler geliştirilmiştir. İnternet kullanıcıları, bir oturum boyunca, arama motorlarını kullanarak, birden çok sayıda konuyla ilgili aramalar yapabilmektedirler. Bu durumda, bir oturum boyunca yapılan aramalar arasında, arama yapılan konuda bir veya daha fazla sayıda değişiklikler olmaktadır. İnsan yardımı olmaksızın, bu değişikliklerin tespit edilebilmesini sağlayan sistemlerin geliştirilmesi, kullanıcıların davranışlarını analiz etmek açısından önemli bir potansiyele sahiptir. Bu nedenle, bir oturumdaki konu değişikliklerinin belirlenmesi önemlidir. Bu çalışma, arama motorları kullanıcı oturumlarındaki konu değişikliklerinin tespit ve tahminiyle ilgilidir. Bu çalışmada, arama motorları kullanıcı oturumlarındaki konu değişikliklerinin belirlenmesi için temel olarak iki farklı yaklaşım uygulanmıştır: (i) Dempster-Shafer teorisi ve genetik algoritmalar yaklaşımı ve (ii) yapay sinir ağları yaklaşımı. Yaklaşımlar Excite ve Fast arama motorlarının veri kümelerinden alınan örnekler üzerinde uygulanmıştır. Uygulanan yaklaşımlar, örneklerdeki her kayıt için “konu değişikliği yok” ve “konu değişikliği var” şeklinde atamalar yapmaktadırlar. Bu atamaları yapmak için iki farklı veri kullanılmaktadır. Bunlar, ardışık iki arama arasındaki süreyi gösteren zaman aralığı (time interval – ti) ve ardışık iki aramada girilmiş olan sorgular arasındaki yapısal ilişkileri gösteren arama yapısı (search pattern – sp) verileridir. Yaklaşımlar tarafından yapılan atamalar, insanlar tarafından yapılan atamalarla karşılaştırılmış ve yaklaşımların performans ölçüleri hesaplanmış ve incelenmiştir.
With the rapid expansion of the Internet, for Internet users the problem of getting the necessary information in this large database, occurred and to solve this problem, systems called search engines were developed. Internet users can do searches about more than one topic by using search engines in a session. So, one or more topic changes can be occurred among the searches in the session. Developing systems which make possible to identify these changes without human help has an important potential for analyzing users’ behaviors. So, it is important to identify the topic changes in a session. This study is about identifying and predicting topic changes in search engines user sessions. In this study, basically, two different approaches are applied for identifying topic changes in search engines user sessions: (i) Dempster-Shafer theory and genetic algorithms approach and (ii) neural networks approach. The approaches are applied on the samples selected from Excite and Fast search engines’ datasets. Using these approaches “topic continuation” or “topic shift” assignments are made for each record in the sample. Two different parameters are used for making these assignments. These are time interval (ti) parameter which indicates the time between two consecutive searches and search pattern (sp) parameter which indicates structural relations between two consecutive searches. The assignments which are made by proposed approaches are compared with the assignments which are made by humans, and performance measures are calculated and analyzed.
With the rapid expansion of the Internet, for Internet users the problem of getting the necessary information in this large database, occurred and to solve this problem, systems called search engines were developed. Internet users can do searches about more than one topic by using search engines in a session. So, one or more topic changes can be occurred among the searches in the session. Developing systems which make possible to identify these changes without human help has an important potential for analyzing users’ behaviors. So, it is important to identify the topic changes in a session. This study is about identifying and predicting topic changes in search engines user sessions. In this study, basically, two different approaches are applied for identifying topic changes in search engines user sessions: (i) Dempster-Shafer theory and genetic algorithms approach and (ii) neural networks approach. The approaches are applied on the samples selected from Excite and Fast search engines’ datasets. Using these approaches “topic continuation” or “topic shift” assignments are made for each record in the sample. Two different parameters are used for making these assignments. These are time interval (ti) parameter which indicates the time between two consecutive searches and search pattern (sp) parameter which indicates structural relations between two consecutive searches. The assignments which are made by proposed approaches are compared with the assignments which are made by humans, and performance measures are calculated and analyzed.
Description
Keywords
Dempster-Shafer teorisi, Genetik algoritmalar, Yapay sinir ağları, Arama motorları, Kullanıcı davranışlarının incelenmesi, Konu değişikliklerinin belirlenmesi, Dempster-Shafer theory, Genetic algorithms, Neural networks, Search engines, User behavior analysis, Identifying topic changes
Citation
Çavdur, F. (2005). Arama motorları kullanıcı oturumlarındaki konu değişikliklerinin tespit ve tahmin yöntemleri. Yayınlanmamış yüksek lisans tezi. Uludağ Üniversitesi Fen Bilimleri Enstitüsü.