İnternet içerik madenciliğinde yapay sinir ağları ve bir uygulama

Thumbnail Image

Date

2006

Journal Title

Journal ISSN

Volume Title

Publisher

Uludağ Üniversitesi

Abstract

Web, her gün milyonlarca insanın bilgi almak için ulaştıkları çok popüler birkaynaktır ve sürekli değişime uğramaktadır. Arama motorları ve Web derleyicileri,aradıkları bilgiye Web üzerinden ulaşmak isteyen kullanıcılar için geliştirilmişaraçlardan bir kaçını oluşturmaktadır. Web derleyicileri tarafından yapılan, Web'dekidoğru ve ilgili bilginin bulunması görevi çok zor bir iştir. Bu çalışmada kuş gribi ilgilisiteleri bulmaya çalışan bir derleyici geliştirilmiştir. Derleyicinin konu ile ilgili siteleribaşarılı şekilde bulması sağlamak için yapay sinir ağları tekniği kullanılmaktadırÖzelleştirilmiş derleyici, Web üzerindeki ilgili sayfaları bulmak, indekslemek vedevamında güncellemek için tasarlanmıştır. Geliştirilen sistem ile diğer aramayaklaşımlarında saklı ilgili sayfaları bulmayı amaçlanmaktadır.Uygulanan Web derleyici, örneklerdeki her kayıt için ilgili ve ilgisiz şeklinde atamalar yapmaktadır. Derleyici tarafından yapılan atamalar, insanlartarafından yapılan atamalarla karşılaştırılmış ve derleyicinin performans ölçülerihesaplanmış ve incelenmiştir
The web is a very popular source for information. Millions of people access theWeb everyday to retrieve various types of information from the Web. Search engines,and Web crawlers are some of the search tools that Web users use to reach the requiredinformation on the Web. Mining for correct and relevant information in the World WideWeb is a difficult task, handled by Web crawlers. This study outlines the components ofa specialized crawler on the topic of Avian Influenza that heavily makes use of artificialneural networks to establish successful focused crawling on the topic of AvianInfluenza.Specialized crawling is designed to find, index and follow the updates of Webpages of interest, and proposes new approaches for reaching relevant pages, whichmight stay hidden to other crawling approaches.Using Web crawler interested or uninterested assignments are made for eachrecord in the sample. The assignments which are made by proposed crawler is comparedwith the assignments which are made by humans, and performance measures arecalculated and analyzed.

Description

Keywords

Veri madenciliği, Web madenciliği, Web içerik madenciliği, Yapay sinir ağları, Web derleyici, Özelleşmiş derleyici, Data mining, Web mining, Web content mning, Neural netwoks, Web crawler, Focused crawling

Citation

Aynekin, G. (2006). İnternet içerik madenciliğinde yapay sinir ağları ve bir uygulama. Yayınlanmamış yüksek lisans tezi. Uludağ Üniversitesi Fen Bilimleri Enstitüsü.