Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Fast Webpage Classification Using URL Features

M. Kan, und H. Thi. Proceedings of the 14th ACM International Conference on Information and Knowledge Management, Seite 325--326. New York, NY, USA, ACM, (2005)
DOI: 10.1145/1099554.1099649

Zusammenfassung

We demonstrate the usefulness of the uniform resource locator (URL) alone in performing web page classification. This approach is faster than typical web page classification, as the pages do not have to be fetched and analyzed. Our approach segments the URL into meaningful chunks and adds component, sequential and orthographic features to model salient patterns. The resulting features are used in supervised maximum entropy modeling. We analyze our approach's effectiveness on two standardized domains. Our results show that in certain scenarios, URL-based methods approach the performance of current state-of-the-art full-text and link-based methods.

Beschreibung

Fast webpage classification using URL features

Links und Ressourcen

BibTeX-Schlüssel: Kan:2005:FWC:1099554.1099649
Eintragstyp: inproceedings
Adresse: New York, NY, USA
Buchtitel: Proceedings of the 14th ACM International Conference on Information and Knowledge Management
Jahr: 2005
Seiten: 325--326
Verlag: ACM
Reihe: CIKM '05
location: Bremen, Germany
acmid: 1099649
isbn: 1-59593-140-6
numpages: 2
DOI: 10.1145/1099554.1099649
URL: http://doi.acm.org/10.1145/1099554.1099649

@asmelashs Tags hervorgehoben

Zitieren Sie diese Publikation

Suchen auf

Metadaten

Zuletzt geändert vor 10 Jahren
Erstellt vor 10 Jahren

Kommentare und Rezensionen
(0)

Es gibt bisher keine Rezension oder Kommentar. Sie können eine schreiben!

BibSonomy

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Fast Webpage Classification Using URL Features

Zusammenfassung

Beschreibung

Links und Ressourcen

Tags

Community

Zitieren Sie diese Publikation

Mehr Zitationsstile

Suchen auf

Metadaten

Kommentare und Rezensionen
(0)

BibSonomy

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Fast Webpage Classification Using URL Features

Zusammenfassung

Beschreibung

Links und Ressourcen

Tags

Community

Zitieren Sie diese Publikation

Mehr Zitationsstile

Suchen auf

Metadaten

Kommentare und Rezensionen (0)

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Fast Webpage Classification Using URL Features

Kommentare und Rezensionen
(0)