Eigenschaften

Suchmaschinen erschließen in aller Regel Texte,

entweder Texte an sich (Volltexte) oder
Metadaten von anderen Dateitypen.

Suchmaschinen bestehen aus

Crawler/Spider/Robot
Indexer
Repräsentation und
Searcher

Suchmaschinen erschließen

den Text des Dokuments
dem Dokument beigegebene Metadaten
aus dem Dokument extrahierte Metadaten
Metadaten aus der Webseite des Dokuments
Metadaten aus dem Web (z.B. Page Rank)
Nutzer-Suchverhalten (Personalisierung)!

In das Ranking fließt ein

textspezifische Faktoren
Popularität
Aktualität
Standort (Lokalisierung)
Personalisierung
technische Faktoren

Erkenntnisse über das Nutzerverhalten komme

via Toolbars
via eigene Browser (Chrome!)
via Personalisierungstools (Cookies, Google-Accounts etc.)
via Analysedienste

Spezialsuchmaschinen (z.T. spezialisierte Crawler) erschließen

besondere Arten von Inhalten und
besondere Typen von Inhalten

extrahiert aus Lewandowski 2015, ergänzt durch eigene Punkte.