Suchmaschinen erschließen in aller Regel Texte,
- entweder Texte an sich (Volltexte) oder
- Metadaten von anderen Dateitypen.
Suchmaschinen bestehen aus
- Crawler/Spider/Robot
- Indexer
- Repräsentation und
- Searcher
Suchmaschinen erschließen
- den Text des Dokuments
- dem Dokument beigegebene Metadaten
- aus dem Dokument extrahierte Metadaten
- Metadaten aus der Webseite des Dokuments
- Metadaten aus dem Web (z.B. Page Rank)
- Nutzer-Suchverhalten (Personalisierung)!
In das Ranking fließt ein
- textspezifische Faktoren
- Popularität
- Aktualität
- Standort (Lokalisierung)
- Personalisierung
- technische Faktoren
Erkenntnisse über das Nutzerverhalten komme
- via Toolbars
- via eigene Browser (Chrome!)
- via Personalisierungstools (Cookies, Google-Accounts etc.)
- via Analysedienste
Spezialsuchmaschinen (z.T. spezialisierte Crawler) erschließen
- besondere Arten von Inhalten und
- besondere Typen von Inhalten
extrahiert aus Lewandowski 2015, ergänzt durch eigene Punkte.