Web Cyberfahnder
über Suchmaschinen und -strategien
  Cybercrime    Ermittlungen    TK & Internet    Literatur    intern    Impressum 
Dezember 2008
29.12.2008 Suchmaschinen
zurück zum Verweis zur nächsten Überschrift Datenspionage mit Google
 

[Suchwort] filetype:[pdf] 

 
Suchmaschinen sind ein Segen wenn es darum, Informationen aus unzugänglichen und verstreuten Quellen im Internet zu verschaffen. Dabei stellt sich nicht nur die Frage nach der richtigen Suchstrategie, sondern auch nach der Quellenqualität wegen der gefundenen Informationen.

Die Kehrseite der einfachen Informationsbeschaffung aus dem Internet besteht in zwei Punkten:

Einmal im Internet veröffentlichte Daten können beliebig kopiert und verbreitet werden. Sie entziehen sich damit der Kontrolle des Urhebers.
 
Suchmaschinen durchforsten automatisch alle ihnen zugänglichen und ergiebig erscheinenden Bereiche des Internets. Sie finden auch die veröffentlichten Daten, die der Urheber gar nicht frei zugänglich machen will.

Gegen die Neugier von Suchmaschinen helfen zugangsgeschützte Dateiverzeichnisse und dynamische Content Management-Systeme. Der Tag "norobots" im Header einer Webseite hat hingegen keine sperrende Wirkung, sondern ist eher ein "höflicher Verhaltensvorschlag" (1). Richtig sichern kann man Dateien nur mit einer starken Verschlüsselung.
 

 
Neben der Kombination und dem Ausschluss von Suchworten, der Stringsuche und Experteneinstellungen bietet Google zum Beispiel auch die Vorgabe eines bestimmten Dokumententyps an. Dazu bietet Google die Kombination eines Suchwortes mit dem Kommando "filetype:" an. So lassen sich zum Beispiel gezielt PDF- (pdf), MS-Word- (doc), Excel-Dokumente (xls) oder Präsentationen (ppt, pps, ppsx) herausfiltern (2).

Auf die Möglichkeiten des Missbrauchs dieses Kommandos weist unter Hinweis auf synergetic hin (3). Die Eingaben "Lebenslauf" und "filetype:pdf" würden mehr als 640.000 Treffer mit überwiegend unbedarft im Internet präsentierten Lebensläufen zu Tage fördern. Besonders ergiebig für Datensammler sei auch die Verbindung von "Mail" mit dem Dokumentenformat von Excel, weil viele private und Vereins-Webseiten Listen ihrer Mitglieder auf diese Weise zugänglich machen.

Ganz unbedarfte Mitmenschen würden sogar als "geheim" oder "vertraulich" gekennzeichnete Dokumente unverschlüsselt ins Internet stellen. Mit den richtigen Suchworten sind sie leicht zu finden.

Fazit:

Die meisten Datenpannen werden von Menschen ausgelöst, die unüberlegt handeln. Das Internet ist ein offener Marktplatz für Informationen, der nicht für vertrauliche oder nachteilige Informationen geeignet ist.
  

zurück zum Verweis Anmerkungen
 


(1) "... an den mündigen Bürger", so wie es den Verkehrsregeln in südeuropäischen Staaten nachgesagt wird.

(2) Liste der Dateinamenserweiterungen

(3) Daten legal hacken dank Google, tecchannel 24.12.2008
 

 

zurück zum Verweis Cyberfahnder
© Dieter Kochheim, 29.07.2009