Cybercrime | Ermittlungen | TK & Internet | Literatur | intern | Impressum |
Internet - Suchmaschinen und -techniken | 29.12.2008 | |||||
Suchmaschinen und -techniken | ||||||
Wikipedia |
|
Die Eingabefelder links außen lassen direkte Abfragen bei der Suchmaschine und in dem Online-Lexikon zu. Darüber hinaus finden Sie hier ein paar Hintergründe und Tipps zum Umgang mit Suchmaschinen und für eine erfolgreiche Suche im Internet.
11.10.2009: Eine übersichtliche Zusammenstellung hilfreicher Werkzeuge
finden Sie bei den
Auskunftsdiensten im Internet. |
||||
Suchmaschinen | ||||||
|
Surfen: Als Internetsurfen wird das Aufsuchen verschiedener Webseiten anhand der Links bezeichnet, von denen auf die folgenden verwiesen wird. Jedes Kind muss einen Namen haben: Die einfache Eingabe einer Zieladresse im Webbrowser wird gelegentlich als "Type In-Surfen" beschrieben. Das kann in vielen Fällen äußerst erfolgreich sein, weil sich die meisten Unternehmen, Verwaltungen und andere in der Öffentlichkeit bekannten Einrichtungen mit ihren Namen oder Namensabkürzungen beschreibende Adressen unter den bekannten Top Level-Domänen gesichert haben ( Domain Name System - DNS, Top Level Domain - TLD). |
Die gebräuchlichsten von ihnen durchsuchen regelmäßig mit automatischen Routinen (Roboter, Crawler) das Internet und speichern die gefundenen Inhalte in ihren Datenbanken. Ihr Erfolg hängt davon ab, wie gut sie das gefundene Material aufbereiten und wie schnell sie ihre Suchergebnisse an den Anwender melden können. In den Hintergrund getreten sind redaktionell betreute Suchmaschinen,
die dem Anwender nach ihrer Qualitätskontrolle nur überprüfte Webseiten
anbieten.
Yahoo.de (siehe auch
Yahoo.com) zeigt, wie eine Suchmaschine um redaktionell aufbereitete
Angebote ergänzt werden kann. Das Problem dabei ist, dass die Verweise
häufig sehr allgemein gehalten sind und sich an das breite Publikum
richten. |
||||
Metasuchmaschinen | Google, der Datenkrake | |||||
|
Diese Lücke füllen die Metasuchmaschinen, die über keine eigenen Datenbestände verfügen, sondern mit den Suchworten des Anwenders mehrere andere Suchmaschinen abfragen und deren Ergebnisse für den Anwender zusammen stellen. Metager vom Regionalen Rechenzentrum der Uni Hannover soll es damit schaffen, fast 100 % des deutschsprachigen Internetangebots zur Verfügung zu stellen. In den Neunziger Jahren war die Suchmaschine
alltheweb.com von der norwegischen Firma FAST ein Geheimtipp, weil
sie seinerzeit über einen der größten Datenbestände verfügte. Sie wurde
2003 - zusammen mit anderen Internetdiensten von Yahoo übernommen
. |
Googles Popularität beruht auf seiner Treffsicherheit, Aktualität und Schnelligkeit. Das Unternehmen erreicht diese Qualitäten ausschließlich mit technischen Mitteln, indem es ständig die Verarbeitungsprozesse optimiert und erweitert. Darüber hinaus bietet es immer wieder neue und kostenlose Dienste an, die seine Bekanntheit und Beliebtheit ungebremst steigern . Über den Datenschutz schweigt sich Google grundsätzlich aus. Allein
aufgrund der Suchabfragen, die die Suchmaschine durchlaufen, lassen sich
detaillierte Personenprofile erstellen. Dies gilt mehr noch für die
Anwender, die den Onlinedienst zur Verwaltung ihrer persönlichen Daten
(Kalender, Dateien usw.) verwenden. Die (führende) Computerzeitschrift
c't hat deshalb Google auch - liebevoll und böswillig zugleich - als den
Datenkraken bezeichnet
. |
||||
Suchstrategie | Begriffe ausschließen | |||||
Wenn Sie bei einem Wettbewerb nach den meisten
Treffern als Spielverderber auftreten wollen, dann rufen Sie die
Expertensuche bei Google auf und und führen mit den oben genannten
Worten eine Oder-Suche aus. Sie werden wahrscheinlich unschlagbar sein. |
Überlegen Sie deshalb einen Moment, welche Wörter in den gesuchten Dokumenten zu erwarten sind, und scheuen Sie sich nicht davor, mehrere in das Suchfeld einzugeben. Die Groß- und Kleinschreibung spielt dabei grundsätzlich keine Rolle. Die besonderen Funktionen, über die Google verfügt, werden hier
erklärt. |
Wenn Sie also nach einem nordafrikanischen Nomadenvolk suchen, aber nichts über die Wolfsburger Autoproduktion wissen wollen, könnte Ihre Suchabfrage so aussehen:
|
||||
String-Suche | Definitionen bei Google | |||||
|
Über die Popularität des Landgerichts Hamburg im Internet werden Sie überrascht sein, wenn Sie zwei Strings miteinander verbinden:
|
In dem Eingabefeld links außen ist der Definiere-Befehl vorbelegt. Eine Alternative dazu funktioniert häufig auch bei anderen Suchmaschinen, die die String-Suche zulassen:
|
||||
Dokumententyp | ||||||
So lassen sich zum Beispiel gezielt PDF- (pdf), MS-Word- (doc),
Excel-Dokumente (xls) oder Präsentationen (ppt, pps, ppsx)
herausfiltern. |
siehe auch:
Daten
legal hacken dank Google, tecchannel 24.12.2008 |
|||||
Experten-Suche, Zielauswahl | IP- und DNS-Adressen | |||||
Suche bei heise security mit dem heisec-Bookmarklet. Suche im Heise-Glossar Suchbegriff hinter der Voreintragung einfügen und auf den Button klicken. |
Aus meiner Sicht besonders hilfreich ist die Möglichkeit, bestimmte Domänen gezielt zu durchsuchen. Das ist nicht nur interessant im Zusammenhang mit der Frage, ob sich eine Webseite mit einem bestimmten Thema beschäftigt, sondern auch besonders dann, wenn die Inhalte einer Webseite bekanntermaßen nicht zusammenfassend dokumentiert sind. Das gilt zum Beispiel für das Glossar bei
Heise online. Es wird nicht offen präsentiert, sondern versteckt
hinter kryptischen Dateinamen in dem Unterverzeichnis "glossar". In dem
Eingabefeld links werden die einschränkenden Filter benutzt, die die
erweiterte Suche von Google für solche Fälle bereit hält. |
Die Inhaber von IP- und DNS-Adressen können verhältnismäßig einfach mit den Werkzeugen von Heise Netze und von DNSstuff.com nachverfolgt werden, wobei auch Spam-Datenbanken abgefragt werden können. DNSstuff bietet dazu auch noch weitere Routinen, die gesondert vorgestellt werden. Netzwerk-Werkzeuge bei Heise Netze:
Netzwerk-Tools bei heise Netze |
||||
Zeitzonen | ||||||
Großansicht bei Wikipedia Zeitzonen |
Die UTC wird entweder minuten- oder sekundengenau angegeben. Ihre häufigste Form ist: hh:mm:ss. Die Zeitzonen sind zu ihren Nachbarzonen in aller Regel um 1 Stunde von der UTC versetzt. Die für Deutschland geltende
Mitteleuropäische Zeit
- MEZ ist eine Zeitzone
östlich der UTC. Dort wird sie gekennzeichnet durch einen Zusatz mit
Plus-Zeichen: hh:mm:ss +1 (häufig auch hh:mm:ss +0100). |
Während der Sommerzeit beginnt der Tag eine weitere Stunde eher. In der UTC bedeutet das: Eine genaue Darstellung der Nationalstaaten und ihre Zugehörigkeit zu einer Zeitzone ergibt sich aus der Weltkarte links. Sehr hilfreich ist auch die animierte Darstellung bei zeitzonen.net. Verweise: |
||||
Anmerkungen | ||||||
|
Links: Die klassische und gebräuchliche Skriptsprache für Internetseiten ist die Hypertext Markup Language - HTML, die sich besonders gut dazu eignet, Verweise zu anderen Seiten an beliebiger Stelle vorzunehmen. "Link" ist die umgangssprachliche Abkürzung für Hyperlink und bezeichnet eine Internetadresse, auf die in einer Webseite statisch verwiesen wird. "Broken Links" sind Links zu Seiten, die nicht mehr vorhanden sind oder ihren Standort gewechselt haben. Aufgrund der statischen Beschreibung der Verknüpfung in der HTML sind diese Seiten nicht mehr erreichbar ("Error 404").
"Deep Links" hingegen sind Verweise auf
einzelne Seiten eines breiten Angebots unter Umgehung der Portal- oder
Startseite. Ihre Zulässigkeit war einige Zeit umstritten. Sie sind vom
Bundesgerichtshof (Urteil vom 17.07.2003 - I ZR 259/00) als zulässig
angesehen worden, wobei auffallend ist, dass der erste
Zivilsenat des BGH mehrfach durch weise Entscheidungen zum Internetrecht
aufgefallen ist. Der hiesige Verweis auf den Urteilstext ist nichts
anderes als ein solcher Deep Link. |
All the Web: Chronologische Nachrichten zu FAST und Suchmaschine AllTheWeb, at-web.de. Google: Hinter dem unscheinbaren Wort "mehr" auf dem Google-Portal verbirgt sich eine Aufstellung der Dienste, die sonst geboten werden. Darunter befindet sich viel Nützliches, wie zum Beispiel Google Earth, aber auch Hosting-Angebote (Webspace, Blogs, Kalender, Dateiablage), von denen keiner weiß, was Google mit diesen privaten Daten anstellt. Siehe Jo Bager, Der Datenkrake. Google und der Datenschutz, c't 10/2006, S. 168. |
||||
Literatur | ||||||
Juan Gorraiz, Informationen zur Suche im Internet, Freie Universität Bozen Juan Gorraiz, Suchstrategien im Internet. Hilfe für im Web verfangene Internauten, 1997 bis 2005
Ralf Grötker, Fakten fischen. Der History-Bot markiert
eine neuen Zündstufe des Internet, Telepolis 04.09.2006 Dirk Lewandowski, Web Information Retrieval. Technologien zur Informationssuche im Internet, DGI Schrift 2005
Marcel Machill, 12 goldene Suchmaschinen-Regeln.
Ein Ratgeber für Verbraucherinnen und Verbraucher, die sich besser und
sicherer im Internet zurecht finden wollen, Landesanstalt für Medien
Nordrhein-Westfalen - LfM - Dezember 2005 |
||||||
Cyberfahnder | ||||||
|
© Dieter Kochheim 11.03.2018 |