Internet - Suchmaschinen
und -techniken |
29.12.2008 |
 |
Suchmaschinen und -techniken |
Google
Wikipedia
|
Suchmaschinen
Metasuchmaschinen
Google, der Datenkrake
Suchstrategie
Begriffe ausschließen
String-Suche
Definitionen bei Google
Expertensuche, Zielauswahl
besondere Suchen bei 
IP- und DNS-Adressen
Zeitzonen
Anmerkungen
Literatur
Erklärungen zu DNSstuff.com
DNSstuff.com
Auskunftsdienste im Internet
|
Neben
Google
und anderen Suchmaschinen ist die
Wikipedia zu einer
der wichtigsten Hilfsquellen für mich geworden. Die Verweise im
Cyberfahnder sprechen insoweit für sich.
Die Eingabefelder links außen lassen direkte Abfragen bei der
Suchmaschine und in dem Online-Lexikon zu.
Darüber hinaus finden Sie hier ein paar Hintergründe und Tipps zum
Umgang mit Suchmaschinen und für eine erfolgreiche Suche im Internet.
11.10.2009: Eine übersichtliche Zusammenstellung hilfreicher Werkzeuge
finden Sie bei den
Auskunftsdiensten im Internet.
|
 |
Suchmaschinen |
|

schlicht und übersichtlich:
das Portal von
Google |
Um sich im Internet zu bewegen, gibt es verschiedene Möglichkeiten.
Surfen: Als
Internetsurfen wird das Aufsuchen verschiedener Webseiten anhand der
Links
bezeichnet,
von denen auf die folgenden verwiesen wird.
Jedes Kind muss einen Namen haben: Die einfache Eingabe einer
Zieladresse im Webbrowser
wird
gelegentlich als "Type In-Surfen"
beschrieben. Das kann in vielen Fällen äußerst erfolgreich sein, weil
sich die meisten Unternehmen, Verwaltungen und andere in der
Öffentlichkeit bekannten Einrichtungen mit ihren Namen oder
Namensabkürzungen beschreibende Adressen unter den bekannten Top
Level-Domänen gesichert haben (
Domain Name System - DNS,
Top Level Domain - TLD). |
Suchmaschinen sind ein Segen und das wichtigste Handwerkzeug für
eine gezielte und überlegte Suche nach Inhalten im Internet.
Die gebräuchlichsten von ihnen durchsuchen regelmäßig mit
automatischen Routinen (Roboter,
Crawler) das Internet und speichern die
gefundenen Inhalte in ihren Datenbanken. Ihr Erfolg hängt davon ab, wie
gut sie das gefundene Material aufbereiten und wie schnell sie ihre
Suchergebnisse an den Anwender melden können.
In den Hintergrund getreten sind redaktionell betreute Suchmaschinen,
die dem Anwender nach ihrer Qualitätskontrolle nur überprüfte Webseiten
anbieten.
Yahoo.de (siehe auch
Yahoo.com) zeigt, wie eine Suchmaschine um redaktionell aufbereitete
Angebote ergänzt werden kann. Das Problem dabei ist, dass die Verweise
häufig sehr allgemein gehalten sind und sich an das breite Publikum
richten.
|
 |
Metasuchmaschinen |
Google, der Datenkrake |
Metasuchmaschinen
Metager
Metager 2
|
Mit den üblichen
Suchmaschinen erreichen Sie keineswegs alle Angebote im Internet,
sondern allenfalls 90 bis 95 %.
Diese Lücke füllen die
Metasuchmaschinen, die über keine eigenen
Datenbestände verfügen, sondern mit den Suchworten des Anwenders mehrere
andere Suchmaschinen abfragen und deren Ergebnisse für den Anwender
zusammen stellen.
Metager vom Regionalen Rechenzentrum der Uni Hannover
soll es damit schaffen, fast 100 % des deutschsprachigen
Internetangebots zur Verfügung zu stellen.
In den Neunziger Jahren war die Suchmaschine
alltheweb.com von der norwegischen Firma FAST ein Geheimtipp, weil
sie seinerzeit über einen der größten Datenbestände verfügte. Sie wurde
2003 - zusammen mit anderen Internetdiensten von Yahoo übernommen
. |
Gegen
Google kam All the Web aber nicht an. Aus einem einfachen Grund: Trotz
des größeren Datenbestandes schien der von All the Web ungepflegt und
verwies auf viel zu viele tote Links.
Googles Popularität beruht auf seiner Treffsicherheit, Aktualität
und Schnelligkeit. Das Unternehmen erreicht diese Qualitäten
ausschließlich mit technischen Mitteln, indem es ständig die
Verarbeitungsprozesse optimiert und erweitert. Darüber hinaus bietet es
immer wieder neue und kostenlose Dienste an, die seine Bekanntheit und
Beliebtheit ungebremst steigern
.
Über den Datenschutz schweigt sich Google grundsätzlich aus. Allein
aufgrund der Suchabfragen, die die Suchmaschine durchlaufen, lassen sich
detaillierte Personenprofile erstellen. Dies gilt mehr noch für die
Anwender, die den Onlinedienst zur Verwaltung ihrer persönlichen Daten
(Kalender, Dateien usw.) verwenden. Die (führende) Computerzeitschrift
c't hat deshalb Google auch - liebevoll und böswillig zugleich - als den
Datenkraken bezeichnet
. |
 |
Suchstrategie |
Begriffe ausschließen |
|
Es gibt richtig "doofe", besser:
unpräzise Suchworte, die mehrere
Millionen Treffer bei den Suchmaschinen hervorrufen. Versuchen Sie es
'mal mit "Sex", "Internet", "Impressum" oder "Index".
Wenn Sie bei einem Wettbewerb nach den meisten
Treffern als Spielverderber auftreten wollen, dann rufen Sie die
Expertensuche bei Google auf und und führen mit den oben genannten
Worten eine Oder-Suche aus. Sie werden wahrscheinlich unschlagbar sein.
|
Google und die meisten anderen Suchmaschinen sind so voreingestellt, dass sie eine
Und-Suche durchführen. Das bedeutet, dass sie mehrere
Suchworte, die durch ein Leerzeichen voneinander getrennt sind, als
einzelne Begriffe ansehen, die alle in dem gesuchten Dokument enthalten
sein müssen. Durch die Aneinanderreihung von Worten schränken Sie die
Suche immer weiter ein.
Überlegen Sie deshalb einen Moment, welche Wörter in den gesuchten
Dokumenten zu erwarten sind, und scheuen Sie sich nicht davor, mehrere
in das Suchfeld einzugeben.
Die Groß- und Kleinschreibung spielt dabei grundsätzlich keine Rolle.
Die besonderen Funktionen, über die Google verfügt, werden hier
erklärt.
|
Zeigt sich bei Ihrer Suche, dass ihr Suchbegriff ein "Teekesselchen" mit
mehreren Erklärungsinhalten ist, kann sich anbieten, die
anderen Bedeutungen bei der Suche auszuschließen. Dazu reicht es in aller
Regel, die nicht gesuchten Inhalte mit einem Minus-Zeichen vor dem Suchwort
auszuschließen.
Wenn Sie also nach einem nordafrikanischen Nomadenvolk suchen, aber
nichts über die Wolfsburger Autoproduktion wissen wollen, könnte Ihre
Suchabfrage so aussehen:
Touareg -Volkswagen
-VW -Auto |
|
 |
String-Suche |
Definitionen bei Google |
Suche nach Definitionen bei Google
Suchbegriff hinter der Voreintragung einfügen und auf
den Button klicken.
|
Bei der Suche nach Aktenzeichen oder vollständigen Namen (Vor- und
Nachname) kommt es gerade auf die Leerzeichen an, die die gesuchten
Zeichenfolgen kennzeichnen. Die Suche nach solchen Zeichenketten mit
Leerzeichen (Strings) bekommen Sie, wenn sie die Begriffe mit
Anführungszeichen einleiten und abschließen.
Über die Popularität des Landgerichts Hamburg im Internet werden Sie
überrascht sein, wenn Sie zwei Strings miteinander verbinden:
"Landgericht Hamburg" "312 O 85/98" |
|
Google kennt die schöne Funktion "Definition" und zeigt bevorzugt die
Erklärungen in der
Wikipedia
an. Wird die Suchmaschine nicht in der deutschen Version fündig, greift sie
auf die englische Version und auf andere Quellen im Internet zurück.
Beispiel:
In dem Eingabefeld links außen ist der Definiere-Befehl vorbelegt.
Eine Alternative dazu funktioniert häufig auch bei anderen
Suchmaschinen, die die String-Suche zulassen:
|
 |
Dokumententyp |
|
|
29.12.2008: Bei der Kombination eines Suchwortes mit dem Kommando "filetype:"
beschränkt sich die Suchmaschine auf die Dokumente mit dem angegebenen
Format.
[Suchwort] filetype:[pdf] |
So lassen sich zum Beispiel gezielt PDF- (pdf), MS-Word- (doc),
Excel-Dokumente (xls) oder Präsentationen (ppt, pps, ppsx)
herausfiltern.
|
Liste
der Dateinamenserweiterungen
siehe auch:
Daten
legal hacken dank Google, tecchannel 24.12.2008
|
 |
Experten-Suche,
Zielauswahl |
IP- und DNS-Adressen |
Suche bei Heise Security
Suche bei
heise
security mit dem
heisec-Bookmarklet.
Suche im Heise-Glossar
Suchbegriff hinter der Voreintragung einfügen und auf den Button klicken.
|
Hinter
den Worten
Erweiterte Suche im Google-Portal versteckt sich die Experten-Suche.
Sie ermöglicht eine Vielzahl von Filtereinstellungen, insbesondere
Zeitvorgaben und zum Beispiel Oder-, Ähnlichkeits- und Reverse-Suchen, wobei es
darum geht, welche anderen Seiten auf eine Zieladresse verweisen.
Aus meiner Sicht besonders hilfreich ist die Möglichkeit, bestimmte
Domänen gezielt zu durchsuchen. Das ist nicht nur interessant im
Zusammenhang mit der Frage, ob sich eine Webseite mit einem bestimmten
Thema beschäftigt, sondern auch besonders dann, wenn die Inhalte einer
Webseite bekanntermaßen nicht zusammenfassend dokumentiert sind.
Das gilt zum Beispiel für das Glossar bei
Heise online. Es wird nicht offen präsentiert, sondern versteckt
hinter kryptischen Dateinamen in dem Unterverzeichnis "glossar". In dem
Eingabefeld links werden die einschränkenden Filter benutzt, die die
erweiterte Suche von Google für solche Fälle bereit hält.
|
IP-Adressen sind nummerische Netzwerkadressen, die aus 4 Ziffernfolgen
bestehen, die durch Punkte getrennt werden.
DNS-Adressen sind hingegen beschreibende Adressen aus verständlichen
Worten, die unter einer
Top Level-Domain registriert sind.
Die Inhaber von IP- und DNS-Adressen können verhältnismäßig einfach mit
den Werkzeugen von
Heise
Netze und von
DNSstuff.com nachverfolgt werden, wobei auch Spam-Datenbanken abgefragt
werden können.
DNSstuff bietet dazu auch noch weitere Routinen, die gesondert
vorgestellt werden.
Netzwerk-Werkzeuge bei Heise Netze:
Netzwerk-Tools bei heise Netze
Ping
Traceroute
Whois-Abfrage
DNS-Abfrage
|
 |
Zeitzonen |
|

Großansicht bei Wikipedia
Zeitzonen |
Die
koordinierte Weltzeit - UTC - orientiert sich am Längenkreis von
Greenwich, durch das der so genannte 0-Meridian verläuft (auch "Zero").
Zeitangaben im Internet verwenden entweder die UTC oder die
Unixzeit, die in der Anzahl der seit dem 01.01.1970 vergangenen
Sekunden gezählt wird.
Die UTC wird entweder minuten- oder sekundengenau angegeben. Ihre
häufigste Form ist: hh:mm:ss.
Die
Zeitzonen sind zu ihren Nachbarzonen in aller Regel um 1 Stunde von der UTC versetzt.
Die für Deutschland geltende
Mitteleuropäische Zeit
- MEZ ist eine Zeitzone
östlich der UTC. Dort wird sie gekennzeichnet durch einen Zusatz mit
Plus-Zeichen: hh:mm:ss +1 (häufig auch hh:mm:ss +0100). |
Das heißt, dass der Tag in Deutschland gegenüber der UTC um eine Stunde
früher beginnt:
10:00:00 MEZ
= 10:00:00 UTC +1
= 09:00:00 UTC
Während der Sommerzeit beginnt der Tag eine weitere Stunde eher. In der UTC bedeutet das:
MEZ / Sommerzeit
= UTC + 2
Eine genaue Darstellung der Nationalstaaten und ihre Zugehörigkeit zu
einer Zeitzone ergibt sich aus der Weltkarte links. Sehr hilfreich ist
auch die animierte Darstellung bei
zeitzonen.net.
Verweise:
Anzeige der aktuellen Uhrzeit auf der ganzen Welt
Liste der Staaten und ihre UTC
Aktuelle Anzeige der UTC
|
 |
Anmerkungen |
|
|
Browser: Programm zur Anzeige und Ausführung von Inhalten und Dokumenten aus offenen Datennetzen (Internet, HTML).
Links: Die klassische und gebräuchliche Skriptsprache
für Internetseiten ist die
Hypertext Markup Language - HTML, die sich besonders gut dazu
eignet, Verweise zu anderen Seiten an beliebiger Stelle vorzunehmen.
"Link" ist die umgangssprachliche Abkürzung für
Hyperlink und bezeichnet eine Internetadresse, auf die in einer
Webseite statisch verwiesen wird.
"Broken Links" sind Links zu Seiten, die
nicht mehr vorhanden sind oder ihren Standort gewechselt haben. Aufgrund
der statischen Beschreibung der Verknüpfung in der HTML sind diese
Seiten nicht mehr erreichbar ("Error 404").
"Deep Links" hingegen sind Verweise auf
einzelne Seiten eines breiten Angebots unter Umgehung der Portal- oder
Startseite. Ihre Zulässigkeit war einige Zeit umstritten. Sie sind vom
Bundesgerichtshof (Urteil vom 17.07.2003 - I ZR 259/00) als zulässig
angesehen worden, wobei auffallend ist, dass der erste
Zivilsenat des BGH mehrfach durch weise Entscheidungen zum Internetrecht
aufgefallen ist. Der hiesige Verweis auf den Urteilstext ist nichts
anderes als ein solcher Deep Link.
|
Ein
Uniform Resource Locator - URL - ist der Verweis auf eine
Netzwerkadresse und damit der Oberbegriff für Links und Adresseingaben
im
Browser.
All the Web:
Chronologische Nachrichten zu FAST und Suchmaschine AllTheWeb, at-web.de.
Google: Hinter dem unscheinbaren Wort "mehr" auf dem
Google-Portal verbirgt sich eine
Aufstellung der Dienste, die sonst geboten werden. Darunter befindet
sich viel Nützliches, wie zum Beispiel
Google Earth, aber auch Hosting-Angebote (Webspace, Blogs, Kalender,
Dateiablage), von denen keiner weiß, was Google mit diesen privaten
Daten anstellt.
Siehe
Jo Bager, Der Datenkrake.
Google und der Datenschutz, c't 10/2006, S. 168. |
 |
Literatur |
|
|
Niels Boeing, Suchen ohne Googlen ( Metager2),
Technology Review 07.03.2006
Gordon Bolduan, "Ich genieße den Vorteil, dass ich
flexibler bin." Interview mit Markus Franz (Metager 2, Meta4media),
Technology Review 29.09.2006
Gordon Bolduan, Von Agenten gesucht, Technology
Review 25.08.2006
Juan Gorraiz, Informationen zur Suche im Internet,
Freie Universität Bozen
Juan Gorraiz, Suchstrategien im Internet. Hilfe für im
Web verfangene Internauten, 1997 bis 2005
Ralf Grötker, Fakten fischen. Der History-Bot markiert
eine neuen Zündstufe des Internet, Telepolis 04.09.2006
Steffan Heuer, „Wir sollten die Köpfe der Leute crawlen
..." Technology Review 21.02.2007
Gregor Honsel, Nadel im Heuhaufen, Technology
Review 20.06.2006
Gregor Honsel, Text Mining für das Internet,
Technology Review 10.07.2006
Moritz Jäger, Google: Finden statt Suchen,
tecchannel 18.05.2006
Dirk Lewandowski, Web Information Retrieval.
Technologien zur Informationssuche im Internet, DGI Schrift 2005
Marcel Machill, 12 goldene Suchmaschinen-Regeln.
Ein Ratgeber für Verbraucherinnen und Verbraucher, die sich besser und
sicherer im Internet zurecht finden wollen, Landesanstalt für Medien
Nordrhein-Westfalen - LfM - Dezember 2005
Alois Payer, Margarete Payer,
Informationswesen, Bibliothekswesen, Dokumentationswesen
Kritisch für alle Webseiten: Nationalbibliothek will digitales
Deutschland archivieren, tecchannel 20.09.2006
Suche wird zur zweitwichtigsten Internet-Anwendung, tecchannel
22.11.2005
Jürgen Weigl, Literaturrecherche. Suche nach Literatur
mit Hilfe des Internets, 16.01.2004 |
 |
Cyberfahnder |
|
© Dieter Kochheim
11.03.2018 |