Nichts als die Wahrheit: Google misst Vertrauenswürdigkeit von Websites

4 Kommentare

Update 3.3.2015:
Wie genau der Algorithmus arbeiten soll, zeigt der Blogger Christoph Kappes. Der Algorithmus isoliert aus einer Textpassage eine Aussage und zerlegt diese in Subjekt, Prädikat und Objekt. Kappes zeigt dies anschaulich an einem Beispiel:

Wenn ein Satz lautet „In der Wochenzeitung, die Dienstag erschien, wurde der 6jährige Staatspräsident Müller von einer achtarmigen Kellnerin erschossen“, dann sind hierin drei Fakten versteckt, welche die Maschine speichert, zum Beispiel eine achtarmige Kellnerin.

Aus dieser Textpassage isoliert der Algorithmus die “achtarmige Kellnerin” und ordnet sie in Subjekt, Prädikat und Objekt ein. “Das Subjekt ist „Kellnerin“, das Prädikat „hat-Arme“ und das Attribut ‘8’”, erklärt Kappes. Dieses sogenannte “Triplet” speichert Google ab und gleicht es mit den Informationen anderer Websites ab – sofern es übereinstimmt und auf einer Website eine hohe Anzahl weiterer übereinstimmender “Triplets” gefunden werden, wird diese als vertrauenswürdig eingestuft.

Somit ist die Marschrichtung von Google eher Websites herauszufiltern, die vertrauenswürdig sind und diese öfter anzuzeigen. Sehr wahrscheinlich werden die “Triplets” mit Datenbanken, wie “FactCheck.org” abgeglichen, um eine zusätzliche Sicherheit zum Vertrauenswürdigkeit der Informationen zu gewährleisten.

Artikel vom 2.3.2015:
In einem wissenschaftlichen Aufsatz zeigen Google Mitarbeiter die Zukunft der Suchmaschine. “Knowledge-Based Trust: Estimating the Trustworthiness of Web Sources” ist der Titel der Arbeit und zugleich auch die Marschrichtung der Zukunft für den Marktführer in Deutschland.

We propose a new approach that relies on endogenous signals, namely, the correctness of factual information provided by the source. A source that has few false facts is considered to be trustworthy.

Bisher zählten Backlinks als wichtiges Ranking-Kriterium. Schon seit einiger Zeit wird die Quantiät der Links immer unwichtiger und es zählt die Qualität der Links. Eine Website kann also nicht mehr nur dank tausender Backlinks gut ranken, sondern es müssen vor allem relevante Links von vertrauenswürdigen Quellen sein. Neben diesen hochwertigen Links, zählt auch guter Content mit hohem Mehrwert für den Besucher – und hier kommt der wissenschaftliche Aufsatz der Googler ins Spiel: Um diesen hochwertigen Content als vertrauenswürdig einzustufen müssen, schon als vertrauenswürdig deklarierte, Quellen herangezogen werden und die Inhalte mit diesen Quellen abgeglichen werden. Falls die Website wenig falsche Informationen enthält wird auch sie als vertrauenswürdig eingestuft.

Urheber_ BoBaa22_shutterstock_189816743

Quelle: Shutterstock

Das Funktionsprinzip ist ein Algorithmus, der eine gewaltige Menge Daten (2,8 Milliarden Fakten) aus Apps zum Faktencheck, wie z.B. “FactCheck.org”, herausgezogen hat und nun mit den Daten im Internet abgleicht. Treten hohe Übereinstimmungen auf, wird eine Website als vertrauenswürdig eingestuft – bisher sind es 119 Millionen Seiten.

Mitte Februar berichteten wir schon von einem Google Patent, dass zeigt wie Google die Inhalte im Knowledge Graph verifiziert.

Es wird immer deutlicher, dass Google die Qualität und den Wahrheitsgehalt seiner Ergebnisse verbessern will. So wird es nicht nur relevante Suchergebnisse liefern, sondern auch verlässliche. Wird Google damit in der Zukunft zu einer eigenen Wikipedia? Was denkt ihr?

Den Aufsatz zum Nachlesen findet ihr hier: Knowledge-Based Trust: Estimating the Trustworthiness of Web Sources

Weitere Quellen:
FAZ: Google-Suchmaschine setzt auf Fakten
New Scientist: Google wants to rank websites based on facts not links


Kommentare

  1. Für News mag das ja vielleicht mal irgendwann klappen. Für Produkte oder Dienstleistungen ist sowas jedoch eher ungeeignet. “Wir mähen Ihren Rasen schnell und akkurat” – wahr oder unwahr?

    Viel lieber würde ich es sehen, wenn Google den vor einiger Zeit propagierten “Schwafel-Score” weiterentwickeln täte.
    Das würde uns in Zukunft dann solche Perlen auf den ersten Positionen der SERPs ersparen (Original Text, keine Weglassungen ausser dem Agentur Namen):

    ====
    #NameDerAgentur# – eine führende SEO Agentur Hannover
    SEO AGENTUR Hannover – eine führende SEO Agentur in Hannover

    SEO Agentur Hannover – #NameDerAgentur# gehört zu den führenden SEO Agenturen in Deutschland und hat als Online SEO Agentur in Hannover ein eigens hierfür aufgestelltes SEO Team.
    ====

    In dem Stil geht’s über 1 1/2 Bildschirmseiten.

    Frank Hübner
    Senior Programmer
    http://www.binary-garden.com

Trackbacks/ Pingbacks

  1. […] 1 FAZ: Google-Suchmaschine setzt auf Fakten 2 Neuer Algorithmus: Google sucht nur noch die Wahrheit 3 Studie zur Beurteilung des Wahrheitsgehalts von Webseiten 4 Christoph Kappes: It´s not Wahrheit, stupid. Anmerkungen zu Google Knowledge Vault 5 SEO.at: Nichts als die Wahrheit: Google misst Vertrauenswürdigkeit von Websites […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *