Freebase
Was ist Freebase?
Freebase ist eine von der Community gepflegte, strukturierte Wissensdatenbank, die reale Entitäten wie Personen, Orte, Organisationen und abstrakte Begriffe miteinander verknüpft.
Die Daten werden in Form eines Graphen gespeichert, wobei Knoten für Entitäten und Kanten für deren Beziehungen stehen.
Freebase wurde 2010 von Google übernommen und diente als zentrale Datenquelle für den Aufbau des Google Knowledge Graph.
Wofür wird Freebase verwendet?
Freebase wurde genutzt, um strukturierte Fakten aus unterschiedlichen Quellen wie Wikipedia, MusicBrainz oder anderen offenen Datenbanken zu sammeln und maschinenlesbar zu machen.
Die Daten halfen Google dabei, Suchanfragen besser zu verstehen, direkte Antworten in den Suchergebnissen anzuzeigen und komplexe Beziehungen zwischen Entitäten abzubilden.
Auch Entwickler konnten über eine API auf diese Daten zugreifen und eigene Anwendungen damit anreichern.
Warum ist Freebase wichtig?
Freebase war ein wichtiger Baustein für die Entwicklung des Google Knowledge Graph.
Durch die strukturierte Erfassung von Wissen konnten Suchmaschinen Zusammenhänge zwischen Begriffen erkennen, Mehrdeutigkeiten auflösen und Nutzern präzisere Informationen liefern.
Für Google war Freebase der Startpunkt, um von der reinen Stichwortsuche zur semantischen Suche überzugehen und Suchergebnisse kontextbezogen aufzubereiten.
Wie wird Freebase umgesetzt oder optimiert?
Freebase nutzte ein graphbasiertes Datenmodell: Jede Entität (z. B. „Berlin“) wurde als Knoten gespeichert, Beziehungen (z. B. „Hauptstadt von Deutschland“) als Kanten.
Nutzer konnten neue Fakten hinzufügen oder bestehende Einträge verbessern. Die Optimierung erfolgte durch Community-Pflege, Importe aus externen Quellen und die Verbesserung der Datenqualität durch Moderation.
Nach der Übernahme durch Google wurden die Daten kontinuierlich in den Knowledge Graph integriert und später zu Wikidata migriert.
Was sind typische Fehler oder Herausforderungen bei Freebase?
Herausforderungen waren vor allem die Sicherstellung der Datenqualität und die eindeutige Identifikation von Entitäten. Oft fehlten exakte Quellenangaben oder es gab doppelte beziehungsweise widersprüchliche Einträge.
Die Komplexität des Datenmodells machte den Einstieg für Laien schwierig. Nach der Schließung von Freebase mussten viele Daten manuell zu Wikidata übertragen werden, was zu Inkonsistenzen führen konnte.
Welche Tools unterstützen bei Freebase?
- Freebase API (inzwischen eingestellt)
- Daten-Dumps für eigene Analysen
- Wikidata (als Nachfolgeprojekt)
- Google Knowledge Graph API (als Ersatz für die Freebase API)
- Tools zur graphbasierten Datenvisualisierung und -abfrage (z. B. Graphd, MQL)
Welche Begriffe sind eng mit Freebase verknüpft?
- Google Knowledge Graph
- Wikidata
- Semantische Suche
- Graphdatenbank
- Entity-Relationship-Modell (ERM)
- Natural Language Processing (NLP)
- Machine Learning
- DBpedia
Metaweb Technologies, Inc. war ein US-amerikanisches Unternehmen mit Sitz in San Francisco, welches die Open-Content-Datenbank Freebase entwickelte. Das Unternehmen wurde von Danny Hillis und Robert Cook als Nebenprodukt von Applied Minds im Juli 2005 entwickelt und bis 2007 unter Ausschluss der Öffentlichkeit betrieben. Google erwarb Metaweb im Juli 2010.
Am 14. März 2006 erhielt Metaweb 15 Millionen US-Dollar als Grundfinanzierung. Zu den Investoren zählten Benchmark Capital, Millennium Technology Ventures sowie Omidyar Network. Kevin Harvey von Benchmark Capital ist ein Mitglied des „Metaweb Board of Directors“. Am 15. Januar 2008 verkündete Metaweb eine 42,5 Millionen Dollar starke Kapitalisierung, angeführt von Goldman Sachs und Benchmark Capital.
Am 16. Juli 2010 erwarb Google Metaweb gegen die Zahlung einer nicht öffentlich bekannt gemachten Summe.
Ende 2014 gab Google bekannt, die eigene Faktendatenbank Freebase im Jahr 2015 zugunsten des Wikidata-Projektes zu schließen. Um Daten einfacher nach Wikidata übernehmen zu können, wurde ein Importtool bereitgestellt. Bis Mitte 2019 sind aber von etwa 10 Millionen Datensätzen nur etwa 528.000 bzw. weniger als fünf Prozent in Wikidata übernommen worden.