Bielefeld Academic Search Engine

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Bielefeld Academic Search Engine (BASE)
Internet-Suchmaschine
Sprachen Chinesisch (vereinfacht), Deutsch, Englisch, Französisch, Spanisch (Kastilisch), Polnisch, Neugriechisch, Ukrainisch
Betreiber Universitätsbibliothek Bielefeld
Redaktion v. a. institutionelle Repositorien
Artikel über 315 Mio.
Registrierung optional
Online seit 24. Juni 2004
https://www.base-search.net/

BASE (Bielefeld Academic Search Engine) ist eine Suchmaschine für wissenschaftliche Dokumente. Sie wird von der Universitätsbibliothek Bielefeld mit der Suchmaschinentechnologie der Open-Source-Software Solr/Lucene betrieben.[1] BASE wird als strategisches Projekt fortlaufend weiterentwickelt.[2]

Zielgruppe und Zielsetzung[Bearbeiten | Quelltext bearbeiten]

Das Angebot von BASE richtet sich in erster Linie an Wissenschaftler in Universitäten und Forschungseinrichtungen und an Studierende. Mit der Entwicklung von BASE verfolgt die Universitätsbibliothek das Ziel, mit Hilfe der Suchmaschinentechnologie einen verlässlichen, qualitativ hochwertigen Suchdienst für Forschung und Lehre aufzubauen.[3]

BASE möchte Zugang geben zu den Inhalten wissenschaftlicher Dokumentenserver, die im Rahmen der Open-Access-Bewegung kostenfrei über OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) zur Verfügung gestellt werden. Die Suchmaschine ist als offizieller OAI-Service-Provider[4] registriert und war am EU-Projekt DRIVER (Digital Repository Infrastructure Vision for European Research)[5] beteiligt, welches 2009 abgeschlossen wurde.

Aufgrund der intellektuellen Auswahl der Quellen hat BASE den Anspruch, fachlich qualifizierte Informationen in Verbindung mit umfangreichen und hochwertigen Metadaten zu liefern und sich dadurch von kommerziellen Suchmaschinen zu unterscheiden.[6]

Entwicklungsgeschichte[Bearbeiten | Quelltext bearbeiten]

Chronologie[Bearbeiten | Quelltext bearbeiten]

Datum Ereignis
Juni 2001 Aus festgestellten Defiziten einer Metasuchumgebung am Beispiel des Bibliotheksportals „Digitale Bibliothek NRW“ entsteht eine neue Konzeptidee: Entwicklung einer nichtkommerziellen Suchmaschine für die wissenschaftliche Nutzung[7]
Feb. 2002 – Aug. 2002 Evaluierung von Suchmaschinentechnologie[8]
2003, Sommer Beginn der technischen Umsetzung; Entwicklung eines Prototyps (Math-Demonstrator)[9]
Okt. 2003 Bekanntgabe der Zusammenarbeit der UB Bielefeld und der Firma FAST: Beginn einer strategischen Partnerschaft zur Erprobung und Förderung von Enterprise-Suchtechnologien; Vereinbarung über den Einsatz des Systems „FAST Data Search“[10]
März 2004, Frühjahr Abschluss der Erprobungsphase
Juni 2004 Freischaltung der Bielefeld Academic Search Engine[11][12]
Aug. 2004 Integration weiterer Quellen (Hochschulschriftenserver, OAI-Quellen, nicht OAI-fähige Quellen); erste Indexierung von Volltexten (elektronische Dissertationen der Ruhruniversität Bochum)[13]
Aug. 2005 neue Möglichkeiten der Suchverfeinerung (Einschränkung auf die Datenquelle), verschiedene Treffersortierungen, Suchhistorie über durchgeführte Suchanfragen[14]
Feb. 2006 Ersatz der Einzelserverlösung durch Serverfarm (6 Linux-Rechner)[15]
März 2006 Integration von trefferbezogenen Links auf die wissenschaftliche Suchmaschine Google Scholar[16]
Juni 2006 Beginn der Teilnahme am EU-Projekt DRIVER (Digital Repository Infrastructure Vision for European Research)[17]
Mai 2007 Suche nach ähnlichen Wortformen[17]
Juli 2007 über 100 deutsche Repositorien in BASE; Einführung eines öffentlichen Testbereichs: BASE Lab[18]
Okt. 2007 Multilinguale Suche (Eurovoc-Thesaurus)[19]
Juli 2008 Übernahme der Suchergebnisse über Erweiterungen des Firefox-Browsers in Literaturverwaltungsprogramme[20]
Jan. 2009 Website-Relaunch: Filterung nach Dokumentenarten in erweiterter Suche[21]
Aug. 2010 Mehr als 25 Millionen Dokumente im BASE-Index[22]
Feb. 2011 Vorbereitung des Plattform-Wechsels von FAST auf Lucene/Solr[23]
Mai 2011 Freigabe des mit Lucene/Solr produzierten BASE-Index[24]
Aug. 2011 Mehr als 30 Millionen Dokumente aus über 2.000 Quellen im BASE-Index[25]
Jan. 2012 Mobile Version für Smartphone-Nutzer[26]
Apr. 2012 Möglichkeit, ein persönliches Login einzurichten[27]
Juli 2012 Eigene Suchoberfläche für in Deutschland beheimatete Dokumentenserver[28]
Aug. 2013 Kennzeichnung von Open-Access-Dokumenten und -Quellen durch entsprechende Symbole. Mehr als 50 Millionen Dokumente aus 2.700 Quellen im BASE-Index[29]
Nov. 2013 Mehr als 3,3 Millionen Dokumente von CiteSeerX erstmals indexiert.[30]
Juni 2014 Mehr als 3.000 Quellen / 60 Millionen Dokumente im Index.[31]
Sep. 2014 Open-Access-Dokumente werden im Relevanz-Ranking aufgewertet (abschaltbar); ab Juli 2014 testweise im BASE Lab,[32] ab 23. September 2014 regulär.[33]
Aug. 2015 Suchfilter für Nachnutzung (Lizenz) und Zugang (z. B. Open Access) in der erweiterten Suche wählbar[34][35]
Okt. 2016 Im Oktober 2016 waren erstmals mehr als 100 Millionen Dokumente im Suchindex.[36]
Mai 2017 Seit Mai 2017 können User ihre eigenen Publikationen „claimen“, d. h. mit ihrer ORCID verknüpfen.[37]
Juli 2018 Umstellung auf ein responsives Design (Bootstrap).[38]
Nov. 2019 Mehr als 7000 Quellen / 150 Millionen Dokumente im Suchindex.[39]
Aug. 2020 Verstärkte Indexierung von Quellen via „Crossref“.[40] Über 200 Millionen Dokumente im Suchindex.[41]
Nov. 2020 Link auf „Versionen“ (Abgleich identischer DOIs im Index).[42]

Inhalte[Bearbeiten | Quelltext bearbeiten]

Wissenschaftliche Internetquellen[Bearbeiten | Quelltext bearbeiten]

Die Inhalte von BASE sind multidisziplinär. Ausgewertet werden ausschließlich wissenschaftliche Quellen. BASE hat den Anspruch, „Internetquellen des 'Unsichtbaren Web', die in kommerziellen Suchmaschinen nicht indexiert werden oder in deren großen Treffermengen untergehen“[6] zu erschließen. BASE indexiert:

Auswahl der Quellen und Transparenz[Bearbeiten | Quelltext bearbeiten]

Alle durchsuchten Quellen werden intellektuell ausgewählt und geprüft. Ein Quellenverzeichnis macht die Auswahl transparent.[43][44] Neben den indexierten Quellen wurden über 1.000 weitere Quellen mit über 30 Mio. Dokumenten geharvestet, die allerdings aus verschiedenen Gründen nicht für eine Indexierung geeignet sind.[45]

Aktualität und Umfang[Bearbeiten | Quelltext bearbeiten]

Der Index wird täglich aktualisiert, die Inhalte einzelner Dokumentenserver werden wöchentlich ergänzt.[43]

Zurzeit sind 149.820.832 Dokumente aus 7.188 Quellen über BASE suchbar.[44] Die Anzahl der Dokumente und Quellen steigt seit Produktionsaufnahme stetig, und der Index wird weiter ausgebaut. So werden Repository-Betreiber, die nicht im Quellenverzeichnis aufgeführt sind, gebeten, sich mit dem BASE-Team in Verbindung zu setzen.[44]

Länderabdeckung und Sprachen[Bearbeiten | Quelltext bearbeiten]

Quellen nach Ländern

Insgesamt befinden sich Quellen aus 132 Ländern im Index. Die Länder mit mehr als 100 indexierten Quellen (Repositories) sind:

Land Quellen Dokumente
Indonesien 1565 2.824.417
USA 1255 117.355.030
Japan 616 2.943.783
Deutschland 476 13.525.320
Vereinigtes Königreich 405 23.045.769
Brasilien 382 3.387.566
Spanien 296 6.488.774
Frankreich 223 21.518.060
Kanada 220 2.718.301
Russland 210 2.705.296
Indien 190 762.022
Kolumbien 180 863.992
Türkei 173 1.605.002
Italien 172 6.130.119
Peru 171 479.693
Ukraine 155 1.165.876
Polen 119 4.366.029
Australien 101 3.274.223

Quellen nach Kontinenten

Die europäischen Länder sind am häufigsten vertreten, gefolgt von Asien, Nordamerika, Südamerika, Australien und Afrika.

Kontinent Quellen Dokumente
Europa 3163 102.780.411
Asien 2755 11.583.167
Nordamerika 1644 120.562.672
Südamerika 1016 6.373.730
Australien/Ozeanien 129 3.606.934
Afrika 151 1.072.927
International / nicht zugeordnet 58 26.250.478

Alle Angaben: Stand 25. Juli 2019[46]

Dokumente nach Sprachen

Sortiert nach Sprachen,[47] ergibt sich folgendes Bild von den am meisten genutzten Sprachen mit mehr als 250.000 erfassten Dokumenten:

Sprache Dokumente
Englisch 133.509.263
Französisch 15.514.878
Spanisch 8.899.044
Deutsch 8.613.351
Portugiesisch 4.293.005
Polnisch 3.066.618
Italienisch 2.783.116
Japanisch 2.304.406
Russisch 2.199.070
Chinesisch 1.602.978
Bahasa Indonesia 1.008.238
Latein 994.789
Norwegisch 987.461
Niederländisch 927.455
Ukrainisch 917.321
Türkisch 840.040
Finnisch 640.490
Kroatisch 564.203
Tschechisch 557.487
Katalanisch 546.150
Neugriechisch 524.925
Ungarisch 518.561
Schwedisch 515.195
Dänisch 461.426

Etwa 1/3 aller Quellen sind keiner Sprache zugeordnet.

Zugang zu den indexierten Dokumenten[Bearbeiten | Quelltext bearbeiten]

BASE weist nicht ausschließlich Open-Access-Angebote nach.[48] BASE bietet die Möglichkeit an, eine Trefferliste auf eindeutig als Open Access klassifizierte Dokumente einzuschränken. Momentan können nur gut 45 % der indexieren Dokumente zweifelsfrei als Open Access von BASE gekennzeichnet werden, auch wenn die tatsächliche Quote der frei zugänglichen Dokumente bei ca. 60 % liegt. Die Kennzeichnung von Open-Access-Dokumenten auf Dokumentebene soll ausgebaut werden.[45] Seit Juli 2014 werden Open-Access-Dokumente im Relevanz-Ranking mit einem Boost-Faktor versehen, also tendenziell weiter vorn in der Ergebnisliste angezeigt. Diese neue Funktion ist abschaltbar.[32]

Funktionen[Bearbeiten | Quelltext bearbeiten]

Benutzeroberfläche und Navigation[Bearbeiten | Quelltext bearbeiten]

Die barrierefreie Benutzeroberfläche von BASE ist einfach und übersichtlich gestaltet. Die Rechercheoberfläche wird wahlweise chinesisch (vereinfachte Schrift), deutsch, englisch, französisch, griechisch, polnisch, spanisch (kastilisch) oder ukrainisch angeboten. Informationen über BASE sind deutsch und englisch verfügbar.

Die Startseite ermöglicht eine Suche im BASE-Index (Standardsuche). Von hier aus erfolgt auch der Übergang zu den weiteren Funktions- und Recherchebereichen von BASE: Erweiterte Suche, Hilfe, Browsing und Suchhistorie sowie zur mobilen Version. Die Optionen befinden sich in einer Überschriftleiste, die für alle Rechercheseiten einheitlich gestaltet ist, so dass problemlos zwischen den Funktionen gewechselt werden kann. Unterhalb der Suchmaske gelangt man u. a. auf die Seiten Über BASE (allgemeine Informationen über das Rechercheportal), das BASE-Blog, den Twitter- und den Mastodonkanal.

Recherchefunktionalität[Bearbeiten | Quelltext bearbeiten]

Standardsuche Bewusst am Erfolg von Google orientiert, präsentiert BASE dem Benutzer für den Sucheinstieg die Standardsuche mit nur einem einfachen Suchfeld, das standardmäßig für die Freitextsuche zur Verfügung steht. Mithilfe einer in der Hilfe erklärten Syntax ist es möglich, die Suche einzelner Begriffe auf einzelne Metadatenfelder zu beschränken. Bei der Eingabe der Suchbegriffe können Platzhalter für eine Rechtstrunkierung verwendet werden.

Zusätzlich bietet die Standardsuche die Option der automatischen Erweiterung der Suchbegriffe auf andere Wortformen (Lemmatisierung).

Erweiterte Suche Die Erweiterte Suche eröffnet standardmäßig die Möglichkeit, die Suchbegriffe spezifisch für die folgenden Metadatenfelder einzugeben: Gesamtes Dokument, Titel, Autor, Schlagwörter, DOI, (Teil der) URL und Verlag. Die Suche im gesamten Dokument entspricht der Standardsuche. Die einzelnen Metadatenfelder können miteinander kombiniert werden. Sie werden automatisch mit dem Booleschen Operator UND verknüpft. Innerhalb eines Suchfeldes können die Suchbegriffe durch verschiedene Boolesche Operatoren über eine spezielle, in der Hilfe dokumentierte Syntax kombiniert werden.

Daneben besteht die Option der Eingrenzung der Suche auf die Herkunft der Quellen (bestimmte Länder oder Kontinente), auf bestimmte Erscheinungsjahre oder -zeiträume, auf bestimmte Dokumentarten (z. B. Bücher, Artikel, Dissertationen, Videos) sowie auf Lizenzen zur Nachnutzung (Creative Commons, Public Domain, Softwarelizenzen wie GPL). Ebenso kann die Anzahl der in der Trefferliste angezeigten Titel begrenzt werden (10, 20, 30, 50 oder 100).

Ergebnisanzeige Die Suchergebnisse werden in einer Liste ausgegeben, die standardmäßig nach Relevanz sortiert wird. Die Ermittlung der Relevanz erfolgt nach verschiedenen Kriterien, z. B. spielt es eine Rolle, ob der Suchbegriff im Titel oder nur an anderer Stelle vorkommt. Das vorgegebene Ranking kann jedoch verändert und eine benutzerdefinierte Sortierung nach Autor, Titel oder Erscheinungsjahr gewählt werden, optional auf- oder absteigend.

Das einzelne Suchergebnis enthält – soweit vorhanden – umfangreiche, qualifizierte Metadaten (z. B. neben Titel und Autor auch Schlagwörter, Verlag, Quelle, Sprache, Abstract, URL). In die Trefferanzeige integriert ist der

  • Link zum Original-Dokument (Metadaten oder elektronischem Volltext),
  • Link zu einer neuen Suchanfrage nach dem Autor,
  • Link zum Datenlieferanten,
  • Link zu einer Suchanfrage in Google Scholar (durch die Suche nach dem Titel in Google Scholar können mit ihm verknüpfte Zitationen oder verschiedene Versionen des Werkes gefunden werden),
  • Link zum Export per E-Mail und in Literaturverwaltungsprogramme,
  • Link zum Hinzufügen als Favorit im persönlichen Profil (mit Login).

Ist die Treffermenge zu umfangreich, kann sie auf Autor, Schlagwort, Dewey-Dezimalklassifikation, Erscheinungsjahr, Quelle, Sprache, Dokumentart, Zugang (Open Access / unbekannt) oder Nachnutzung (Lizenz) eingegrenzt werden. Es kann jeweils nur eine Option aus den Auswahlmenüs ausgewählt werden.

Außerdem werden die Suchanfragen der aktuellen Sitzung in einer Suchhistorie angezeigt, die jeweils neu abgesetzt werden können. Mit einem persönlichen Login können Suchanfragen auch dauerhaft gespeichert werden. Des Weiteren können Suchanfragen als RSS- oder Atom-Web-Feed abonniert werden, die Suchergebnisse können per E-Mail verschickt oder gespeichert werden. Für letzteres ist ebenfalls ein persönliches Login notwendig.

Aus der Trefferliste heraus kann durch Änderung der aktuellen Suchfrage direkt eine neue Suche ausgelöst werden.

Browsing[Bearbeiten | Quelltext bearbeiten]

Neben der Suche bietet BASE auch ein Browsing nach Dewey-Dezimalklassifikation (DDC), Dokumentart, Nachnutzung / Lizenz und Zugang an. Die DDC der Dokumente wird auf zwei verschiedene Arten ermittelt: Zum einen werden bereits von einigen Datenquellen DDC-Nummern vergeben, die direkt in das Browsing übernommen werden. Zum anderen werden auch Dokumente innerhalb von BASE automatisch nachklassifiziert. Die dafür verwendete Technik wurde im Rahmen des DFG-geförderten Projekts „Automatische Anreicherung von OAI-Metadaten“ entwickelt.[49]

Eingestellte Projekte[Bearbeiten | Quelltext bearbeiten]

BASE DE[Bearbeiten | Quelltext bearbeiten]

In einer eigenen Suchoberfläche konnte man gezielt in Quellen suchen, deren Dokumentenserver in Deutschland beheimatet sind. Damit sollte ein nationaler Nachweis von OAI-Metadaten ermöglicht werden.[50] Die sogenannte „Deutschland-Sicht“ umfasste ca. 6.300.000 Dokumente aus über 250 Quellen.

BASE Lab[Bearbeiten | Quelltext bearbeiten]

BASE bot mit BASE Lab einen öffentlichen Testbereich an, in dem neue Funktionen erprobt werden konnten.[2] Folgende Funktionen erschienen zuerst dort:

  • Einsatz computerlinguistischer Verfahren zur automatischen Klassifikation von OAI-Metadaten im Rahmen des DFG-Projekts „Automatische Anreicherung von OAI-Metadaten mit Hilfe computerlinguistischer Verfahren und Entwicklung von Services für die inhaltsorientierte Vernetzung von Repositorien“.
  • Aufbau eines Dienstes zur Bereitstellung aggregierter und normalisierter OAI-Metadaten
  • Ausbau der Kennzeichnung von Open-Access-Dokumenten
  • Höhergewichtung von Open-Access-Dokumenten[32]

Technische Grundlagen[Bearbeiten | Quelltext bearbeiten]

Suchmaschinentechnologie[Bearbeiten | Quelltext bearbeiten]

Technische Basis ist die Suchmaschinentechnologie von Solr und Vufind.[1] Sie ermöglicht

  • den Einsatz von linguistischen Verfahren zur Optimierung von Suchanfragen (z. B. Lemmatisierung, Kompositazerlegung, Permutationen)
    Durch automatische Spracherkennung und Erzeugung von Wörterbüchern werden die Suchbegriffe auf weitere Wortformen (Plural, Genitiv) erweitert.
  • Relevanz-Ranking der Suchergebnisse
    Die Relevanz wird durch einen in der Software enthaltenen Algorithmus ermittelt
  • Nachträgliche Eingrenzung der Treffermenge nach bestimmten Kriterien (Autor, Schlagwort, Erscheinungsjahr, Quelle, Sprache und Dokumentart).

Integration der Datenquellen[Bearbeiten | Quelltext bearbeiten]

Die Daten werden über unterschiedliche Schnittstellen in die Suchmaschine eingebunden, nämlich über[51]

  • im Regelfall: OAI-Harvesting
    Metadaten ausgewählter OAI-Dokumentenserver werden über das Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) eingebunden.
  • in Sonderfällen: Web-Crawler
    Inhalte aus wissenschaftlichen Webseiten werden durch einen eigenen Webcrawler eingesammelt. Die hier ermittelten Volltextdaten werden auf enthaltene Metadaten hin analysiert.

Die überwiegend im Dublin-Core-Format eingesammelten Daten sind sehr heterogen und müssen deswegen vor dem Indexieren aufwändig normalisiert werden.[7]

Schnittstellen zu Fremdanbietern[Bearbeiten | Quelltext bearbeiten]

BASE ermöglicht durch Links in den Trefferlisten die direkte Suche nach einzelnen Titeln in Google Scholar. Nutzt der Anwender BASE vor Ort in einer Bibliothek, können Links in den Google-Trefferlisten zum durch die Bibliothek angebotenen Volltext führen. Dies setzt die Konfiguration seitens der Bibliothek voraus.[52]

Schnittstellen zur Nachnutzung von BASE-Diensten und -Daten[Bearbeiten | Quelltext bearbeiten]

BASE bietet mehrere Programmierschnittstellen an:[53]

  • Die Such- oder HTTP-Schnittstelle ist eine REST-API für die direkte Suche im BASE-Index via Solr. Die Nutzung ist kostenlos für nichtkommerzielle Vorhaben und setzt lediglich die Registrierung einer festen IP-Adresse voraus.
  • Die OAI-PMH-API bietet Projektpartnern und ausgewählten nichtkommerziellen Projekten die Möglichkeit, die normalisierten BASE-Daten (oder thematische Ausschnitte) aktuell zu beziehen.
  • Ohne Programmieraufwand realisierbar ist der Einbau eines HTML-Formulars als Suchbox zur Suche in BASE aus der eigenen Website heraus.

Nachnutzer[Bearbeiten | Quelltext bearbeiten]

Einbindung in Fachportale[Bearbeiten | Quelltext bearbeiten]

BASE ist in die Metasuche von mehreren deutschen Fachportalen eingebunden. Fachportal paedagogik.de, Germanistik im Netz, ilissAfrica, vifabio, Virtuelle Fachbibliothek medien buehne film und Livivo (ZB MED) binden entweder den vollständigen BASE-Index ein oder filtern die Suchanfrage nach einer Auswahl von Repositorien, die zum jeweiligen Fach passen. Da nicht nur klassische Hochschulschriftenserver, sondern auch Plattformen mit Digitalisaten von Fotos, Karten und anderen Quellenmaterialien geharvestet werden, öffnet BASE hier auch den Weg in Richtung Forschungsprimärdaten und virtuelle Forschungsumgebungen.

Nutzung durch Open-Access-Dienste[Bearbeiten | Quelltext bearbeiten]

BASE ist eine Primärquelle des Webdienstes dissem.in, der Autoren dabei hilft, eigene Fachpublikationen zu entdecken, die (noch) hinter einer Paywall verborgen sind, obwohl die Autoren sie frei zum Download anbieten dürften.[54]

Auf ähnliche Weise nutzt der webbasierte Altmetrik-Dienst Impactstory BASE, um zu prüfen, ob es von einem Artikel eine frei verfügbare Version im Sinne des grünen Wegs zum Open Access gibt.[55]

Der alternative DOI-Resolver doai.io und oadoi.org nutzen BASE, um frei verfügbare Versionen (z. B. Preprints/Eprints) von Artikeln zu finden, die ansonsten nur gegen Bezahlung oder mit einer Campuslizenz verfügbar sind.[56]

Das Browser-Plugin Unpaywall nutzt BASE-Daten, um beim Aufruf akademischer Bezahlschranken einen Link zu einer legalen kostenlosen Fassung desselben Werks einzublenden (falls vorhanden).[57]

Nutzung durch Discovery Services[Bearbeiten | Quelltext bearbeiten]

Seit Dezember 2015 bindet der EBSCO Discovery Service (EDS) die von BASE gesammelten und aufbereiteten Daten in seinen Dienst ein.[58]

Nutzung durch andere Suchmaschinen[Bearbeiten | Quelltext bearbeiten]

BASE ist eine per Voreinstellung aktive Quelle der nicht-kommerziellen deutschen Metasuchmaschine MetaGer und (seit Mitte 2016) der Metasuchmaschinen etools.ch (optional)[59] und Searx (im Science-Tab).[60] Auch die bibliographische Metasuche Karlsruher Virtueller Katalog kann BASE durchsuchen.

Vergleichbare Angebote[Bearbeiten | Quelltext bearbeiten]

Ein ähnliches Angebot wie BASE bieten das britische CORE (COnnecting REpositories)[61] und das ursprünglich von der University of Michigan entwickelte OAIster (heute Teil von OCLC). Beide sind vom Umfang her aber deutlich kleiner. Vergleichbare kommerzielle Suchmaschinen mit wissenschaftlichem Zuschnitt – aber geringerer Metadatenqualität – sind Google Scholar und Microsoft Academic Search.

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Dirk Pieper, Friedrich Summann: Bielefeld Academic Search Engine (BASE): An end-user oriented institutional repository search service. In: Library Hi Tech, Band 24, Nr. 4, 2006, S. 614–619; urn:nbn:de:0070-pub-16809798.
  • Dirk Pieper, Sebastian Wolf: BASE – Eine Suchmaschine für OAI-Quellen und wissenschaftliche Webseiten. In: Information, Wissenschaft & Praxis (IWP), Band 58, Nr. 3, 2007, S. 179–182; urn:nbn:de:0070-pub-17065454.
  • Weiterführende Literatur auf der BASE-Website Über BASE: Publikationen. abgerufen am 27. August 2013.

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. a b FAQ. Stand 27. August 2013.
  2. a b BASE Lab (Weiterentwicklungen). Stand 27. August 2013.
  3. Norbert Lossau: Suchmaschinentechnologie und Digitale Bibliotheken – Bibliotheken müssen das wissenschaftliche Internet erschließen. In: Zeitschrift für Buch- und Bibliothekswesen (ZfBB), 51, 2004, 5/6, S. 293; urn:nbn:de:0070-pub-25166763.
  4. Liste der offiziellen OAI-Service-Provider. openarchives.org, Stand 27. August 2013.
  5. Website des Projekts DRIVER (Memento vom 30. August 2013 im Internet Archive)
  6. a b Über BASE. Stand 27. August 2013.
  7. a b Norbert Lossau, Friedrich Summann: Suchmaschinentechnologie und Digitale Bibliotheken: Von der Theorie zur Praxis. In: Zeitschrift für Buch- und Bibliothekswesen (ZfBB). 52 (2005), 1, S. 13; urn:nbn:de:0070-pub-25166763.
  8. Norbert Lossau, Friedrich Summann: Suchmaschinentechnologie und Digitale Bibliotheken: Von der Theorie zur Praxis. In: Zeitschrift für Buch- und Bibliothekswesen (ZfBB), 52, 2005, 1, S. 13.; urn:nbn:de:0070-pub-25166763. Ein Einsatz von Google-Software ist früh an organisatorischen Schwierigkeiten gescheitert. Getestet wurden Convera, Mnogo, Lucene, Fast Data Search.
  9. Norbert Lossau, Friedrich Summann: Suchmaschinentechnologie und Digitale Bibliotheken: Von der Theorie zur Praxis. In: Zeitschrift für Buch- und Bibliothekswesen (ZfBB). 52 (2005), 1, S. 13 f.; urn:nbn:de:0070-pub-25166763. Gemeinsam mit dem Hochschulbibliothekszentrum Köln (hbz) wurde auf Basis dieser Vorarbeiten ein Antrag auf die Teilnahme am nationalen Projekt „Verteilte Dokumentenserver (VDS)“ gestellt.
  10. Universitätsbibliothek Bielefeld und Branchenführer FAST starten strategische Partnerschaft zur Erprobung und Förderung von Enterprise-Suchtechnologien der neuen Generation für digitale Bibliotheken. Universität Bielefeld, Informations- und Pressestelle: Pressemitteilung Nr. 168/2003; abgerufen am 27. August 2013.
  11. Norbert Lossau, Friedrich Summann: Suchmaschinentechnologie und Digitale Bibliotheken: Von der Theorie zur Praxis. In: Zeitschrift für Buch- und Bibliothekswesen (ZfBB), 52, 2005, 1, S. 14 f.; urn:nbn:de:0070-pub-25166763.
  12. Urte Kramer: Bielefeld Academic Search Engine. In: InetBib. 24. Juni 2004; abgerufen am 27. August 2013.
  13. Urte Kramer: BASE Update. In: InetBib. 27. August 2004; abgerufen am 27. August 2013.
  14. Urte Kramer: BASE: neues Release. In: InetBib. 10. August 2005; abgerufen am 27. August 2013.
  15. Friedrich Summann, Sebastian Wolf: Suchmaschinentechnologie und wissenschaftliche Suchumgebung. In: VÖB Online-Mitteilungen. OM 86 (Juni 2006), S. 6; abgerufen am 27. August 2013.
  16. Sebastian Wolf: BASE – neues Release mit Google-Scholar-Links. In: InetBib. 2. März 2006; abgerufen am 27. August 2013.
  17. a b Sebastian Wolf: BASE-Update / DRIVER. In: InetBib. 18. Mai 2007; abgerufen am 27. August 2013. Ziel des Projekts ist die Vernetzung wissenschaftlicher Repositorien von Universitäten und Forschungseinrichtungen in Europa. Die UB Bielefeld ist für die Bereiche Harvesting, Aggregation, Speicherung und Indexierung von OAI-Metadaten verantwortlich und bringt in das Projekt ihre durch BASE erworbene Expertise ein.
  18. Sebastian Wolf: Mehr als 100 deutsche Repositories in BASE / Neue Features im BASE Lab. In: InetBib. 6. Juli 2007; abgerufen am 27. August 2013.
  19. Sebastian Wolf: Über 500 Repositories in BASE. In: InetBib. 18. Mai 2007; abgerufen am 27. August 2013.
  20. Dirk Pieper: BASE Update. In: InetBib. 7. Juli 2008; abgerufen am 27. August 2013.
  21. Sebastian Wolf: Suchmaschine BASE: Über 1080 Quellen und neue Funktionen. In: InetBib. 3. Februar 2009; abgerufen am 27. August 2013.
  22. Dirk Pieper: Mehr als 25 Millionen Dokumente in BASE. In: InetBib. 4. August 2010; abgerufen am 27. August 2013.
  23. Dirk Pieper: Neue BASE Version im BASE Lab. In: InetBib. 14. Februar 2011; abgerufen am 27. August 2013.
  24. Dirk Pieper: BASE Migration. (Memento vom 21. Oktober 2012 im Internet Archive) In: InetBib. 18. Mai 2011; abgerufen am 27. August 2013.
  25. Sebastian Wolf: Suchmaschine BASE: Über 30 Mio. Dokumente / 2000 Quellen. In: InetBib. 22. August 2011; abgerufen am 27. August 2013.
  26. Dirk Pieper: BASE Smartphone-Nutzung. In: BASE-Blog. 9. Januar 2012; abgerufen am 27. August 2013.
  27. Sebastian Wolf: Persönliches Profil für BASE. In: BASE-Blog. 17. April 2013; abgerufen am 27. August 2013.
  28. Dirk Pieper: Nationaler Nachweis von OAI-Metadaten. In: BASE-Blog. 17. Juli 2013; abgerufen am 27. August 2013.
  29. Dirk Pieper: Neuer Meilenstein für BASE: 50 Millionen Dokumente! In: BASE-Blog. 26. August 2013; abgerufen am 27. August 2013.
  30. Dirk Pieper: Über 3,3 Millionen Dokumente von CiteSeerX in BASE. In: BASE-Blog. 11. Dezember 2013; abgerufen am 5. August 2015.
  31. Sebastian Wolf: 60 Millionen Dokumente aus 3000 Quellen im BASE-Index. In: BASE-Blog. 20. Mai 2014; abgerufen am 25. Juni 2014.
  32. a b c Sebastian Wolf: Open-Access-Dokumente "boosten". In: BASE-Blog. 29. Juli 2014; abgerufen am 5. August 2015.
  33. Christian Pietsch auf Twitter: From now on, BASE (Bielefeld Academic Search Engine @BASEsearch) by default boosts search results that are declared Open Access. #openaccess. 23. September 2014; abgerufen am 5. August 2015.
  34. @BASEsearch auf Twitter: We added 2 new features: Search by licence, e.g. #CreativeCommons and by access, e.g. #OpenAccess am 25. August 2015; abgerufen am 6. Oktober 2015.
  35. Bernd Fehling: OA (open access) Processing. In: Inside BASE. 19. September 2015; abgerufen am 6. Oktober 2015.
  36. @BASEsearch auf Twitter: Huge milestone for BASE: More than 100 million documents indexed, about 60% Open Access. am 28. Oktober 2016; abgerufen am 14. November 2016.
  37. Paul Vierkant: ORCID-Claiming in BASE möglich. Website des DFG-Projekts ORCID DE am 1. Juni 2017; abgerufen am 16. August 2017.
  38. Sebastian Wolf: 150 Millionen Dokumente und neue Funktionen. In: BASE-Blog. 12. Januar 2020; abgerufen am 22. Juni 2021.
  39. Sebastian Wolf: 150 Millionen Dokumente und neue Funktionen. In: BASE-Blog. 12. Januar 2020; abgerufen am 22. Juni 2021.
  40. @BASEsearch auf Twitter: We haved indexed nearly 100 sources via @CrossrefOrg. 13. August 2020; abgerufen am 22. Juni 2021.
  41. Sebastian Wolf: Über 200 Millionen Nachweise in BASE. In: BASE-Blog. 13. August 2020; abgerufen am 15. Juni 2021.
  42. @BASEsearch auf Twitter: We launched a new feature: "More versions". 10. November 2020; abgerufen am 22. Juni 2021.
  43. a b c Dirk Pieper, Sebastian Wolf: Wissenschaftliche Dokumente in Suchmaschinen. In: Handbuch Internet-Suchmaschinen. Heidelberg, 2009, S. 362; hdl:10760/12746.
  44. a b c Über BASE: Die Quellen. abgerufen am 25. Juni 2019.
  45. a b Sebastian Wolf: 10 Jahre BASE. abgerufen am 25. Juni 2014.
  46. Über BASE: Die Quellen (Länder). abgerufen am 25. Juni 2019.
  47. Suche im gesamten Index, Suchergebnis nach Sprache eingrenzen. abgerufen am 25. Juni 2019.
  48. FAQ. Das bedeutet, dass die Metadaten der Dokumente zwar angezeigt werden, diese aber im elektronischen Volltext nicht unbedingt frei zugänglich sind. Ist das Dokument lizenzpflichtig, verweist BASE darauf, dass die Lizenzkontrolle ausschließlich vom Datenlieferanten vorgenommen wird und der Informationssuchende sich an seine Institution oder Universität wenden soll, um den Zugang zu erhalten; abgerufen am 27. August 2013.
  49. Matthias Lösch: Automatische Sacherschließung elektronischer Dokumente. urn:nbn:de:0290-opus-10992.
  50. Nationaler Nachweis von OAI-Metadaten. abgerufen am 7. Juli 2014.
  51. Norbert Lossau, Friedrich Summann: Suchmaschinentechnologie und Digitale Bibliotheken: Von der Theorie zur Praxis. In: Zeitschrift für Buch- und Bibliothekswesen (ZfBB). 52 (2005), 1, S. 15; urn:nbn:de:0070-pub-25166732.
  52. Dirk Pieper, Sebastian Wolf: BASE – Eine Suchmaschine für OAI-Quellen und wissenschaftliche Webseiten. In: Information, Wissenschaft & Praxis (IWP), Band 58, Nr. 3, 2007, S. 155; urn:nbn:de:.
  53. Über BASE: Dienste. Abgerufen am 5. August 2015.
  54. dissem.in
  55. Heather Piwowar: Now, a better way to find and reward open access. In: Impactstory Blog. 5. Juni 2016, abgerufen am 5. August 2016.
  56. DOAI-Website. CAPSH (Committee for the Accessibility of Publications in Sciences and Humanities), abgerufen am 6. August 2016.
  57. Frequently asked questions. In: unpaywall. Abgerufen am 16. August 2017.
  58. 80 Millionen Dokumente aus BASE jetzt zugänglich für EDS-Nutzer. EBSCO, 7. Dezember 2015, abgerufen am 5. August 2016.
  59. https://www.etools.ch/
  60. Die Metasuchmaschine Searx enthält ein Plugin für BASE seit Version 0.9.0.
  61. core.ac.uk CORE (COnnecting REpositories). Abgerufen am 5. August 2015.