Zum Hauptinhalt wechseln

Leider unterstützen wir Ihren Browser nicht vollständig. Wenn Sie die Möglichkeit dazu haben, nehmen Sie bitte ein Upgrade auf eine neuere Version vor oder verwenden Sie Mozilla Firefox, Microsoft Edge, Google Chrome oder Safari 14 bzw. eine neuere Version. Wenn Sie nicht dazu in der Lage sind und Unterstützung benötigen, senden Sie uns bitte Ihr Feedback.

Wir würden uns über Ihr Feedback zu diesen neuen Seiten freuen.Sagen Sie uns, was Sie denken Wird in neuem Tab/Fenster geöffnet

Elsevier
Bei Elsevier publizieren

Text- und Data-Mining

Eine bessere Möglichkeit, Millionen von Artikeln und Büchern, die auf ScienceDirect veröffentlicht sind, herunterzuladen, zu filtern und zu verstehen. Alle Wissenschaftsjournals und Fachbücher von Elsevier ermöglichen Text und Data Mining (TDM). Weitere Informationen

Grundlagen zu TDM

Warum wissenschaftliche Artikel nutzen?

Veröffentlichte Artikel und Bücher enthalten bereits die Informationen, nach denen Sie suchen, und Text-Mining ist eine ideale Möglichkeit, um dieses Wissen freizuschalten. Artikel und Buchkapitel sind auch kuratiert und eine zuverlässige Informationsquelle. Darüber hinaus gibt es davon sehr viele in allen Disziplinen, und sie reichen bis zum ersten veröffentlichten Artikel zurück.

Erste Schritte

Greifen Sie zum Text-Mining zuerst auf den Inhalt zu, den Sie gewinnen möchten, laden Sie diesen herunter, und lassen Sie dann die spezifischen Text-Mining-Tools über diesen Inhalt laufen, um das Gesuchte zu finden. Die Programmierschnittstelle (API) zu den Volltextartikeln stellt eine leichte und einfache Methode dar, um Elsevier-Inhalte für nichtkommerzielle Text-Mining-Forschungszwecke in großen Mengen herunterzuladen. Sie erhalten Zugriff zur Volltext-API über das Entwickler-Portal. Die API umfasst Open-Access-Inhalte, aber Sie können OA-Inhalte auch über die DOI-Retrievalfunktionalität https://api.elsevier.com/content/article/doi/[DOI] gewinnen, über die Sie Ihr automatisiertes Skript laufen lassen.

Warum eine API verwenden?

Text-Mining erfordert eine Menge verschiedener Tools und Ressourcen, damit es funktioniert, und eine Menge qualifizierter Beiträge von den Forschenden. Um Ihnen den Einstieg zu erleichtern, haben wir APIs entwickelt, die das Herunterladen von Inhalten, die Sie üblicherweise auswerten möchten, in einer programmatischen Sprache wesentlich erleichtern. Die Nutzung einer API ermöglicht Folgendes:

  • Höhere Effizienz: Webcrawling ist eine ineffiziente Methode, um große Mengen an Inhalten zu gewinnen. Durch Nutzung unserer APIs können Sie schnell und einfach auf die benötigten Daten zugreifen und diese herunterladen.

  • Abruf Ihrer Daten in einem besseren Format: Elsevier konvertiert seine Artikel aus Wissenschaftsjournals und Buchkapiteln in XML, einem Format, das von den meisten Text-Minern bevorzugt wird.

  • Gewährleistung von Konsistenz: Bei mehr als 2 Millionen verfügbaren Artikeln und Buchkapiteln ist es für Miner bedeutend, wichtige Teile, die sie extrahieren möchten, zu identifizieren. Unsere API bietet ein konsistentes Format für alle verfügbaren Daten, sodass Sie Ihre TDM-Tools einfacher „drüberlaufen" lassen und testen können.

Möchten Sie verschiedene Herausgeber*innen in das Mining-Verfahren einbeziehen?

Wenn Sie mit dem Text-Mining beginnen, werden Sie zwangsläufig multiple Wissenschaftsjournals von verschiedenen Herausgeber*innen einbeziehen wollen. Dies stellt ein logistisches Problem dar. Damit das Text-Mining einfacher wird, unterstützten wir den TDM-Service von Crossref. Dieser freie Service stellt die Metadaten-API von Crossref zur Verfügung, die für den Zugriff auf die Volltexte der Inhalte genutzt wird, die von den Crossref DOIs über mehrere Webseiten der Herausgeber hinweg identifiziert werden.

Querverweis-Logo

Testen Sie Ihre TDM-Tools

Text-Mining hängt von der Nutzung der Tools für die Verarbeitung der natürlichen Sprache (Natural Language Processing, NLP) ab. Wir haben für die Entwicklung und Verfeinerung der NLP-Tools, die für die wissenschaftliche Literatur spezialisiert sind, einen Korpus an Artikeln für Open Access erstellt. Damit können Sie Ihre Tools testen und verfeinern.

Screenshot des Open-Access-Korpus von STM-Inhalten

Lernen und unterstützen

Wie Sie mittels Text-Mining Ihr nächstes Forschungsprojekt unterstützen können: